PROJET AUTOBLOG


blog'o'm0le

source: blog'o'm0le

⇐ retour index

Ces artistes YouTubeurs ..

samedi 16 novembre 2013 à 11:41

En ce moment, je découvre (via des amis, ou par sérendipité) pas mal d'artistes (musiciens) sur YouTube, qui méritent un petit peu plus de lumière sur eux. Ils sont tous différents et on tous leurs spécialités, mais tous sont pour moi des musiciens aguerris.

Andrew Huang

Le premier de ces messieurs, est ma dernière découverte en date.

Andrew est un musicien multi-facettes, auteur de plus de 240 vidéos à ce jour, qui n'hésite pas à relever des défis musicaux qu'on lui propose, comme :

http://www.youtube.com/watch?v=Z8-WtH4ujps

PV NOVA

Le second de ces messieurs, c'est un ami (merci Philou) qui me l'a fait découvrir. Il s'agit d'un artiste multi-instrumental, qui n'hésite pas à décortiquer différents styles musicaux - non sans humour -, afin de nous les expliquer en vidéos dans ces Experiences Musicales, au nombre de 19 au jour d'aujourd'hui :

http://www.youtube.com/watch?v=VMY_vc4nZAU

Smooth McGroove

Si ce nom de vous dit rien, je pense que ses musiques, elles, vous sont déjà arrivées au coin de l'oreille. Ce YouTubeur propose des interprétations a cappella de différents génériques de jeux vidéo ou musique de thèmes.

http://www.youtube.com/watch?v=PV06M-Gqxgg

 

JC Frog

Si ce nom de vous dit rien, c'est que vous n'avez sans doute pas assez roulé votre bille sur l'Internet :)

Le jeune homme - hum -, du haut de sa voix et de ses guitares, nous propose des parodies de chanson, dans le thème d'Internet, des libertés, ou tout simplement de coups de gueule politiques (dont je suis moins fan).

http://www.youtube.com/watch?v=eOqCulr2iF8

 

Bonus : Les chansons de Clément

Alors oui, c'est pas DU TOUT le même genre, mais c'est un ami, et ses chansons me font bien marrer :)

http://www.youtube.com/watch?v=HU3MaFxxOnU

 

Si t'en connais d'autres, n'hésites pas à m'en faire découvrir en commentaire :)

Nono's Songs : Beastie Boys - Don't Play no Game That I Can't Win

mardi 12 novembre 2013 à 16:49

Les Nono's Songs n'ont pas de but particulier si ce n'est de publier des musiques que j'apprécie.

Je ne donne aucune appréciation, je poste que des musiques, trouvées au détour du Net, ou d'un son/bruit que j'ai pu entendre quelques part ou avec quelqu'un. Ce n'est en aucun cas un signe de "nouveauté" ou un effet de mode quelconque.

Voici le clip non officiel de Beastie Boys qui nous propose Don't Play no Game That I Can't Win


Nono's Vrac 100

mardi 5 novembre 2013 à 14:28

100 Nono's Vrac ! 2 ans de blogging ! Une aventure qui suis son cours, au grée du temps, de la motivation et de l'envie aussi.

le m0le'o'Blog, c'est aussi son propre rythme de publication, sans obligation, juste à l'envie. Quelques projet mort-né, des projets qui mettent plus de temps à voir le jour, d'autres complètement stoppé.

En chiffre, voilà ce que ça représente environs, sur les (presque) 2 dernières années :

m0le_visunique_2ans

Et pour tout ça, je voulais aussi vous dire merci :) Tout simplement !

Place à la 100ième, qui je l’espère, n'est pas trop imbitable dans ce format.

 

 

5180073392_8494dd748f_b

liste de lien du 01/10/2013 au 31/10/2013 :

Photo

---------

Les Nono's Vrac sont généré depuis mon petit hook de l'application shaarli, que j'utilise ici : shaarli.m0le.net

Les trop nombreux défauts des sondages

dimanche 3 novembre 2013 à 16:35

L'inférence statistique sert régulièrement les sondeurs, qui peuvent grâce à elle s'abriter derrière la légitimité incontestable des sciences. Sauf que, comme souvent, la beauté de la théorie se heurte toujours aux difficultés de la pratique.

500px-Cretan-labyrinth-circular-disc.svg

Mais qu'est-ce que l'inférence statistique ? Pour rapidement résumer, elle consiste à induire, grâce à des résultats récoltés au hasard sur un échantillon d'une population, une règle générale de l'ensemble de cette population.

Si vous souhaitez, par exemple, connaître le nombre d'habitants de votre rue qui ont une voiture verte, vous allez descendre à heure fixe interroger les passants et leur demander :

Ensuite, vous allez répéter l'expérience autant de fois que nécessaire pour affiner vos données. Enfin, vous allez passer les données recueillies dans différentes moulinettes pour obtenir une estimation des possesseurs de voitures vertes chez les habitants de votre rue.

Les sondeurs sont très forts à ce petit jeu, notamment parce qu'ils ont des moyens d'enquête très poussés. Malgré tout, je crois que les sondages ont à peu près les mêmes défauts que les micro-trottoirs, à savoir :

Mais, là où on peut facilement hausser les épaules après l'écoute d'un micro-trottoir en se disant que quatre personnes ne peuvent pas exprimer une tendance générale, les sondages, par l'utilisation de statistiques très poussées, peuvent prendre le noble apparat de la science impartiale.

En réalité, les choses sont, comme toujours, un peu plus compliquées que dans la théorie.

Tout est dans la méthodo

Généralement, les médias s'empressent plus de livrer une interprétation hâtive d'un sondage qu'ils ont commandé plutôt que de se pencher un tant soit peu sur la méthodologie. Pourtant, celle-ci peut, à elle seule, expliquer les nombreux défauts des sondages.

Impossible hasard

Pour que l'inférence statistique ait un sens, il faut que les données que l'on traite aient été récoltées au hasard. Dans la pratique, ce hasard est quasiment impossible à atteindre.

Par exemple, si l'on souhaite contacter des gens au hasard dans la journée :

Certes, les sondeurs utilisent plus la "méthode des quotas" pour tenter d'harmoniser les sociologies des personnes interrogées : s'il y a dans le pays 15% de retraités, on va faire en sorte d'interroger 15% de retraités dans le sondage.

Mais même cette méthode peut révéler très vite des faiblesses : Mediapart relevait par exemple dans un sondage très orienté sur le voile à l'université des échantillons unanimes, ce qui est franchement très très suspect.

Impossibles questions neutres

On entre plus dans le domaine de la psychologie dans cette partie, avec les questions orientées. Ceux qui ont dû faire dans leur vie des questionnaires le savent, on a très vite fait d'induire une réponse directement dans une question.

Concrètement, demander "Pensez-vous payer trop d'impôts ?" n'induira pas du tout les mêmes réponses que "Êtes-vous prêts à payer des impôts pour avoir des services publics gratuits ?".

Impossible analyse

Nous allons retrouver notre comparaison avec le micro-trottoir avec cet aveu : il est souvent ardu, voire impossible, d'analyser les résultats d'un sondage.

Une première raison est que les gens ne peuvent être experts en tout, et qu'on puisse se demander quelle valeur accorder à leur réponse sur une question très pointue.

Par exemple, quand un institut révèle que 67% des Français jugent la suspension de l'écotaxe "justifiéee", il ne dit pas pourquoi ces derniers la trouvent "justifiée". Ahem...

Autre raison, les conclusions non détaillées. L'exemple suivant est formidable : 34% des Français se sentent proches des idées du FN, ça fait froid dans le dos, non ?

Pourtant, le curieux réalisera bien vite que dans le sondage, on ne sait pas à quelles idées précises les gens pensent (anti-immigration, anti-euro, protectionnisme), alors que le chiffre de 34% favorables va insidieusement marquer les esprits...

Autre raison encore, le sondage d'anticipation : par exemple, quand le Nouvel Obs nous dit que le FN est le premier parti en intentions de votes des prochaines européennes, il serait peut-être bien inspiré d'attendre qu'au moins les programmes des uns et des autres soient déclarés...

Impossible redressement

Autre joyeuseté des sondages, les redressement a posteriori. Illustrons-le avec un constat connu : on ne sait pas sonder le FN en France.

La raison principale vient du fait qu'une partie des électeurs de ce parti a des scrupules à se déclarer, et qu'on doit donc corriger après coup pour avoir la "vraie" proportion du Front National.

Mais là, on entre dans un domaine proche de la boule de cristal : quel.s pourcentage.s retirer à quel.s parti.s pour ensuite le.s redonner au FN et qu'est-ce qui le justifie ? Mystère...

Tout est dans les marges

Oublions tout ce que nous venons de dire et admettons que l'on ait réussi à avoir une méthodologie absolument parfaite pour effectuer un sondage.

Un institut souhaite se servir de cette prouesse pour répondre à une question absolument essentielle : combien de Français sont "vraiment vraiment pour", et combien sont "très très contre" ?

Pendant la première récolte de données, je vais être interrogé. 19 autres personnes, qui ont à peu près le même passé et profil que moi, sont catégoriques : ils sont "très très contre", tandis que les 980 autres sondés vont se prononcer "vraiment vraiment pour".

Sauf que les sondeurs, très appliqués, savent que ce résultat est sûrement faux, car, redressant régulièrement le pourcentage des Français "vraiment vraiment pour", ils obtiendraient un résultat unanime.

Ce graphique, très précis, est trop incertain pour être retenu.

Il faut donc répéter l'expérience jusqu'à obtenir une estimation fiable à 95%, autrement dit un sondage qui sera faux cinq fois sur 100. Sauf ce qu'on gagne en certitude, on le perd en précision.

Ce que l'on publie

Finalement, on trouve ce résultat éloquent dans la presse : 34% des Français sont "vraiment vraiment pour".

Incroyable, plus d'un tiers des Français "vraiment vraiment pour" ? Sauf qu'encore une fois, la réalité est un poil plus complexe.

Ce que l'on devrait publier

En réalité, l'imprécision que l'on récolte en répétant l'expérience s'appelle la (ou les) marge.s d'erreur, et pourrait se visualiser comme suit (en prenant cette fois des pourcentages) :

Il est du coup impossible de trancher dans cette marge : assurer qu'il n'y a que 15% ou au contraire affirmer qu'il y a 34% de Français "vraiment vraiment pour" serait une erreur, mais ce serait évidemment bien moins vendeur.

Les données sont-elles si objectives que ça ?

samedi 26 octobre 2013 à 17:45

Les données sont assez naturellement considérées comme objectives. Sauf que ce pétrole du début du XXIe siècle ne saurait être récolté sans un minimum de recul, sans quoi on pourra toujours affirmer quelque chose et son inverse à partir des mêmes chiffres.

big_data
Image :  Jeremykemp (CC - BY SA)

Dans leur passionnant Doing Data Science, Rachel Schutt et Cathy O'Neil affirment que les données ne sont pas objectives comme on le prétend assez naturellement. Elles mettent en garde contre ce mythe qui pourrait être largement conforté par l'avènement de Big Data.

Leur raisonnement, très clair et limpide, peut se résumer comme suit :

Les deux auteures illustrent les risques d'une confiance aveugle en Big Data avec un exemple concret : le recrutement de talents via des algorithmes spécialisé dans les données.

L'un des effets pervers de ce cas est le suivant : à compétences égales, l'algorithme vous dira de préférer un homme à une femme, parce que cette dernière aura mis plus de temps à gravir les échelons et aura perçu son travail d'une moins bonne manière.

Sauf que le problème vient plus d'une attitude sexiste dans le monde de l'entreprise que des données "objectives" rattachées à la candidate...

On pourrait multiplier les exemples, mais arrêtons-nous sur un intéressant paradoxe de la statistique descriptive : pouvoir affirmer une chose et son contraire, en ayant toujours raison.

Exemple : les demandeurs d'asile en Europe

La statistique descriptive est jugée être ultra simple pour les profanes pour une raison : on part d'une observation assidue des chiffres, sans trop de traitements alambiqués comme dans l'inférentielle.

Pourtant, on peut très souvent affirmer une chose et son contraire à partir des mêmes chiffres. Prenons par exemple le tableau page 12 de ce doc trouvé sur EuroStat, et qui concerne les demandeurs d'asile en Europe.

A partir de données très basiques (nombre de demandes total, nombre de demandes acceptées, nombre de demandes refusées), on va successivement affirmer que la France accueille beaucoup et peu de réfugiés. En ayant à chaque fois raison :-).

La France accueille beaucoup de réfugiés

La carte suivante montre le nombre de demandeurs d'asile acceptés par plusieurs pays d'Europe. On voit que la France, sans être le pays qui accueille le plus (elle est 10e), est plutôt dans le peloton de tête :

On peut donc affirmer que la France est plutôt une terre d'accueil de réfugiés, et avoir parfaitement raison.

La France accueille peu de réfugiés

La carte suivante montre à présent, à partir des mêmes chiffres, le pourcentage de réfugiés acceptés par rapport au nombre total de demandes.

En rouge se trouvent les pays qui acceptent moins de 50% des demandes, en vert ceux qui en acceptent plus de 50% :

On vient d'affirmer l'exact inverse de ce que l'on disait avant et on a encore une fois raison, car la France se classe alors que comme le 6e pays le moins accueillant d'Europe.

Comparer des carottes à des potirons

Les plus observateurs auront déjà remarqué un petit problème : l'Estonie se retrouve 2e pays le plus accueillant (plus de 66% de réfugiés acceptés) avec un total ridicule.

C'est d'autant plus frappant que ses 10 demandeurs d'asile ne représente qu'à peine 1% du total de la France, pourtant classé dans les pays moins accueillants (moins de 9% de demandes acceptées).

Sous prétexte d'utiliser des données "objectives", on peut affirmer une chose et son contraire en ayant toujours raison, et en croyant sincèrement avoir cloué le bec de l'autre partie.

Mais en réalité, c'est un peu comme si on comparait des carottes à des potirons en arguant le fait, recevable, que les deux sont des légumes de couleurs orange !

Assumer son angle

Beaucoup de visualisations de données que je vois ces derniers temps ne consistent qu'en une belle présentation de données, comme si elles pouvaient par enchantement livrer leurs secrets toutes seules.

Sans minimiser la performance technique et les efforts qu'il faut pour coder les plus belles, je trouve dommage de passer à côté d'une vraie analyse en assumant une part de subjectivité.

Dans le cas précédent, une seule des deux cartes ne livrerait qu'une partie du problème, elle le rendrait simpliste au lieu de le rendre simple, le but premier d'une visualisation de données.

Pour aller plus loin, on pourrait par exemple pointer le fait que ce sont les pays les plus peuplés d'Europe qui accueillent le plus de réfugiés, et ajouter qu'ils en refusent à la fois beaucoup parce qu'ils reçoivent un total conséquent de dossiers par rapport aux autres.

On pourrait également minimiser ces chiffres en les ramenant aux populations totales des pays et se rendre compte qu'ils sont franchement dérisoires, ou encore se pencher sur les critères de refus des dossiers.

Ce qu'une visualisation seule, aussi léchée soit-elle, ne pourra jamais faire.

Pour aller plus loin

La démonstration des cartes s'inspire en partie d'un chapitre du livre de Nicolas Gauvrit, Statistiques : méfiez-vous !.