PROJET AUTOBLOG


Shaarli - Les discussions de Shaarli

Archivé

Site original : Shaarli - Les discussions de Shaarli du 23/07/2013

⇐ retour index

Des paradoxes statistiques plus répandus qu’on ne croit « m0le'o'blog

jeudi 20 août 2015 à 15:19
Choses vues, sur le web et ailleurs
Exemple de piège statistique : le paradoxe de Simpson.
D'oh ! (désolé, je n'ai pas pu m'en empêcher)

Qu'est ce que le paradoxe de Simpson (ou Yule-Simpson, mais c'est moins rigolo) ? C'est lorsque les succès d'un groupe s'inversent une fois ces derniers combinés. (Cf. https://fr.wikipedia.org/wiki/Paradoxe_de_Simpson)

=> "Avant de se creuser la tête pour imaginer d'éventuelles causes [...] le bon réflexe serait peut-être d'essayer de voir si une segmentation des résultats existe." : quand on observe le détail d'un test/sondage, on parle en valeurs absolues, plus en pourcentage. Du coup, les échantillons comparés deviennent inégaux, d'où le paradoxe.

"Quelques conseils pour détecter ces paradoxes :
=> ne jamais s'arrêter aux pourcentages dans les comparaisons, mais prendre également les chiffres bruts, quitte à les demander directement à la source
=> si des échantillons de taille très différente apparaissent, essayer de les segmenter autour d'une variable de confusion (la taille des calculs pour le traitement médical, l'âge des répondants pour l'étude sur les malaises cardiaques, etc...) pour vérifier si oui ou non on est face à un paradoxe de Simpson
=> ne jamais s'interdire une contextualisation des données que l'on traite"
(Permalink)