/opinion/blogs/columnists
Navigation

Une personne sur deux ne pourra comprendre ce blogue

Coup d'oeil sur cet article

D’entrée de jeu, le titre de ce billet peut sembler prétentieux, mais il souligne une réalité politique alarmante. Selon la Fondation pour l’alphabétisation : «près d'un Québécois sur deux (âgé de 16 à 65 ans) n’a pas les compétences nécessaires pour utiliser l’information afin de fonctionner pleinement au sein de la société et de l’économie (niveaux 1 et 2).» Ce n’est pas une nouvelle statistique, mais il est bon et nécessaire de le répéter : 49% des personnes québécoises ont des difficultés de lecture.

Ironiquement, nous parlons moins des statistiques liées aux problèmes de littératie statistique, proportion qui se retrouve également à près d’une personne sur deux. Ceci ne minimise en rien le problème d’alphabétisation, c’est probablement le contraire puisqu’il faut y ajouter les problèmes de lectures des statistiques. Dans nos sociétés contemporaines, il semble que la simple mention d’un chiffre pourrait répondre à la «Grande Question sur la vie, l’univers et le reste». Mais sommes-nous en mesure de comprendre la démarche statistique en dessous de ce chiffre? Sommes-nous en mesure de critiquer la démarche scientifique sur une autre base qu’un «feeling» politique?

Ainsi, pour répondre aux deux questions posées plus haut, prenons un exemple qui, admettons-le, est capillotracté, mais permet de comprendre la différence entre la mécanique statistique et la pratique scientifique de la statistique. L’exemple de la corrélation est emprunté à Tyler Vigen :

1

 

En analysant le graphique, nous pouvons stipuler que les dépenses américaines en science suivent exactement la même courbe que celle des suicides. En plus, nous constatons qu’il y a une corrélation très, mais très forte entre les deux variables (99.2%). Tout ça est vrai, les chiffres sont véridiques, le calcul est juste (c’est la mécanique de l’application d’un test statistique). Toutefois, est-ce que nous pouvons dire pour autant que si nous voulons diminuer le nombre de suicides aux États-Unis, nous n’avons qu’à couper dans les dépenses en science? (Ce qui est l’analyse statistique.) En somme, nous avons raison en ce qui concerne la mécanique de la statistique, mais nous avons tort au niveau de l’analyse des chiffres. Nous oublions trop rapidement que la statistique et la science économique sont des sciences sociales qui utilisent les chiffres comme principal langage. Et c’est à ce moment que les problèmes de littératie statistique entrent en ligne de compte. Si nous ne pouvons pas comprendre pourquoi et comment sont utilisés les chiffres, comment pouvons-nous faire la distinction entre la portion mécanique de la statistique et la portion science sociale des chiffres et analyses avancés?

Pire encore, la littératie statistique semble avoir généré deux positions antagoniques qui limitent les débats sociaux et scientifiques. D’un côté, il y a un certain culte voué aux chiffres. Culte qui pourrait (nous n’avons pas de chiffres ou de corrélation à l’appui, c’est plutôt une hypothèse) être engendré par un oubli conscient ou inconscient de considérer la portion science sociale de l’analyse statistique et économique et de croire que la vérité émane d’un chiffre. Ce qui pourrait donner des affirmations absurdes comme : «Il n’y a pas de 1% au Québec». Il va toujours y avoir un 1%, puisque le principe est de diviser, selon le revenu, la population en cent groupes égaux. Ou encore : « La moyenne des revenus au Québec nous montre que 50% des gens gagnent plus que 37 000$». C’est plutôt la médiane qui sépare en deux la distribution et au Québec, la médiane est d’environ 30 000$. De l’autre, lorsque des chiffres sont avancés et viennent contredire une position politique forte, nous avons tendances à dire : «Vos chiffres sont pas bons, vous avez fait du «cherry picking» : le réchauffement climatique est une invention des scientifiques pour avoir des subventions...». Alors que les chiffres nous montrent clairement que c’est la disparition des pirates qui a engendré le réchauffement climatique...

6 commentaire(s)

apouchkine dit :
30 mai 2014 à 11 h 50 min

Qossé que tu di???

Maxime Leroux dit :
30 mai 2014 à 13 h 30 min

À ce que je vois votre littératie statistique n'est pas super non plus...

"Toutefois, est-ce que nous pouvons dire pour autant que si nous voulons diminuer le nombre de suicides aux États-Unis, nous n’avons qu’à couper dans les dépenses en science? (Ce qui est l’analyse statistique.)"

La corrélation n'implique pas la causalité. Le calcul de cette corrélation n'implique pas du tout que "l'analyse statistique" montre qu'une baisse de dépenses en science diminuerait le nombre de suicide. Cette analyse statistique ne fait que montrer que les deux courbes évoluent de façon semblable (relation inverse ou non). Pour se rapprocher d'une relation de causalité il faudrait prendre en compte d'autres variables qui devraient en principe avoir un impact sur la première et isoler l'impact de la variable explicative d'intérêt sur la variable étudiée.

Au fait, vous devriez arrêter de mettre des graphiques montrant deux courbes évoluant d'une certaine façon pour ensuite dire qu'il ne semble pas y avoir de relation de cause à effet entre les deux (investissement et fiscalité dans une récente note). Vous ne faites qu'utiliser le problème de littératie statistique à votre avantage.

Jaoo Jon dit :
30 mai 2014 à 18 h 19 min

Maxime Leroux : c'était une blague de sa part, un exemple d'absurdité et non pas une vrai analyse de sa part!

(je viens de me relire et j'ai plein de fautes! aaaargghhhhh )

patrickbengio dit :
31 mai 2014 à 9 h 39 min

Maxime Leroux, relisez attentivement le passage... il ne confond pas pas corrélation et causalité, au contraire. Il affirme que pour bien distinguer corrélation et causalité il faut comprendre les phénomènes sociaux derrières les chiffres. '' En somme, nous avons raison en ce qui concerne la mécanique de la statistique, mais nous avons tort au niveau de l’analyse des chiffres. Nous oublions trop rapidement que la statistique et la science économique sont des sciences sociales qui utilisent les chiffres comme principal langage. Et c’est à ce moment que les problèmes de littératie statistique entrent en ligne de compte. Si nous ne pouvons pas comprendre pourquoi et comment sont utilisés les chiffres, comment pouvons-nous faire la distinction entre la portion mécanique de la statistique et la portion science sociale des chiffres et analyses avancés?''

Maxime Leroux dit :
31 mai 2014 à 17 h 16 min

patrickbengio, reste que l'auteur fait dire à une simple corrélation ce qu'elle ne dit en aucun cas.

"En plus, nous constatons qu’il y a une corrélation très, mais très forte entre les deux variables (99.2%). Tout ça est vrai, les chiffres sont véridiques, le calcul est juste (c’est la mécanique de l’application d’un test statistique). Toutefois, est-ce que nous pouvons dire pour autant que si nous voulons diminuer le nombre de suicides aux États-Unis, nous n’avons qu’à couper dans les dépenses en science? (Ce qui est l’analyse statistique.) "

La corrélation qu'il calcul entre les deux courbes pour ensuite dire que l'analyse statistique mène à la conclusion simpliste qu'en agissant sur l'une des variables l'autre sera affectée est justement un problème de compréhension statistique. Contrairement à ce qu'il affirme, "l'analyse statistique" (calculer une corrélation dans ce cas) ne dit pas du tout que pour réduire le suicide il faut réduire truc truc, elle ne fait dire que les deux bougent ensemble that's it.

J'ai plus l'impression que l'auteur tente de dire qu'au final, même la méthodologie la plus appropriée pour calculer l'effet d'une variable sur une autre (méthodes économétriques les plus poussées, genre qu'une très faible minorité comprendrait; je ne m'inclue pas dans ceux qui comprendraient) pourrait quand même être remise en question le plus simplement du monde en disant: "oui mais ça tss ça peut avoir un effet qu'on ne peut pas mesurer donc c'est pas si simple" ce qui assez commode pour l'IRIS puisque ses chercheurs peuvent donc simplement faire des graphiques et montrer l'absence de corrélation -ce qui est assez ironique vu l'exemple de l'auteur- et bien phraser le tout pour parfois pas mal dire que la littérature sur un sujet se trompe. Et comme l'IRIS est de plus en plus populaire, les médias rapportent par la suite que l'RIS à "démontré" quelque chose.

P.s. Pas toutes les notes de l'IRIS ont ce problème, celles sur l'environnement (budget carbone, etc) ou autres sujets qui ne nécessitent pas de statistiques par exemple.

patrickbengio dit :
31 mai 2014 à 19 h 13 min

''la méthodologie la plus appropriée pour calculer l’effet d’une variable sur une autre pourrait quand même être remise en question le plus simplement du monde''

Oui, pourrait être remise en question. Mais pas le plus simplement du monde. Dépasser une méthode ''économétrique'' pour privilégier tels ou tels aspects de la réalité humaine (ou écologique) ne veut pas dire que l'argument doit être simple ou simpliste. Par exemple, ''démontrer'' mathématiquement que tel investissement fera croitre le PIB pourrait être contredit par un argumentaire social ou écologique ou politique mais ça ne veut pas dire que cet argumentaire est simple!

En disant ''bien phraser le tout'' vous semblez indiquer que l'IRIS se sert abondamment de sophismes pour contourner un argumentaire très économétrique...