Lire les graphiques en toute assurance
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Évaluer de manière critique des interprétations de données
- Utiliser une liste de contrôle pour évaluer la crédibilité et l’exactitude de graphiques
Prudence lors de l’interprétation
Même les graphiques créés avec des données sources précises et des choix de conception appropriés sont susceptibles d’être mal interprétés. Il est essentiel d’adopter une réflexion critique et de prendre le temps d’évaluer attentivement les interprétations des données présentées dans les graphiques et autres visualisations de données.
Lors de la lecture d’un graphique, prenez un moment pour déterminer s’il manque des informations essentielles. Si vous êtes en mesure de creuser dans les données source, vous trouverez parfois des informations pertinentes qui ne sont pas visibles dans le graphique. Des informations cachées ou manquantes peuvent fausser la façon dont vous percevez les données présentées, que ces omissions soient intentionnelles ou non.
Réflexion sur les comparaisons
« Les représentations visuelles, pour aider à la réflexion, devraient montrer des comparaisons. » – Edward Tufte, Beautiful Evidence
Comme vous l’avez appris dans la première unité, les graphiques peuvent vous aider à prendre de meilleures décisions. Ils vous aident à faire des comparaisons éclairées et à répondre à des questions pertinentes pour prendre de bonnes décisions. Au-delà de la détermination de la crédibilité des données d’un graphique, il est également important de considérer son contexte et de comprendre les comparaisons qui y sont faites. Même si les données d’un graphique sont dignes de confiance, vous pourriez arriver à des conclusions incorrectes si vous ne vous arrêtez pas pour vous assurer que le graphique répond d’abord aux bonnes questions.
Perspective élargie
Les graphiques qui ne montrent pas tout le contexte d’un scénario constituent un autre écueil courant.
Par exemple, dans « How Charts Lie », Alberto Cairo analyse le graphique à barres suivant. La conclusion suggérée est que le taux de chômage augmente.
Cependant, si vous regardez ces deux points de données dans le contexte de l’année entière ou même sur plusieurs années, une tendance différente émerge. Bien que le taux de chômage ait augmenté entre juillet 2017 et août 2017, il diminue en fait avec le temps, des fluctuations se produisant d’un mois à l’autre. La réalité est donc tout autre.
Marge d’erreur et d’incertitude
Rien n’est parfait, y compris les données. Vous pouvez parfois être surpris par les résultats des élections lorsque les sondages ont donné l’avantage au perdant.
Quand vous interprétez un sondage, recherchez la marge d’erreur ou l’intervalle de confiance. Dans cet exemple, la marge d’erreur était de +/- 3 points de pourcentage. Qu’est-ce que cela signifie ?
La marge d’erreur ne décrit pas les « erreurs » dans l’étude, mais plutôt le degré d’incertitude de l’estimation. Habituellement, une estimation correspond au point médian d’une plage. Imaginez que vous essayez de mesurer la longueur d’un chien heureux et donc très agité. Plus vous essayez de le mesurer, plus vous serez sûr de savoir combien il mesure. Tout ce que vous pouvez dire avec certitude, cependant, c’est que ce caniche mesure environ 71 cm de long, plus ou moins 2 cm.
Dans cet exemple, vous diriez : « Compte tenu de nos méthodes de collecte et de mesure, nous sommes sûrs à 95 % que la valeur pour Rick Saccone que nous essayons d’estimer se situe entre 42 et 48, soit 3 points de plus ou de moins que 45 et que la valeur pour Conor Lamb se situe entre 39 et 45, soit 3 points de plus ou de moins que 42 ».
Lorsque les statisticiens décrivent la marge d’erreur, ils parlent d’un certain niveau de confiance ou d’incertitude. Les statistiques permettent d’être sûr que si on menait l’étude plusieurs fois avec les mêmes méthodes, 95 % du temps, l’estimation tomberait dans la marge d’erreur. Dans cet exemple, les zones en dégradé qui représentent l’intervalle de confiance de +/- 3 points autour des estimations ponctuelles se chevauchent, nous ne pouvons donc pas conclure que l’un ou l’autre des candidats gagnerait à partir de ces résultats. De plus, si l’on considère les 13 % d’électeurs indécis dans le sondage, il n’est pas surprenant que l’un ou l’autre des candidats remporte la course.
Si vous examinez le sondage et considérez la marge d’erreur, vous découvrez que le résultat final était bien dans la marge d’erreur. La marge d’erreur est le degré d’incertitude qu’il pourrait y avoir dans l’ensemble de données.
Par exemple, un sondage peut indiquer que 60 % des personnes interrogées préfèrent la marque A à la marque B. Si la marge d’erreur est de 2 %, le pourcentage réel de personnes interrogées qui préfèrent la marque A se situe entre 58 et 62 %.
De nombreuses sources citent la marge d’erreur calculée pour l’ensemble de données. Si la marge d’erreur n’est pas clairement indiquée, gardez à l’esprit qu’il y a toujours un degré d’incertitude à prendre en compte.
Pour en savoir plus sur les marges d’erreur et d’incertitude, consultez le module Variations relatives aux comparaisons de données.
Différence entre corrélation et causalité
La corrélation montre seulement à quel point les variables sont liées. Elle n’explique pas les causes de ce rapport.
Par exemple, les ventes de glaces sont en corrélation avec le nombre de lunettes de soleil vendues. Les gens achètent-ils de la glace car ils ont acheté des lunettes de soleil, ou vice versa ? Non. La cause des deux achats est clairement autre. Dans ce cas, ce peut être le beau temps.
Il est important d’essayer d’éviter d’émettre des hypothèses et de tirer des conclusions hâtives en se basant uniquement sur la corrélation. Demandez-vous toujours s’il pourrait y avoir d’autres variables cachées qui ont un impact sur ce qui est présenté par les données.
Étude des légendes et interprétations
Faites attention au langage utilisé pour décrire et annoter un graphique. Pensez notamment à ce qui suit :
- Le titre et autres éléments textuels décrivent-ils correctement le graphique ?
- Le graphique est-il correctement annoté ?
- Les mots sont-ils chargés émotionnellement d’une manière qui influence votre perception des données ?
Questionnement continu
Lorsque vous lisez un graphique et les interprétations ou représentations visuelles de données faites par une autre personne, posez-vous toujours des questions. Si vous voyez quelque chose d’inexplicable, demandez-vous pourquoi et intéressez-vous aux données. Vous serez étonné de ce que vous pouvez apprendre et de la façon dont vous pouvez aider votre entourage en restant curieux et en posant des questions intelligentes.
Liste de contrôle SCAM
Pour vous guider dans votre examen et votre analyse approfondie des graphiques, utilisez la liste de contrôle pratique appelée SCAM. SCAM correspond aux initiales des mots suivants : Sources, Charts (graphiques), Axes et Messages.
Liste de contrôle SCAM
Utilisez la liste de contrôle pour vous poser les questions suivantes lors de l’examen de graphiques :
Liste de contrôle SCAM | |
---|---|
Source |
|
Graphique |
|
Axes du graphique |
|
Message (ou interprétation) |
|
Discussions au sujet des données
Comme vous pouvez maintenant le voir, la lecture de graphiques n’est pas aussi simple et directe qu’il n’y paraît. Bien qu’il soit important d’avoir un esprit critique et de se poser des questions intelligentes, il peut être extrêmement utile d’analyser les données avec d’autres personnes. Discutez de vos interprétations et critiques des graphiques avec vos pairs et amis. Vous constaterez que vous pouvez vous entraider pour devenir de meilleurs lecteurs de graphiques et de données.
Conclusion
Vous pouvez tous contribuer à améliorer la façon dont les décisions sont prises chaque fois que vous lisez avec précision des graphiques ou signalez des graphiques trompeurs. Avec votre esprit critique, les connaissances acquises et les outils que vous venez de découvrir, vous êtes en mesure de mieux analyser et interpréter les graphiques et de bénéficier d’une meilleure compréhension des données et des informations. Maintenant, partez à la conquête des graphiques !
Ressources
- Trailhead : Variations relatives aux comparaisons de données
- Trailhead : Corrélation et régression
- Ouvrage : Edward Tufte (2006) : Beautiful Evidence. Graphics Press
- Ouvrage : Alberto Cairo (2016) : The Truthful Art: Data, Charts, and Maps for Communication. New Riders Publishing
- Ouvrage : Alberto Cairo (2020) : How Charts Lie: Getting Smarter about Visual Information. W.W. Norton & Company
- Article scientifique : Leo Yu-Hu Lo, et al (2022) : Misinformed by Visualization: What Do We Learn from Misinformative Visualizations? Wiley & Sons