Exploration des données en posant des questions pertinentes
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Poser des questions pertinentes
- Identifier les aptitudes et les attitudes nécessaires pour utiliser efficacement les données
Introduction
Chaque jour apporte des millions d’occasions d’améliorer nos vies en utilisant plus efficacement les données. Vous souhaitez mieux comprendre la recherche médicale, les tendances en matière d’éducation, l’efficacité des processus industriels, les soins apportés aux patients ou les dépenses publiques ? Il n’y a pas de limite aux opportunités qui s’offrent à vous.
Pour mieux utiliser les données, intéressons-nous à cette partie essentielle de la data literacy : l’exploration. Pour bien explorer les données, il est important de poser des questions pertinentes. Par exemple, si vous aimez les chiens et que vous vous souciez de votre santé, la question à se poser en premier est : « Avoir un chien est-il bon pour la santé ? »
Maintenant, comparez cette question à la suivante : « Parmi les personnes souffrant de maladies chroniques aux États-Unis, quelles sont les différences d’état de santé entre celles qui ont un chien et celles qui n’en ont pas ? »
La première question est très large et il n’y a aucun critère spécifique pour désigner ce qui est « bon » pour la santé d’une personne. La deuxième question est beaucoup plus précise. Elle emploie des termes clairs et restreint le champ d’analyse à une population spécifique. Il est plus facile d’explorer les données qui répondent à la deuxième question.
Recherche des causes
C’est bien souvent en cherchant la réponse à une question que d’autres interrogations surgissent. Répondre à la question d’origine ne suffit généralement pas. Dans notre exemple, si l’état de santé des personnes atteintes de maladies chroniques aux États-Unis varie en fonction du fait qu’elles possèdent ou non un chien, la question à se poser ensuite est : « Pourquoi ? »
Selon la technique des 5 pourquoi, mise au point par le fondateur de Toyota Motors, Sakichi Toyoda, lorsqu’un problème est identifié, il faut poser la question Pourquoi ?, puis continuer à demander pourquoi à chaque réponse ou explication donnée. Bien que l’objectif principal de cette technique soit de déterminer la cause profonde d’un défaut, nous pouvons également l’employer pour analyser les causes de chaque résultat obtenu.
Stephen Few, célèbre expert en technologies de l’information, a identifié une liste de caractéristiques, qu’il appelle aptitudes et attitudes, permettant de travailler efficacement avec les données. Ces caractéristiques vous aident également à poser des questions plus pertinentes.
Aptitudes et attitudes permettant de poser des questions pertinentes
En parcourant les descriptions des aptitudes et attitudes suivantes, adaptées avec l’autorisation de Stephen Few à partir de son ouvrage Now You See It : An Introduction to Visual Data Sensemaking, réfléchissez à votre propre expérience. Parmi ces caractéristiques, lesquelles possédez-vous ? Lesquelles souhaitez-vous développer ? Dans quelle mesure vos caractéristiques actuelles vous aident-elles à poser des questions pertinentes ? En quoi l’acquisition de nouvelles caractéristiques pourrait-elle vous aider à poser des questions plus pertinentes ?
Exemples illustrant l’importance des questions pertinentes
Florence Nightingale et John Snow possédaient bon nombre des caractéristiques énumérées ci-dessus, et ont su poser des questions pertinentes pour résoudre des problématiques. En découvrant l’histoire de ces deux personnes, réfléchissez aux aptitudes et attitudes dont elles ont fait preuve dans le cadre de leur travail.
Par exemple, ces deux personnes ont toutes deux fait preuve d’intérêt et de curiosité. Florence Nightingale avait des compétences en analyse de données et John Snow a repéré des tendances. Pouvez-vous penser à d’autres exemples de la façon dont Florence Nightingale et John Snow ont fait preuve d’aptitudes et d’attitudes efficaces en matière d’analyse de données ?
Florence Nightingale
En 1854, Florence Nightingale dirigeait une équipe de 38 infirmières en charge de soigner les soldats ayant été blessés pendant la guerre de Crimée. Pourquoi autant de soldats mouraient-ils, et comment prévenir ces décès ?
Elle a découvert qu’ils décédaient principalement suite à des maladies évitables dues à des conditions sanitaires déplorables, et non en raison de leurs blessures de guerre. Elle a lancé une série de réformes du système de soins qui ont permis de réduire fortement les décès, et a répertorié les résultats obtenus sur deux années.
Elle a par la suite utilisé des graphiques, comme un diagramme à aires polaire (exemple ci-dessous) pour présenter à un public non scientifique la nécessité de réformer en profondeur le système de soins. Dans son diagramme, chaque secteur représente un mois et la surface du secteur indique le nombre de soldats décédés ce mois-là. Différentes couleurs sont utilisées pour représenter les différentes causes de décès.
Le récit et les images présentés ici ont été adaptés de la page consacrée à Florence Nightingale sur le site Web du Musée des sciences du Royaume-Uni : L’œuvre de Florence Nightingale.
John Snow
Le choléra est une maladie intestinale aiguë qui a causé de nombreux décès lors d’une épidémie ayant eu lieu à Londres entre 1831 et 1832, puis à nouveau entre 1848 et 1849. À cette époque, bon nombre de personnes croyaient que cette épidémie était due à la mauvaise qualité de l’air, causée par la décomposition de matières organiques. Elles pensaient pouvoir éradiquer cette maladie grâce à des mesures préventives, comme le récurage et le décapage, et n’ont donc pas suivi l’approche scientifique de la microbiologie. John Snow, un médecin britannique, a remis en question cette théorie des miasmes, ou « mauvais air ».
Il a posé la problématique suivante : « Le choléra ne pourrait-il pas être dû à une bactérie ? ». John Snow soutenait que le choléra était causé par une bactérie qui n’avait pas encore été identifiée. Il avançait que cette bactérie se propageait par le biais de l’eau potable. Pour mettre à l’épreuve son idée selon laquelle le choléra se transmettait par l’eau plutôt que l’air de mauvaise qualité, il a demandé au service de l’état civil de lui transmettre les données concernant les décès attribués à l’épidémie de choléra à Londres.
Il a placé les décès signalés sous forme de points sur une carte de la ville, puis y a ajouté les emplacements des fontaines alimentant la ville en eau. Il a fini par déterminer que les personnes victimes du choléra dont il avait cartographié le décès avaient consommé de l’eau provenant de la pompe de Broad Street.
L’histoire de John Snow est un exemple intéressant de la résolution d’une problématique sanitaire par l’utilisation de méthodes statistiques sans connaissance de la cause biologique sous-jacente. Il ne savait pas quelles étaient les propriétés biologiques spécifiques de la bactérie du choléra, mais il a tout de même découvert la source du problème.
Le récit et les images présentés ici ont été adaptés de la page consacrée à John Snow sur le site Web du département d’épidémiologie de l’UCLA : l’œuvre de John Snow.
Ressources
- Blog Tableau : Révélez des informations exploitables cachées : la quête inexorable du « pourquoi »
- Ouvrage : Few, S. (2021). Now You See It: An Introduction to Visual Data Sensemaking (2e éd.). Analytics Press, 29-32.
- Site Web : Florence Nightingale: The Pioneer Statistician
- Site Web : Father of Modern Epidemiology
Vous comprenez maintenant la relation entre le fait de poser des questions pertinentes et l’exploration des données. Pour travailler efficacement avec les données, concentrez-vous sur les aptitudes et les attitudes qui vous aident à poser les bonnes questions.