Inférences
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Décrire l’utilité des tests d’hypothèses
- Définir l’utilisation et les limites des valeurs p dans le cadre des tests d’hypothèses
Introduction
Dans l’unité précédente, vous avez pu vous familiariser avec les concepts relatifs à l’utilisation de la variation et de la distribution normale pour explorer des phénomènes, interpréter des situations et communiquer grâce aux données. Vous avez également étudié les intervalles de confiance, qui constituent un exemple d’inférence.
Dans cette unité, vous allez en apprendre davantage sur l’inférence. L’inférence désigne le fait de tirer des conclusions au sujet d’une population à partir d’un échantillon de données. Il s’agit d’un procédé utile, car, dans la plupart des situations, il n’est pas envisageable d’obtenir toutes les mesures concernant une population donnée.
En d’autres termes, lorsque nous disposons de données concernant l’ensemble des membres d’une population, il n’est pas nécessaire d’effectuer des inférences au sujet des différences entre les groupes constituant cette population. Lorsqu’il n’est pas possible de collecter des données sur chaque élément ou membre d’une population, nous collectons des données à partir d’échantillons, que nous utilisons pour effectuer des inférences.
Dans son ouvrage Avoiding Data Pitfalls, Ben Jones, fondateur et président de Data Literacy, LLC, et membre de la communauté Tableau, souligne que le recensement aux États-Unis n’a lieu que tous les 10 ans, en raison de la difficulté et du coût pour décompter « chaque personne dans chaque structure résidentielle du pays, sans parler du fait qu’une telle entreprise est forcément source d’erreur et de biais ». La plupart des organisations ne disposant pas des ressources humaines et financières du gouvernement fédéral des États-Unis, elles prennent leurs décisions en fonction d’inférences effectuées à partir d’échantillons de données.
Tests d’hypothèses
De nombreuses organisations de différents types utilisent les tests d’hypothèses. Certaines entreprises, par exemple, utilisent les tests d’hypothèses dans le cadre du contrôle qualité, afin de déterminer si un produit répond à une norme spécifique, ou s’en servent pour comparer de nouvelles méthodes de vente aux anciennes.
La recherche médicale fonde aussi souvent ses inférences sur des échantillons de données. Imaginons qu’une entreprise du secteur pharmaceutique mette au point un nouveau médicament. Pour déterminer s’il est efficace, elle doit mener une étude expérimentale. Étant donné qu’il n’est pas possible de tester le médicament sur toutes les personnes souffrant de la maladie qu’il combat, des tests sont effectués sur un sous-ensemble de malades choisi de manière aléatoire.
Au sein de cet échantillon, le groupe expérimental reçoit le médicament, tandis que le groupe de contrôle reçoit un placebo. Les groupes sont déterminés aléatoirement afin de pouvoir attribuer les différences observées dans les résultats aux effets du médicament.
Les deux groupes sont soumis à des tests et différentes mesures sont effectuées. Lorsque des mesures différentes sont observées entre les deux groupes, les chercheurs doivent fixer le seuil à partir duquel les différences observées entre le groupe expérimental et le groupe de contrôle doivent être considérées comme significatives.
Les chercheurs collectent des données à partir des groupes échantillons et effectuent des tests statistiques. Ensuite, ils s’appuient sur les résultats des tests pour déterminer si les différences entre les groupes sont significatives. Une fois qu’ils disposent des données, ils doivent effectuer des inférences sur la population entière (à savoir, la totalité des personnes souffrant de la maladie). C’est ce qu’on appelle le test d’hypothèses.
Les tests d’hypothèses commencent par l’élaboration d’hypothèses nulles et alternatives.
- L’hypothèse nulle déclare que le médicament n’aura aucun effet sur la santé. Elle suppose que l’état de santé des personnes recevant le médicament sera identique à celui de celles qui ne le reçoivent pas.
- L’hypothèse alternative part du principe qu’une différence sera observée. Elle suppose que l’état de santé des personnes recevant le médicament sera meilleur que celui de celles qui ne le reçoivent pas.
Les tests d’hypothèses commencent par considérer que l’hypothèse nulle est vraie. Ensuite, les tests cherchent à déterminer la probabilité d’observer des résultats au moins aussi bons lors de l’expérimentation, en considérant que l’hypothèse nulle est vraie.
En d’autres termes, s’il y a une probabilité faible d’observer des résultats équivalents alors que l’hypothèse nulle est vraie, alors l’hypothèse alternative est probablement vraie. S’il y a une probabilité élevée que les résultats soient aussi bons alors que l’hypothèse nulle est vraie, alors l’hypothèse alternative est rejetée et les chercheurs doivent trouver une autre solution.
Les tests d’hypothèses tiennent compte du nombre d’échantillons, de l’importance de la différence mesurée et du nombre de variations observées dans chaque groupe.
Le résultat numérique d’un test d’hypothèses (la probabilité que l’hypothèse nulle soit vraie) est appelé valeur p. Une valeur p permet de déterminer s’il est nécessaire de rejeter l’hypothèse nulle. Dans ce cas, le rejet de l’hypothèse nulle signifie que le médicament serait efficace sur l’ensemble de la population. Une valeur p faible indique qu’il y a suffisamment d’éléments permettant de rejeter l’hypothèse nulle et de soutenir l’hypothèse alternative.
Cependant, il est important de souligner que la valeur p elle-même ne prouve ni ne réfute rien. Une valeur p élevée ne prouve pas que l’hypothèse nulle est valide, pas plus qu’une valeur p faible ne prouve qu’elle n’est pas valide. C’est pourquoi il faut faire preuve de prudence avec les valeurs p.
Comment utiliser les valeurs p
À une certaine époque, les chercheurs étaient formés de manière à utiliser une valeur p de 0,05 comme valeur déterminante. En d’autres termes, une valeur p inférieure ou égale à 0,05 était considérée comme suffisante pour rejeter l’hypothèse nulle. Le seuil de 0,05 correspond aux extrémités d’une courbe de distribution normale. Gardez à l’esprit que les intervalles de confiance de 95 % correspondent à l’aire d’une courbe de distribution normale située dans un écart type allant de -2 à +2 autour de la moyenne. Le seuil de 0,05 (ou 5 %) correspond à l’aire située en dehors de l’écart type allant de -2 à +2 autour de la moyenne.
Cette approche a changé ces dernières années. Dans le cadre des tests de médicaments, si un seuil plus faible était utilisé (ce qui amènerait l’intervalle de confiance au-dessus de 95 %), il serait plus difficile de rejeter l’hypothèse nulle.
Pour toutes ces raisons, entre autres, l’American Statistical Association a déclaré officiellement en 2016 que « la valeur p en elle-même ne constitue pas une mesure efficace de la validité d’un modèle ou d’une hypothèse ».
Les valeurs p peuvent également être falsifiées par le type de données analysé.
Pour découvrir un exemple de falsification des valeurs p, reportez-vous à cet exercice interactif de manipulation de la valeur p, Hack Your Way to Scientific Glory, sur FiveThirtyEight, un site d’agrégation analysant les sondages d’opinion sur la politique, l’économie et le sport.
Vous en savez maintenant davantage sur les inférences, les tests d’hypothèses et les valeurs p. Le fait de comprendre ces concepts peut vous aider à mesurer, décrire, résumer et comparer vos données afin d’en tirer des conclusions vous permettant de prendre des décisions éclairées.
Ressources
- Article : The ASA Statement On P-Values: Context, Process, And Purpose. The American Statistician, 2016.
- Ouvrage : Cairo, Alberto. The Truthful Art: Data, Charts, and Maps for Communication. Indianapolis, Indiana : New Riders, 2016
- Article de blog : Explaining visualizations in The New York Times, NPR, and the BBC. The Functional Art (blog), 2019. Lien du blog. Accéder au site professionnel d’Alberto Cairo
- Article : Those Hurricane Maps Don’t Mean What You Think They Mean. The New York Times, 2019. Lien vers l’article
- Article : Hack Your Way to Scientific Glory. FiveThirtyEight. ABC News Internet Ventures.
- Ouvrage : Jones, Ben. Avoiding Data Pitfalls: How to Steer Clear of Common Blunders When Working with Data and Presenting Analysis and Visualizations. Hoboken, New Jersey : John Wiley & Sons, 2019
- Site Web : Data Literacy par Ben Jones
- Ouvrage : Lane, David M. Introduction to Statistics. Online Statistics Education: An Interactive Multimedia Course of Study, 2020