Ziehen von Rückschlüssen
Lernziele
Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:
- Beschreiben des Zwecks der Hypothesenprüfung
- Definieren der Anwendung und Beschränkungen von p-Werten für die Hypothesenprüfung
Einleitung
In der vorherigen Lektion haben Sie Konzepte zur Verwendung von Varianz und Normalverteilung kennengelernt, um Daten zu erkunden, zu interpretieren und mit ihnen zu kommunizieren. Sie haben sich auch mit Konfidenzintervallen als Beispiel für Folgerung beschäftigt.
In dieser Lektion erfahren Sie mehr über Folgerung. Unter Folgerung wird das Ziehen von Rückschlüssen bezüglich einer Grundgesamtheit auf Grundlage einer Stichprobe der Daten verstanden. Das ist praktisch, weil es in den meisten Fällen nicht möglich ist, alle Messwerte in einer bestimmten Grundgesamtheit zu erheben.
Mit anderen Worten: Wenn wir Daten für alle Mitglieder einer Grundgesamtheit haben, sind keine Folgerungen auf die Abweichung zwischen Gruppen innerhalb dieser Grundgesamtheit erforderlich. Wenn es nicht möglich ist, Daten für jedes einzelne Mitglied einer Grundgesamtheit zu erheben, sammeln wir Daten aus Stichproben und ziehen dann Folgerungen.
In seinem Buch "Avoiding Data Pitfalls" weist der Autor Ben Jones, Gründer und CEO von Data Literacy, LLC, und Mitglied der Tableau Community, darauf hin, dass die Volkszählung in den Vereinigten Staaten nur einmal im Jahrzehnt stattfindet, weil es teuer und kompliziert ist, "jede einzelne Person in jeder einzelnen Wohnstruktur im ganzen Land zu zählen, und ein solches Unterfangen nicht frei von Verzerrung und Fehlern ist." Da die meisten Organisationen jedoch nicht über die gleichen finanziellen oder personellen Ressourcen wie die US-Bundesregierung verfügen, stützen sie ihre Entscheidungen auf Folgerungen, die sie aus der Betrachtung von Datenstichproben ziehen.
Hypothesenprüfung
Viele Arten von Organisationen arbeiten mit Hypothesenprüfung. Einige Unternehmen nutzen beispielsweise die Hypothesenprüfung zur Qualitätskontrolle, um festzustellen, ob ein bestimmtes Produkt einer Norm entspricht, oder um neue und alte Vertriebsmethoden zu vergleichen.
Auch die medizinische Forschung lässt Folgerungen häufig auf Stichprobendaten basieren. Stellen Sie sich vor, ein Biotechnologieunternehmen stellt ein neues Medikament zur Bekämpfung einer Krankheit her. Um festzustellen, ob das Medikament wirkt, muss ein kontrolliertes Experiment durchgeführt werden. Da es nicht möglich ist, an allen Erkrankten zu experimentieren, wird eine Teilmenge von Erkrankten nach dem Zufallsprinzip für Tests ausgewählt.
Innerhalb dieser Stichprobe erhält die Versuchsgruppe die Behandlung und die Kontrollgruppe ein Placebo anstelle des Medikaments. Die Gruppen werden nach dem Zufallsprinzip zusammengestellt, sodass jeder Unterschied in den Behandlungsergebnissen auf die Forschungsmaßnahme zurückgeführt werden kann.
Für beide Gruppen werden Tests durchgeführt und Messungen vorgenommen. Beim Testen auf Unterschiede zwischen den beiden Gruppen entscheiden die Forschenden, wie weit die Ergebnisse auseinander liegen müssen, um festzustellen, ob die Behandlungsergebnisse der Versuchsgruppe und der Kontrollgruppe signifikant unterschiedlich sind.
Die Forschenden sammeln Daten von den Stichprobengruppen und führen entsprechende statistische Tests durch. Anschließend entscheiden die Forschenden anhand dieser Testergebnisse, ob es eine signifikante Abweichung zwischen den Gruppen gibt. Sobald die Daten vorliegen, müssen die Forschenden Folgerungen auf die Grundgesamtheit ziehen, d. h. auf jede einzelne erkrankte Person. Dies wird als Hypothesenprüfung bezeichnet.
Die Hypothesenprüfung beginnt mit der Aufstellung von Null- und Alternativhypothese.
- Die Nullhypothese besagt, dass das Medikament keinen Einfluss auf die Behandlungsergebnisse hat. Sie geht davon aus, dass sich die Ergebnisse derjenigen, die die Behandlung erhalten, nicht von denen derjenigen unterscheiden, die sie nicht erhalten.
- Die Alternativhypothese besagt, dass es einen Unterschied bei den Behandlungsergebnissen geben wird. Sie besagt, dass diejenigen, die die Medikation erhalten, bessere Behandlungsergebnisse aufweisen werden als diejenigen, die sie nicht erhalten.
Hypothesenprüfungen beginnen mit der Annahme, dass die Nullhypothese wahr ist. Die Prüfungen sollen dann feststellen, wie wahrscheinlich es ist, dass die Ergebnisse mindestens so ausgeprägt sind wie im Experiment, vorausgesetzt, die Nullhypothese ist wahr.
Mit anderen Worten: Wenn die Wahrscheinlichkeit gering ist, dass die Ergebnisse genauso ausgeprägt sind, wenn die Nullhypothese wahr ist, dann gibt es Beweise zugunsten der Alternativhypothese. Falls die Wahrscheinlichkeit groß ist, dass die Ergebnisse genauso ausgeprägt sind, wenn die Nullhypothese wahr ist, dann gibt es nicht genügend Beweise zugunsten der Alternativhypothese, und die Forschenden sollten es mit einer neuen Formel erneut versuchen.
Bei Hypothesenprüfungen werden die Anzahl der Stichproben, die Größe des gemessenen Unterschieds und der Umfang der in jeder Gruppe beobachteten Variation berücksichtigt.
Das numerische Ergebnis einer Hypothesenprüfung (die Wahrscheinlichkeit, dass die Nullhypothese wahr ist) wird als p-Wert bezeichnet. Ein p-Wert hilft bei der Entscheidung, ob die Nullhypothese verworfen werden soll. In diesem Fall bedeutet das Verwerfen der Nullhypothese, dass die Behandlung in der größeren Grundgesamtheit funktionieren würde. Ein kleiner p-Wert bedeutet, dass es genügend Belege zur Ablehnung der Nullhypothese und zur Unterstützung der Alternativhypothese gibt.
Es ist jedoch wichtig anzumerken, dass der p-Wert weder etwas beweist noch widerlegt. Ein hoher p-Wert beweist nicht, dass die Nullhypothese gültig ist, und ein niedriger p-Wert beweist nicht, dass sie ungültig ist. Aus diesem Grund müssen p-Werte mit Vorsicht betrachtet werden.
Informationen zur Verwendung der p-Werte
Es gab eine Zeit, in der Forschende darauf geschult wurden, den p-Wert 0,05 als Toleranzgrenze zu verwenden. Mit anderen Worten: Ein p-Wert von maximal 0,05 galt als ausreichend, um die Nullhypothese zu verwerfen. Die Toleranzgrenze 0,05 entspricht den Schwänzen der Normalverteilung. Zur Erinnerung: Konfidenzintervalle von 95 % entsprechen dem Bereich der Normalverteilung, der innerhalb von -2 oder +2 Standardabweichungen vom Mittelwert liegt. Die Toleranzgrenze 0,05 (oder 5 %) entspricht dem Bereich, der außerhalb des Bereichs -2 oder +2 der Standardabweichungen vom Mittelwert liegt.
Diese Auffassung wurde in den letzten Jahren revidiert. Wenn im Medikationsexperiment eine niedrigere Toleranzgrenze verwendet wird (die das Konfidenzintervall effektiv auf über 95 % erhöht), könnte es schwieriger sein, die Nullhypothese zu verwerfen.
Aus diesen und vielen anderen Gründen hat die American Statistical Association 2016 eine Erklärung herausgegeben, in der sie behauptet: "Ein p-Wert an sich ist kein guter Maßstab für ein Modell oder eine Hypothese."
p-Werte können auch durch die Art der in die Analyse eingeflossenen Daten manipuliert werden.
Ein Beispiel dafür, wie p-Werte manipuliert werden können, finden Sie in dieser interaktiven "p-hacking"-Übung unter Hack Your Way to Scientific Glory auf der Website FiveThirtyEight, die auch Meinungsumfragen, Politik, Wirtschaft und Sport analysiert.
Sie haben nun eine Einführung in Folgerung, Hypothesenprüfung und p-Werte erhalten. Das Verständnis dieser Konzepte kann Ihnen helfen, Ihre Daten zu messen, zu beschreiben, zusammenzufassen, zu vergleichen und fundierte Schlussfolgerungen daraus zu ziehen.
Ressourcen
- Artikel: The ASA Statement on P-Values: Context, Process, And Purpose. The American Statistician, 2016
- Buch: Cairo, Alberto. The Truthful Art: Data, Charts, and Maps for Communication. Indianapolis, IN: New Riders, 2016
- Blog: Explaining visualizations in The New York Times, NPR, and the BBC. The Functional Art (Blog), 2019. Blog-Link: Zugreifen auf die berufliche Website von Alberto Cairo
- Artikel: Those Hurricane Maps Don’t Mean What You Think They Mean. The New York Times, 2019. Link zum Artikel
- Artikel: Hack Your Way to Scientific Glory. FiveThirtyEight ABC News Internet Ventures.
- Buch: Jones, Ben. Avoiding Data Pitfalls: How to Steer Clear of Common Blunders When Working with Data and Presenting Analysis and Visualizations. Hoboken, NJ: John Wiley & Sons, 2019
- Website: Data Literacy von Ben Jones
- Buch: Lane, David M. Introduction to Statistics. Online Statistics Education: An Interactive Multimedia Course of Study, 2020