Überprüfen von Achsen
Lernziele
Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:
- Beschreiben, wie Achsen, Skalen und Intervalle in Diagrammen verwendet werden
- Bestimmen geeigneter Achsen für bestimmte Diagrammtypen
- Erkennen häufiger Formen der unsachgemäßen Nutzung von Achsen
Was sind Achsen?
Achsen bilden die Struktur für die Darstellung von Daten in einem Diagramm. Achsen bieten Skalen, auf denen den in einem Diagramm dargestellten Datenpunkten Werte und Beschriftungen zugewiesen werden.
Viele Diagramme haben zwei Achsen:
- Die horizontale Achse, gemeinhin als x-Achse bezeichnet
- Die vertikale Achse, gemeinhin als y-Achse bezeichnet
Grundlegendes zu qualitativen und quantitativen Skalen
Bei Achsen in Diagrammen gibt es zwei Arten von Skalen.
- Qualitativ: zum Zuweisen von Beschriftungen für Kategorien wie Ernährung, Unterkunft und Kleidung
- Quantitativ: zum Zuweisen von Werten zu numerischen Variablen wie 0, 5 und 10
Um mehr über Variablen und Skalen zu erfahren, absolvieren Sie das Modul Variablen und Feldtypen.
Nachdem Sie erfahren haben, was Achsen sind, betrachten Sie nun die verschiedenen Diagrammtypen zur visuellen Darstellung von Daten.
Diagrammtypen zur Darstellung qualitativer Variablen | |
---|---|
In einem Balkendiagramm werden Werte zwischen Kategorien bzw. Unterkategorien anhand der Höhe (oder Länge) verglichen. |
|
In einem Kreisdiagramm werden Daten beim Vergleichen von Kategorien als prozentualer Anteil eines Ganzen dargestellt. |
|
Diagrammtypen zur Darstellung quantitativer Variablen | |
---|---|
Ein Streudiagramm zeigt die Beziehung zweier quantitativer Variablen. Die Daten werden als kartesische Koordinaten gezeichnet, die angeben, wie weit entfernt und wie weit oben jeder Datenpunkt liegt. |
|
In einem Liniendiagramm wird eine Reihe quantitativer Werte miteinander verbunden. Es wird häufig zur Darstellung einer Zeitreihe verwendet (wobei die x-Achse die Zeit darstellt). Auch bekannt als Liniengraph oder Linienzeichnung. |
|
Ein Histogramm stellt die Verteilung von Daten und die Häufigkeit von Werten in einem Datensatz als zusammenhängende Balken dar. Die Breite der Balken ist an die Werte auf der x-Achse gebunden. Statistiker, Wissenschaftler und Analysten bezeichnen die Breite der einzelnen Balken als Klassen. |
|
Ein Box-and-Whisker-Diagramm zeigt die Verteilung von Daten anhand von Perzentilen. Wird auch als Boxplot bezeichnet. |
Mit Intervallen vertraut machen
Ein Intervall ist der Abstand zwischen den Werten (Teilstrichen) auf einer quantitativen Achse. Es muss stets ein einheitlicher Abstand zwischen den einzelnen Teilstrichen oder es müssen gleiche Intervalle auf einer quantitativen Achse bestehen. Wenn ein Diagramm beispielsweise die Pendelzeiten von Mitarbeitern zeigt, empfiehlt sich ein einheitliches Intervall von 10 Minuten. Uneinheitliche Intervalle (wie 15 Minuten, 40 Minuten und 60 Minuten) können zu Fehlinterpretationen und falschen Schlussfolgerungen führen.
Sehen Sie sich dazu ein Beispiel an: eine beeindruckende Steigerung der Tomatenernte von Susanne.
Im vorherigen Diagramm können Sie sehen, dass Susanne 2022 einige Kilo mehr Tomaten geerntet hat als zu ihrer Anfangszeit 2010. Haben Sie jedoch bemerkt, dass die Jahre 2016 bis 2018 auf der x-Achse fehlen? Sehen Sie sich nun das Diagramm mit diesen Jahre auf der Achse an.
Bei einheitlichen Intervallen auf der x-Achse ist es einfacher zu erkennen, dass Susannes Tomatenernte im Laufe der Zeit stetig zugenommen haben dürfte.
Neben der Überprüfung einheitlicherer Intervalle ist es auch wichtig, auf fehlende Datenpunkte oder NULL-Werte zu achten. Wissen Sie, was in den Jahren 2016 bis 2018 passiert ist? Vielleicht hatte Sue in dieser Zeit ein schwieriges Jahr.
Achten auf qualitative Achsen in für quantitative Daten gedachten Diagrammen
Seien Sie achtsam, wenn Sie versuchen, Streudiagramme, Liniendiagramme oder Histogramme mithilfe qualitativer Achsen darzustellen. Sehen Sie sich zum Beispiel das folgende Diagramm mit der Anzahl der Kreditnehmer in bestimmten Sektoren an.
Für diese Daten benötigen Sie ein Balkendiagramm! Ein Liniendiagramm dient zur Darstellung von aufeinanderfolgenden Werten wie Datums- oder Zeitangaben. In Liniendiagrammen sollten auch stets x-Achsen mit gleichmäßigen Intervallen verwendet werden, wobei die x-Achse eine quantitative Variable zeigt. Im obigen Beispiel ergibt es keinen Sinn, die Sektorkategorien in eine bestimmte Reihenfolge zu bringen. Ein Balkendiagramm wäre eine viel bessere Wahl, solange beim Grundwert einige wichtige bewährte Vorgehensweisen eingehalten werden.
Balkendiagramme müssen bei 0 beginnen
Es ist wichtig, dass alle Balkendiagramme mit dem Grundwert 0 beginnen, d. h., dass der untere Teil des Balkens gleich 0 ist. Die folgenden Diagramme zu regionalen Umsatzzahlen verdeutlichen diese Wichtigkeit.
Das Diagramm auf der rechten Seite suggeriert, dass es einen signifikanten Unterschied zwischen den beiden Regionen auf der x-Achse gibt. Das zweite Diagramm trügt, denn die y-Achse beginnt bei 380.000 USD und nicht bei 0. Bei der Interpretation von Balkendiagrammen vergleichen Sie die Länge der Balken. Wenn die Achse bei 380.000 USD beginnt, erkennt unser Auge eine Differenz um das Dreifache. Im ersten Diagramm besteht die einzige Änderung darin, dass die y-Achse bei 0 beginnt.
Jetzt können Sie sofort erkennen, wie die Differenz zwischen den Veränderungen im zweiten Diagramm übertrieben dargestellt wurde, da kein besonders signifikanter Unterschied besteht! Deshalb ist es wichtig, dass Sie bei Balkendiagrammen stets darauf achten, dass der Grundwert bei 0 beginnt.
Liniendiagramme dürfen bei 0 beginnen
Bei der Anzeige von Liniendiagrammen gilt die Regel "muss bei 0 beginnen" jedoch nicht. Mitunter ist es sogar besser, die y-Achse eines Diagramms nicht bei 0 beginnen zu lassen! Werfen Sie einen Blick auf die beiden folgenden Diagramme zur globalen Temperaturentwicklung im Laufe der Zeit (Datenquelle: Graphing Global Temperature Trends).
Das zweite Diagramm vermittelt ein besseres Bild des Musters oder der Erkenntnisse darüber, wie sich die globale Temperatur im Laufe der Zeit entwickeln könnte, und zwar deshalb, weil die y-Achse im zweiten Diagramm nicht bei 0 beginnt. In diesem Diagramm können Sie mehr Details ablesen, die vorher nicht ersichtlich waren, wie z. B. die Entwicklungen von Jahr zu Jahr.
Die große Diskussion über mehrere Achsen
In Fachkreisen der Datenvisualisierung wird viel über die Nützlichkeit von zwei Achsen in einem einzigen Diagramm diskutiert. Zwei Achsen sind bei richtiger Nutzung hilfreich, können aber auch zuweilen irreführend sein und unsachgemäß eingesetzt werden.
Das Argument für mehrere Achsen
Es gibt legitime Anwendungsfälle für die Verwendung mehrerer Achsen. So kann es z. B. sinnvoll sein, dasselbe Datenset auf zwei verschiedenen Skalen mit zwei Y-Achsen darzustellen. Dies ist der Fall, wenn dieselben Daten mit zwei verschiedenen Maßeinheiten dargestellt werden (z. B. Zoll und Zentimeter oder Kilogramm und Pfund). Im folgenden Diagramm ist die Temperatur auf der einen y-Achse in Fahrenheit und auf der anderen in Celsius angegeben.
Das Argument gegen mehrere Achsen
Leider gibt es mehrere Fälle, in denen mehrere Achsen sowohl absichtlich als auch unabsichtlich trügerisch sind. In ihrem Blog Datawrapper präsentiert Lisa Charlotte Muth, eine angesehene Autorin und Dozentin auf dem Gebiet der Datenvisualisierung, dieses irreführende Diagramm, das zwei verschiedene Reihen von Datenpunkten mit zwei Y-Achsen zeigt.
Schauen Sie sich die Skalen in diesem Diagramm genau an. Die Skalen der beiden Y-Achsen sind unterschiedlich und verleiten zu der irrigen Annahme, dass das deutsche und globale BIP im Jahr 2011 gleich hoch waren. In Wirklichkeit bestand ein erheblicher Unterschied zwischen diesen Zahlen von über 66 Billionen USD.
Denken Sie stets daran, die Achsen zu überprüfen, wenn Sie Diagramme betrachten, um sicherzustellen, dass die Daten in der dargestellten Form sinnvoll sind!
Ressourcen
- Trailhead: Variablen und Feldtypen
- Tableau-Website: Truncating the Y-Axis: Threat or Menace?
- Buch: Steve Wexler (2021): The Big Picture: How to Use Data Visualization to Make Better Decisions–Faster,. McGraw-Hill Companies
- Buch: Alberto Cairo (2020): How Charts Lie: Getting Smarter about Visual Information, W.W. Norton & Company
- Blogpost: Why Not to Use Two Axes, and What to Use Instead