Erkunden von Variablen und Feldtypen
Lernziele
Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:
- Bestimmen verschiedener Variablentypen
- Unterscheiden zwischen nominal qualitativen, ordinal qualitativen und quantitativen Variablen
- Unterscheiden zwischen fortlaufenden und diskreten Variablen
Typen von Variablen
Im Modul Gut strukturierte Daten haben Sie gelernt, dass Daten in Spalten oder Feldern organisiert sind. Bei gut strukturierten Daten stellt jedes Feld eine einzelne Variable dar.
Variablen sind die Bausteine von Daten. Wenn Sie Daten als Tabelle organisieren, werden diese Variablen zu Feldern (den vertikalen Spalten). Abhängig davon, was Sie messen, fallen diese Felder in zwei Hauptkategorien:
Qualitative Felder (kategorisch): Qualitative Variablen beschreiben Charakteristika oder Qualitäten, die nicht in Form von Zahlen gemessen werden können. In einem Datenset erscheinen diese als qualitative Felder (Spalten).
Quantitative Felder (numerisch): Quantitative Variablen stellen Beträge dar, die gemessen oder gezählt werden können. In einem Datenset erscheinen diese als quantitative Felder (Spalten).
Da quantitative Daten mit Zahlen zu tun haben, unterteilen wir sie weiter in zwei spezifische Typen, je nachdem, wie diese Zahlen erhoben werden:
- Diskrete Variablen: Zahlen, die gezählt wurden und eindeutige Abstände zueinander aufweisen. Es kann keinen Bruchteil einer Anzahl geben. Beispielsweise kann "Anzahl der Elemente" 1 oder 2 Elemente sein, aber nicht 1,5.
- Fortlaufende Variablen: Zahlen, die gemessen wurden und jeden beliebigen Wert innerhalb eines Bereichs annehmen können, einschließlich Dezimalstellen. Beispielsweise kann "Höhe" 1,75 m betragen.
In der folgenden Tabelle erfassen die Spalten "Name" und "Lieblingsessen" beschreibende Merkmale, daher sind es qualitative Felder. Die Spalten "Alter" und "Höhe" erfassen numerische Messungen, sind also quantitative Felder.
Jede Spaltenüberschrift stellt eine eindeutige Variable dar, während jede Zeile die Daten für eine spezifische Einzelperson enthält.
Name | Alter | Körpergröße | Lieblingsessen |
|---|---|---|---|
Anja | 8 | 128 cm | Speiseeis |
Martin | 12 | 162 cm | Olivenpizza |
Penelope | 42 | 174 cm | Maiskolben |
Vincent | 39 | 155 cm | Pfannkuchen |
Dies gilt für die Tabelle oben:
- Alter ist ein diskretes quantitatives Feld (normalerweise zählen Sie das Alter in ganzen Jahren).
- Höhe ist ein fortlaufendes quantitatives Feld (sie kann präzise mit Dezimalstellen gemessen werden).
Typen qualitativer Variablen
Qualitative Variablen – d. h. Variablen, die nicht numerisch gemessen werden können – lassen sich in zwei Typen einteilen: nominal und ordinal.
- Nominal: Nominal qualitative Variablen sind Kategorien, die nicht in Form einer Rangfolge eingestuft werden können. Ein Beispiel sind verschiedene Obstsorten wie Bananen, Weintrauben, Aprikosen und Äpfel. Hier handelt es sich um nominale Variablen, da es keine implizierte Rangfolge zwischen ihnen gibt. Eine Banane ist beispielsweise nicht höher einzustufen als eine Aprikose.
Sie können sich die Definition einer nominalen Variable z. B. so merken: Nominal = Benannt
- Ordinal: Im Gegensatz zu nominal qualitativen Variablen kann für ordinal qualitative Variablen eine Rangfolge festgelegt werden. Sie sind zwar qualitativ, weil sie nicht numerisch messbar sind, aber es gibt eine logische Rangfolge unter ihnen. Denken Sie z. B. an Umfragen, an denen Sie schon teilgenommen haben. Es folgen Beispiele ordinaler qualitativer Werte in Umfragen: Nie, Manchmal, Meistens, Immer, Äußerst unzufrieden, Unzufrieden, Weder zufrieden noch unzufrieden, Zufrieden, Äußerst zufrieden.
Sie können sich die Definition einer ordinalen Variable z. B. so merken: Ordinal = Geordnet
Lassen Sie uns nun prüfen, ob Sie das verstanden haben. In der folgenden Aktivität geben Sie an, ob es sich beim jeweiligen Merkmal um eine nominal qualitative Variable, eine ordinal qualitative Variable oder eine quantitative Variable handelt. Ziehen Sie die jeweilige Gruppe von Merkmalen zur entsprechenden Kategorie.
Diskrete und fortlaufende Variablen
Eine weitere Klassifizierung für Variablen sind die Variablentypen diskret und fortlaufend.
- Diskrete Variablen: Diskrete Variablen sind individuell getrennt und unterscheidbar. Einfach ausgedrückt: Wenn sich ein Element einzeln zählen lässt, handelt es sich um eine diskrete Variable. Beispielsweise können Sie die Anzahl der Kinder in einem Haushalt einzeln bestimmen. In einem Haushalt können null, drei oder sechs Kinder usw. vorhanden sein, aber nicht 3,45 Kinder.
Die Anzahl der Zehen an einem Fuß und die Gesamtanzahl der Socken in einem Schrank sind ebenfalls Beispiele diskreter Variablen. Auch die Gesamtanzahl der Zehen aller Füße der Einwohner einer Stadt ist eine diskrete Variable. Es würde zwar sehr lange dauern, diese Zehen alle einzeln zu zählen, aber es ist theoretisch möglich.
- Fortlaufende Variablen: Fortlaufend bedeutet, ein ununterbrochenes Ganzes ohne Unterbrechung zu bilden. Dies sind Variablen, die nicht in einer endlichen Zeitspanne gezählt werden können, da zwischen zwei Werten eine unendliche Anzahl von Werten liegt. Wenn Sie beispielsweise die Zeit messen, lässt sich jede Zeiteinheit praktisch unbegrenzt in detaillierterer Form aufschlüsseln: Die Reaktionszeit auf einen Impuls kann als 1,64 Sekunden ausgedrückt werden. Sie kann aber auch weiter aufgeschlüsselt werden und als 1,642378765 Sekunden ausgedrückt werden, und so weiter, bis ins Unendliche. Andere Beispiele fortlaufender Werte sind Temperatur, Entfernung und Masse.
Testen Sie mit diesen interaktiven Lernkarten Ihr Verständnis diskreter und fortlaufender Variablen.
Lesen Sie das Beispiel auf jeder Karte, überlegen Sie, ob es diskret oder fortlaufend ist, und klicken Sie dann auf die Karte, um die richtige Antwort aufzudecken. Klicken Sie auf den nach rechts zeigenden Pfeil, um zu nächsten Karte zu gelangen, bzw. den nach links zeigenden Pfeil, um zur vorherigen Karte zurückzukehren.
In der nächsten Lektion erfahren Sie, wie die verschiedenen Variablentypen in Datenvisualisierungen verwendet werden.
Ressourcen
- Buch: Lane, David M. Introduction to Statistics. Online Statistics Education: An Interactive Multimedia Course of Study, 2020.
- Tableau-Hilfe: Dimensionen und Kennzahlen, blau und grün
