変数とフィールドタイプを理解する
学習の目的
この単元を完了すると、次のことができるようになります。
- さまざまな変数タイプを認識する。
- 名義尺度の質的変数、順序尺度の質的変数、量的変数を区別する。
- 連続変数と離散変数を区別する。
変数のタイプ
「適切に構造化されたデータ」モジュールで、データが列、つまり項目に整理されることを学習しました。適切に構造化されたデータでは、各項目が 1 つの変数を表します。
変数はデータのビルディングブロックです。データをテーブルに整理すると、こうした変数が項目 (縦の列) になります。何を測定するかに応じて、項目は 2 つの主なカテゴリに分類されます。
質的項目 (カテゴリ): 質的変数は、数値で測定できない特性や性質を表します。データセットで、こうした変数は質的項目 (列) として表示されます。
量的変数 (数値): 量的変数は、測定または数えられる量を表します。データセットで、こうした変数は量的項目 (列) として表示されます。
量的データは数値を扱うことから、数値の収集方法に基づいてさらに 2 種類に分類します。
- 離散変数: 数えられ、明確な区切りがある数値です。計数に小数は使用できません。たとえば、「品目数」は 1 個、2 個で、1.5 個にはなりません。
- 連続変数: 測定された数値で、小数を含む範囲内の任意の値を取ることができます。たとえば、「身長」が 5.75 フィートである場合があります。
次の表の「名前」列と「好きな食べ物」列は記述的な特性を表しているため、質的項目です。「年齢」列と「身長」列は数値の測定結果を表しているため、量的項目です。
各列のヘッダーは固有の変数を表し、各行に特定の個人のデータが記載されています。
名前 | Age (年齢) | 身長 | 好きな食べ物 |
|---|---|---|---|
Aliya | 8 | 4 フィート 2 インチ | アイスクリーム |
Miles | 12 | 5 フィート 3 インチ | オリーブピザ |
Penny | 42 | 5 フィート 7 インチ | 軸付きトウモロコシ |
Vince | 39 | 5 フィート 10 インチ | パンケーキ |
上記の表の説明:
- 年齢は離散的な量的項目です (通常は整数で数えます)。
- 身長は連続的な量的項目です (小数点を使って高い精度で測定できます)。
質的変数のタイプ
質的変数は、数値で測定できない変数であり、さらに名義尺度と順序尺度の 2 つのタイプに分類できます。
- 名義尺度: 名義尺度の質的変数は、順位付けできないカテゴリのことを指します。たとえば、バナナ、ブドウ、アンズ、リンゴなど、数種類の果物について考えてみましょう。このような果物の間には暗示的な順位が存在しないため、これらは名義尺度の変数になります。たとえば、バナナがアンズよりも高く順位付けられることはありません。
名義尺度の変数の定義を覚える方法の 1 つは、名義尺度 = 名前が付けられているとする方法です。
- 順序尺度: 名義尺度の質的変数とは対照的に、順序尺度の質的変数には順位を付けることができます。順序尺度の質的変数は数値で測定できないため、質的変数になりますが、論理的に順位を付けることができます。たとえば、アンケート調査を思い浮かべてみましょう。アンケートにおける順序尺度の質的変数の例としては、次のようなものがあります。まったくない、時々、たいてい、常時、非常に不満、不満、どちらでもない、満足、非常に満足。
順序尺度の変数の定義を覚える方法の 1 つは、順序尺度 = 順序が付けられているとする方法です。
それでは理解度を確かめましょう。下の問題で、それぞれの特性が名義尺度の質的変数、順序尺度の質的変数、量的変数のうち、どれに該当するのかを答えてください。一連の特性をそれぞれ適切なカテゴリにドラッグしてください。
離散変数と連続変数
他に変数に適用できる分類には、離散変数種別と連続変数種別があります。
- 離散変数: 離散変数とは、値が個々に分離し、異なっている変数を指します。つまり、個別に値を数えることができる変数が離散変数です。たとえば、個々の家庭の子供の数は数えることができます。家庭に子供が 0 人、3 人または 6 人いることはあり得ますが、家庭に 3.45 人の子供がいることはあり得ません。
足の指の数や、引き出しにある靴下の合計数も離散変数の例として挙げられます。あなたの街に住む人たちのすべての足の指の数を合計した数も離散変数です。足の指の数を一本一本数えるのには長い時間がかかりますが、数えること自体は可能です。
- 連続変数: 連続とは、中断なくつながった一体であることを意味しています。この変数では、任意の 2 つの値の間に無限に中間値があるため、有限の時間内に数えることはできません。たとえば、時間を測定したい場合、どの時間の単位もさらに小さな単位に分割することができます。ある刺激に対する応答時間は 1.64 秒と表すことも、さらに細かく 1.642378765 秒など、無限に細かく表すことができます。連続変数の例としては他に、気温、距離、質量などがあります。
次の対話型フラッシュカードを使用して、離散変数と連続変数の理解度をテストしましょう。
各カードの例を読み、離散変数であるか連続変数であるかを考えてください。カードをクリックすると正解が表示されます。右向き矢印をクリックすると次のカードに移動し、左向き矢印をクリックすると前のカードに戻ります。
次の単元では、データビジュアライゼーションでさまざまな変数タイプがどのように使用されるかについて説明します。
リソース
- 書籍: Lane, David M.: Introduction to Statistics (統計学入門)。Online Statistics Education: An Interactive Multimedia Course of Study, 2020 (オンライン統計学教育: 2020 年インタラクティブマルチメディア学習指導要領)。
- Tableau ヘルプ: ディメンションとメジャー、青と緑
