変数とフィールドタイプを理解する
学習の目的
この単元を完了すると、次のことができるようになります。
- さまざまな変数タイプを認識する。
- 名義尺度の質的変数、順序尺度の質的変数、量的変数を区別する。
- 連続変数と離散変数を区別する。
変数のタイプ
「適切に構造化されたデータ」モジュールでは、データは列やフィールドに整理され、適切に構造化されたデータでは列 (フィールド) は変数で構成され、各フィールドに 1 つの変数が入っていることについて学習しました。
また、「データリテラシーの基礎」モジュールを修了している方は、データが質的変数と量的変数の両方から構成されていることを学びました。質的変数は、カテゴリや特性のような数値で測定できない変数です。量的変数は、セット内にある項目の数のような数値で測定できる変数です。データセットに追加すると、質的変数は質的フィールド (列) になり、量的変数は量的フィールド (列) になります。
名前 |
年齢 |
身長 | 好きな食べ物 |
---|---|---|---|
Aliya | 8 | 4 フィート 2 インチ | アイスクリーム |
Miles | 12 | 5 フィート 3 インチ | オリーブピザ |
Penny | 42 | 5 フィート 7 インチ | 軸付きトウモロコシ |
Vince | 39 | 5 フィート 10 インチ | パンケーキ |
上記の表では、名前と好きな食べ物は質的フィールドで、年齢と身長は量的フィールドです。
質的変数のタイプ
質的変数は、数値で測定できない変数であり、さらに名義尺度と順序尺度の 2 つのタイプに分類できます。
- 名義尺度: 名義尺度の質的変数は、順位付けできないカテゴリのことを指します。たとえば、バナナ、ブドウ、アンズ、リンゴなど、数種類の果物について考えてみましょう。このような果物の間には暗示的な順位が存在しないため、これらは名義尺度の変数になります。たとえば、バナナがアンズよりも高く順位付けられることはありません。
名義尺度の変数の定義を覚える方法の 1 つは、名義尺度 = 名前が付けられているとする方法です。
- 順序尺度: 名義尺度の質的変数とは対照的に、順序尺度の質的変数には順位を付けることができます。順序尺度の質的変数は数値で測定できないため、質的変数になりますが、論理的に順位を付けることができます。たとえば、アンケート調査を思い浮かべてみましょう。アンケートにおける順序尺度の質的変数の例としては、次のようなものがあります。まったくない、時々、たいてい、常時、非常に不満、不満、どちらでもない、満足、非常に満足。
順序尺度の変数の定義を覚える方法の 1 つは、順序尺度 = 順序が付けられているとする方法です。
それでは理解度を確かめましょう。下の問題で、それぞれの特性が名義尺度の質的変数、順序尺度の質的変数、量的変数のうち、どれに該当するのかを答えてください。一連の特性をそれぞれ適切なカテゴリにドラッグしてください。
離散変数と連続変数
他に変数に適用できる分類には、離散変数種別と連続変数種別があります。
- 離散変数: 離散変数とは、値が個々に分離し、異なっている変数を指します。つまり、個別に値を数えることができる変数が離散変数です。たとえば、個々の家庭の子供の数は数えることができます。家庭に子供が 0 人、3 人または 6 人いることはあり得ますが、家庭に 3.45 人の子供がいることはあり得ません。
足の指の数や、引き出しにある靴下の合計数も離散変数の例として挙げられます。あなたの街に住む人たちのすべての足の指の数を合計した数も離散変数です。足の指の数を一本一本数えるのには長い時間がかかりますが、数えること自体は可能です。
- 連続変数: 連続とは、中断なくつながった一体であることを意味しています。この変数では、任意の 2 つの値の間に無限に中間値があるため、有限の時間内に数えることはできません。たとえば、時間を測定したい場合、どの時間の単位もさらに小さな単位に分割することができます。ある刺激に対する応答時間は 1.64 秒と表すことも、さらに細かく 1.642378765 秒など、無限に細かく表すことができます。連続変数の例としては他に、気温、距離、質量などがあります。
次の対話型フラッシュカードを使用して、離散変数と連続変数の理解度をテストしましょう。
各カードの例を読み、離散変数であるか連続変数であるかを考えてください。カードをクリックすると正解が表示されます。右向き矢印をクリックすると次のカードに移動し、左向き矢印をクリックすると前のカードに戻ります。
次の単元では、データビジュアライゼーションでさまざまな変数タイプがどのように使用されるかについて説明します。