変数をビジュアライゼーションで表示する
学習の目的
この単元を完了すると、次のことができるようになります。
- ビジュアライゼーションにおける量的変数と質的変数のさまざまな使用方法を説明する。
- ビジュアライゼーションで変数を使用する。
前の単元では、変数には質的変数と量的変数があり、データセットのフィールド (列) として整理されることを学習しました。ですが、データを視覚化する際、こういった変数はどのように使用されるのでしょうか?
ビジュアライゼーションでは、量的変数と質的変数の使用方法は異なっています。
- 量的変数は計算することが可能なデータ要素です。また、集計することも可能です (集計の例として、合計と平均の 2 つが挙げられます)。たとえば、ある地域の売上を示すビジュアライゼーションでは、売上は量的変数です。
- 質的変数はビジュアライゼーションにおける詳細レベルを設定します。データをカテゴリ分けしたり、セグメント化したり、詳細を表示させたりするために使用できます。たとえば、さまざまな地域の売上を示すビジュアライゼーションでは、地域は質的変数です。
ビジュアライゼーションの概要
量的変数 (フィールド) のみを表示した場合と、量的変数 (フィールド) と質的変数 (フィールド) の両方を表示した場合の効果を描写するために、企業のさまざまな商品の利益の合計を示すビジュアライゼーションを見ていきましょう。
左側のビジュアライゼーションには量的変数のみが含まれ、企業の利益の合計が表示されています。この企業が合計で 140 万ドルを超える利益を得たことがわかります。右側のビジュアライゼーションでは、質的変数 (カテゴリ) が含まれているため、家具、事務用品、家電という 3 つの商品カテゴリでセグメント化された合計の利益を確認できます。
例: ビジュアライゼーションでの変数の使用
それでは、ビジュアライゼーションのしくみがわかったところで、ビジュアライゼーションで量的変数と質的変数を使用することによって、さまざまなデータインサイトがどのように明らかにされるかを見ていきましょう。ここでは、架空のフランチャイズ企業に関する情報を含むデータセットを使用します。データ中の変数について詳しく見たあと、量的変数と質的変数を使用したビジュアライゼーションをいくつか見ていきます。
- 変数を詳しく見る
いくつかの変数について詳しく見てみましょう。
[カテゴリ]、[オーダー優先度]、[出荷モード]、[サブカテゴリ] は質的変数です。[利益]、[売上]、[配送費] は量的変数です。
- 質的変数についてさらに詳しく見る
少し時間を取って、質的変数の行レベルの値を見てみましょう。
[カテゴリ] と [サブカテゴリ] には、順位や順番が暗示されていない値の名前が含まれています。このような名前は名義尺度の変数です。
[オーダー優先度] と [出荷モード] には論理的な順位または順序を暗示する値が含まれています。このような値は順序尺度の変数です。ビジュアライゼーションについ考える際には、こうした区別が重要になります。
- 質的変数を加える前のビジュアライゼーションを見る
まずは、量的変数を 1 つだけ含み、平均配送費を表示しているビジュアライゼーションを見てみます。
- 名義尺度の変数を加えたビジュアライゼーションを見る
質的変数によって、ビジュアライゼーションにさらに詳しい情報が追加されます。
まずは、名義尺度の変数から見てみましょう。[カテゴリ] ディメンションを追加したことで、平均配送費が商品カテゴリ別にセグメント化されています。平均配送費が最も高いのは、商品カテゴリの [家電] だということがわかります。
右側のビジュアライゼーションでは、名義尺度の変数である [サブカテゴリ] を追加して、さらに深く掘り下げています。ここからわかるのは、商品カテゴリ別では [家電] の平均配送費が最も高くなっているものの、商品のサブカテゴリ別では [テーブル] の平均配送費が最も高くなっているということです。
- 順序尺度の変数を加えたビジュアライゼーションを見る
それでは次に、順序尺度の変数を使用して [オーダー優先度] ごとに平均配送費を分析した別のビジュアライゼーションではどうなるかを見てみましょう。
何か気付くことはありますか? 意外なことに、優先度の低い注文では、優先度が中程度の注文より平均配送費が高くなっています。
- 2 つ目の順序尺度の変数を加えたビジュアライゼーションを見る
2 つ目の順序尺度の変数を加えることで、平均配送費を [オーダー優先度] と [出荷モード] の両方で分析することが可能になります。
何か気付くことはありますか? 意外なことに、優先度が中の注文では、ファーストクラスで配送された注文の平均配送費が即日配送の注文の平均配送費より高くなっています。
このモジュールでは、変数を量的変数、質的変数、離散変数、連続変数に分類する方法について詳しく見てきました。また、量的変数、および名義尺度の質的変数と順序尺度の質的変数を使用したいくつかのビジュアライゼーションについても考察しました。これで、ビジュアライゼーションにおける変数の使用方法が理解できました。