時系列、ランキング、部分対全体、名目の比較を行う
学習の目的
この単元を完了すると、次のことができるようになります。
- 時系列、ランキング、部分対全体、名目比較について説明する。
- 上記の比較に最適なチャートタイプとその使用法を理解する。
名目比較
名目とは、物事の呼称のことです。名目比較とは、カテゴリを比較することです。名目比較に適した属性は、二次元的位置、色相、形状です。
棒グラフ
前の単元で、量的な値を見分けるには棒グラフの長さが効果的であることを学習しました。棒グラフでカテゴリを比較するときは、バーの二次元的位置と長さの属性を使用します。バーとバーの差やバーの順序を見れば、バーの長さで示される各カテゴリの量的な値を比較できます。特に順序変数にランクや順位を付ければ、データの重要なパターンを示すことができます。
カテゴリのエンコードする
カテゴリを比較するときは、色 (または色相) や形状の属性を使用してカテゴリを区別できます。
1 つ目の画像は時系列の折れ線グラフで、色を使用して都市を区別しています。2 つ目の画像は散布図で、形状で商品カテゴリを区別しています。
時系列
時系列チャートは、一定期間にわたる量的な値を比較します。折れ線グラフを使用すると、経時的なパターンや傾向を確認できます。
折れ線グラフ
折れ線グラフは、時系列を示すごく一般的な手法で、時間の経過に伴うパターンや傾向を確認する最適な方法の 1 つです。たとえば、この折れ線グラフでは、経時的な利益の推移を簡単に確認できます。
各データポイントを線で結ぶ時系列の折れ線グラフに、傾向線を追加できます。傾向線を重ね合わせれば、測定の全般的な傾向と方向性をとらえることができ、指針の決定に役立ちます。下図は、折れ線グラフに追加された傾向線に、時間の経過とともに利益が増大するパターンが示されています。
縦棒グラフ
縦棒は、時系列の比較において、全般的な傾向ではなく、個々の値を強調することが重要な場合に役立ちます。次の縦棒グラフでは、全般的な傾向ではなく、Q2 の値が低いことに焦点が当てられています。
箱ヒゲ図
箱ヒゲ図は、中央値 (ボックスの中央の線)、25 パーセンタイルと 75 パーセンタイル (ボックスの両端)、個々のデータポイントで分布を表します。複数の箱ヒゲ図を使用すれば、時系列の分布を比較できます。
ランキング
ランキング比較のチャートでは、各カテゴリの値に順序が付けられます (降順または昇順)。ランキング比較はさまざまな方法で表示できます。
棒グラフ
ランキング比較に使用する最も一般的なチャートは棒グラフです。棒グラフでは、値の特異性が強調されます。バーを昇順または降順に並べ替えると、値にランクを付けることができます。次の例では、椅子のサブカテゴリの値が最大で、テーブルとバインダーは差がわずかながら、テーブルがバインダーより上位にランクされていることがわかります。
ランキング比較を表示する他のチャート
棒グラフを正しく解釈するためには、ベースラインを必ずゼロにしなければなりません。ベースラインをゼロにできない場合はドットプロットを使用し、バーではなく、エンドポイントをドットに置き換えます。ペアの値を表示する場合は、ペアのドットを結び付ければ、ペア単位の差異を強調できます。
こちらのブログで、Lisa Charlotte Muth がドットプロットを使用して、年齢の中央値による各国のランキングを表示する方法を解説しています。ドットプロットの場合は、軸をゼロから開始する必要がありません。
時間とともにランキングが変化する状況では、順位遷移グラフを使用して、カテゴリ別の順位を結んだ線でランキングの経時的な変化をたどることができます。Tableau Public の Matt Chambers が作成した以下の順位遷移グラフでは、2000 年の開始時に「その他の色」カテゴリが第 3 位でしたが、毎年ランキングが変動し、2005 年から 2015 年は第 10 位に留まっています。
部分対全体
部分対全体の比較チャートでは、値が全体に対する比率として、通常はパーセント値で示されます。
積み上げ棒グラフ
全体に対する部分の関係を表す最も一般的なチャートは棒グラフです。積み上げ棒グラフでは、各バーが構成要素に分割されます。要素は割合、個数、特定の測定値で表示できます。以下の例では、配送モード別に売上とセグメントの比率を示す 3 通りの積み上げ棒グラフを示しています。
1 つ目のチャートは Y 軸が売上を示しています。2 つ目のチャートは Y 軸が総計に対する割合を示しています。3 つ目のチャートは Y 軸が各セグメントの割合を示しています。読み手が個々のラベルを見れば、それぞれのコンテキストにおける全体に対する売上高の割合を確認できます。割合を示すときは、そのコンテキストを明らかにし、割合が表す個数または測定値を示すことが重要です。
円グラフ
データビジュアライゼーションの実務担当者の多くが「円グラフ論争」に遭遇しています。2 つ目の単元で、長さ属性を使用するほうが、サイズの大小を認識する場合よりも、値の差異をはるかに認識しやすいことを学習しました。円グラフでサイズ属性を使用する場合は、サイズのわずかな差異がわかりにくいことがあります。次の例の円グラフでは、スライスのわずかな差異を見分けるのが困難ですが、棒グラフを使えば、小さな差異も簡単に見分けることができます。
その一方で、円グラフが適しているケースもあります。スライスがごく少数で、些細な差異を見極める必要がない場合は、円グラフが効果的です。また、全体のちょうど半分 (50%) を占めるカテゴリを示すときは、円グラフのほうが明白です。
面折れ線グラフ
面折れ線グラフを使用すると、経時的な変化と部分対全体に関する質問に答えることができます。部分対全体の経時的な変化を示すときは、色と面のサイズを使用して、時系列の折れ線グラフで部分対全体を表します。次の例では、年間を通して標準分類の配送モードが最も一般的な配送方法であることがわかります。
ツリーマップ
大規模な階層データセットの場合は、ツリーマップを使用して、ネストされたカテゴリを 1 つのグラフに表示できます。次の例は、各配送モードのサブカテゴリの売上の割合を部分対全体で表しています。ツリーマップではサイズ属性を使用して差異を表すため、読み手が比較しにくいことがあります。個々のサブカテゴリの比較が重要な場合は、小さな棒グラフを複数作成することが代替法になります。詳細は、「Using Treemaps to Visualize Data (ツリーマップを使用したデータの視覚化)」を参照してください。
リソース
- Tableau ブログ: Box and Whisker Plots (箱ヒゲ図)
- Storytelling with Data ブログ: What is a dot plot? (ドットプロットとは?)
- Trailhead: 誤解を招くグラフを見極めるためのガイドライン
- Tableau: How to Spot Misleading Charts, A Checklist (誤解を招くチャートを見分けるためのチェックリスト)
- Tableau: Pie Charts (円グラフ)
- Tableau: Data Dialogues: To Pie Chart or Not to Pie Chart? (データダイアログ: 円グラフにすべきか、せざるべきか)
- Trailhead: データの分布
- Datawrapper ブログ投稿: I’m surrounded by old people (高齢者が溢れている)
- Tableau Public: Color Popularity for New Cars in North America 2000-2015 (2000 ~ 2015 年の北米における新車の人気色)
- Data Plus Science ブログ: Using Treemaps to Visualize Data (ツリーマップを使用したデータの視覚化)