学習の目的
この単元を完了すると、次のことができるようになります。
- その他のチャートタイプを確認する。
- 軸を編集する。
- 円グラフを使用して、傾向を確認する。
- 折れ線グラフを使用して、経時的な傾向を伝える。
チェック: Tableau Public アカウントに接続する
まだ Tableau Public アカウントがない場合やプレイグラウンドがタイムアウトした場合は、右側の [Playground (プレイグラウンド)] ウィンドウでアカウントにログインしてください。まだ Tableau Public アカウントをお持ちでない場合は、この時点で登録し、アカウントを有効化してから、このインタラクティブな単元に取り組んでください。詳しい手順は「The Tableau Data Model (Tableau データモデル)」を参照してください。
分析のための質問: 視聴者数と評価に傾向はあるか?
棒グラフはデータを視覚化するための非常に優れた方法ですが、唯一の選択肢というわけではありません。別のフィールドセットと別のチャートタイプに完全に切り替えて、視聴者数と評価の他の傾向を見てみましょう。
- 新しいシートを作成します。ヒント: シート タブ [Ratings Per Episode (エピソードあたりの評価)] の横にある [New Sheet (新規シート)] アイコンをクリックします。
- [Data (データ)] ペインの [My Viewership (私の視聴者数)] を右クリックして、Viz に追加します。ヒント: どのテーブルを展開すれば必要なフィールドが見つかるかわからない場合は、検索バーを使用してみてください。
- [Data (データ)] ペインの [My Rating (私の評価)] をダブルクリックして、Viz に追加します。
散布図に点が 1 つしかない理由は?
表示されているのは、番組の全シーズンの全エピソードを通した合計視聴者数による平均評価です。これをより詳細に表示するにはどうしたらよいでしょうか? フィールドを詳細に追加してください。
- Tableau に Viz で必要な詳細レベルを伝える必要があります。このフィールドセットの場合、[Season Episode (シーズン エピソード)] が最も理にかなっています。[Season Episode (シーズン エピソード)] を [Marks (マーク)] カードの [Detail (詳細)] にドラッグします。ヒント: 画面の一番左下の [Data Source (データ ソース)] タブの下に、マークの数を示すステータスバーがあります。マーク数が 134 になっているはずです。マーク数が 134 でない場合は、使用しているフィールドを確認してください。
視聴者数に [SUM (合計)] を使用するのは適しているか?
視聴者数は累積メトリクスです。(たとえば、あるシーズンの各エピソードの視聴者を合計すると、そのシーズンの合計視聴者数に関する意味のある情報が得られます。評価については、これは当てはまりません。)視聴者数フィールドの集計はそのまましておいて構いません。マークは評価 6 ~ 8 の間にすべて集まっています。正確であるためには、軸に 0 が含まれている必要があるか?
これは意見が分かれる可能性のある問題ですが、ここではノーと言っても差し支えありません。棒グラフは常に 0 から開始される必要がありますが、折れ線グラフや散布図では、0 から開始すると重要な違いが隠されてしまう場合があります。人は 0 ~ 10 までの評価スケールを完全には使用しない傾向があり、7.9 と 8.5 の違いには意味があります。 0 から開始すると、関連する区間がわかりにくくなります。ただし、軸のスケールや開始点を変更する場合は、常に注意してください。詳しくは、「誤解を招くグラフを見極めるためのガイドライン」を参照してください。
- [My Rating (私の評価)] 軸を右クリックします。
- 次に、[Edit Axis... (軸の編集...)] を選択します。
- [Include zero (ゼロを含める)] のチェックボックスをオフにします。
- [X] をクリックして、ダイアログを閉じます。
これで、マークがグラフの大部分を埋めるように広がりました。
分析のための質問: ネットワークは視聴者数と評価に影響するか?
この質問を検討するために、塗りつぶされた円を使用してネットワークによる影響を表現します。
- [Data (データ)] ペインから [Network (ネットワーク)] を [Marks (マーク)] カードの [Color (色)] にドラッグします。ヒント: どのテーブルを展開すれば必要なフィールドが見つかるかわからない場合は、検索バーを使用してみてください。
これで、マークがネットワークに従って色分けされるようになりました。簡単な書式設定をいくつか実行すると、マークをより区別しやすくすることができます。
- [Marks (マーク)] カードの [Shape (形状)] をクリックします。
- 次に、塗りつぶされた円をクリックします。
- クリックしてコントロールを閉じます。
- [Marks (マーク)] カードの [Color (色)] をクリックして、不透明度を [80%] に設定します。これにより、マークが積み上げられている場合に見やすくなります。
- [Marks (マーク)] カードの [Size (サイズ)] をクリックして、サイズを [35%] または適切と思われる値に設定します。
ネットワークごとに個別のクラスターがあるようです。オレンジの BBC Two は、視聴者数は少ないですが、評価は高くなっています。青の BBC One は、視聴者数が多く、評価も高くなっています。赤の Channel 4 は、視聴者数は中程度で、高い評価がいくつかありますが、最も低い評価のエピソードもあります。
- 下部にある [Sheet 4 (シート 4)] という語をダブルクリックし、シート名を
Network Trends
(ネットワークの傾向) に変更します。
分析のための質問: これは各ネットワークで番組が放送された時期とどのように関連しているか?
折れ線グラフを使用して、分析を調査してみましょう。
- 新しいシートを作成します。
- [Airdate (放送日)] を [Columns (列)] にドラッグします。
- [My Viewership (私の視聴者数)] を [Rows (行)] にドラッグします。
- [Network (ネットワーク)] を [Color (色)] にドラッグします。
Viz から何がわかるか?
(これはトレーニング用の架空のデータであることを忘れないでください。) 番組は BBC Two で放送が開始され、視聴者数は年々伸びていきました。2014 年に BBC One に変更され、視聴者数は伸び続けました。2017 年にネットワークが再び変更され、今度は Channel 4 に移り、視聴者数は減少しました。Channel 4 は視聴者数でやや苦戦し、2020 年に一進一退、2022 年に視聴者数が最も少なくなりました。ただし、2023 年の最新シーズンは持ち直し、2014 年の視聴者数に匹敵するほどになりました。
- このシートに
Viewership Over Time
(視聴者数の推移) という名前を付けます。Challenge を確認する際には、このシートを必ず表示してください。
まとめ
お疲れさまでした。この単元を通して、データ分析がウィザードのような一連の手順ではなく柔軟なサイクルであること、適切なビジュアルを見つけて細部に気を配ることが正しいデータの伝達につながることなど、データ分析の重要な概念を学習しました。ただし、おそらく最も重要なことは、好奇心を持ち、質問をし続け、自分の想定を確認しながら作業を進め、間違いを恐れないことです。