学習の目的
この単元を完了すると、次のことができるようになります。
- 分析のコンテキストでデータ構造を説明する。
- 集計 (合計、平均、件数) する。
- 同じフィールドの複数のピルを操作する。
Tableau Public アカウントに接続する
最初に、右側の [Playground (プレイグラウンド)] ウィンドウで Tableau Public アカウントに接続します。まだ Tableau Public アカウントをお持ちでない場合は、この時点で登録し、アカウントを有効化してから、このインタラクティブな単元に取り組んでください。詳しい手順は「The Tableau データ Model (Tableau データモデル)」を参照してください。
データを分析する
前のモジュールで、データ探索を行いました。これで、分析を開始する準備が整いました。まずは、次のようなガイダンスとなる質問から始めてください。
分析のための質問: 評価の傾向は?
調べてみましょう。
- 一番下の [Validation (検証)] シート タブの横にある新規シート タブアイコンをクリックします。
- 必要に応じて、Episodes.csv テーブルを展開します。
-
[My Rating (私の評価)] フィールドをダブルクリックします。これにより、フィールドが Viz に追加され、自動的に棒グラフが作成されます。
これで、[Rows (行)] シェルフにそのフィールドのコピーが表示されました (Viz 内のフィールドの各インスタンスはピルと呼ばれます)。ただし、ピルにはフィールド名のみが表示されるわけではありません。[SUM(My Rating) (合計(私の評価))] と表示されています。
なぜでしょうか? 多数のデータレコードを 1 つの数値に集計する方法が必要であり、既定ではデータレコードがすべて合計されます。(集計の詳細については、「集計と粒度」を参照してください)。
このケースでは、データセットの評価の合計である 1040 が棒の高さとなります。(棒の上にカーソルを合わせると、ツールヒントに正確な値が表示されます)。
- 必要に応じて、[データ (データ)] ペインの Seasons.csv テーブルを展開し、[Season (シーズン)] を [Columns (列)] シェルフにドラッグします。
ここで、これまでの内容を確認しておきましょう。これは 14 本の棒から構成される棒グラフで、シーズンごとに 1 本ずつあります。各バーは、そのシーズンの総合評価を示します。データの視覚化を開始すると、分析の中間ステップが乱雑になったり、無意味になったりすることがよくあります。この場合もそうでしょうか? このグラフが解釈できるものであるかどうかを確認するために、いくつか質問してみましょう。
データを検査する
シーズン 1 と 2 が最も低い評価だと断言できるか? そうである場合、またはそうでない場合の理由は?
断言できません。評価フィールドは [Season (シーズン)] テーブルではなく [Episode (エピソード)] にあります。これは、評価はシーズンごとではなく、おそらく単一シーズンの 1 エピソードあたりであるということです。ただし、データ構造についてよくわからないのであれば、データを検査することは決して悪いアイデアではありません。
- 下部にある新規シート タブアイコンを使用して、新しいシートを作成します。
-
ChallengeBakes.csv テーブルを展開します。
-
[Season Episode (シーズン エピソード)] を [Rows (行)] にドラッグします。
-
Episode.csv テーブルを展開します。
-
[My Rating (私の評価)] を [Marks (マーク)] カードの [Text (テキスト)] シェルフにドラッグします。ヒント: タイルのように見えますが、多くの場合、シェルフと呼ばれます。
これは現実的な値であり、前のモジュールで説明したように、このフィールドは元々「MyRating (out of 10) (私の評価 (10 点中))」という名前でした。間違いなく、これはエピソードあたりの評価のようです。各行にはレーティングを含む単一のエピソードに関する情報が表示され、評価は行ごとに変化します。
-
[Sheet 3 (シート 3)] というタブを右クリックしてそのタブを削除し、以前の Viz に戻ります。ヒント: ベストプラクティスとして、シートは直接関係ない質問の把握やテストに必要な数だけ新規に作成したり、削除したりしてください。ただし、ワークブックがごちゃごちゃにならないように、必要なシートのみを残してください。
より多くの質問を行い、誤解を招くビジュアルを削除する
各シーズンのエピソード数が一定でない場合、評価を合計すると誤解を招く場合があります。今すぐ確認してください。
シーズンあたりのエピソード数を確認する方法は?
[データ (データ)] ペインの各テーブルには [Count (カウント)] フィールドがありますが、元のデータにはありません。これは Tableau によって追加された特別なフィールド (斜体で表示されるため、判別できます) であり、このフィールドでは各テーブルのレコード数が数えられます。
-
[Episodes.csv (Count) (Episodes.csv (件数))] を [Marks (マーク)] カードの [Label (ラベル)] シェルフにドラッグします。これで、シーズン 1 が 6 エピソード、シーズン 2 が 8 エピソードのみであったことが確認できるようになりました。残りのシーズンはそれぞれ 10 エピソードでした。
エピソード数が一定でない場合、ここで使用する最適な集計は [SUM (合計)] か? そうでない場合は、何を使用する必要があるか?
異なるエピソード数を制御し、かつ評価値を便利な 10 点満点で維持するためには、シーズンの個々のエピソードの評価を合計するのではなく、平均する方が適切です。これにより、すべてのシーズンで比較するのに便利な値となります。
- [Rows (行)] シェルフの [SUM(My Rating) (合計(私の評価))] ピルを右クリックして、コンテキストメニューを開きます。
- メニューの [Measure (メジャー)] にカーソルを合わせて、[Average (平均)] を選択します。ピルが [AVG(MyRating) (平均(私の評価))] に更新され、ビューの軸が 0 ~ 8 のスケールに更新されます。
ラベルの記載が 6、8、10、10... のままであるのは、なぜでしょうか? ラベルシェルフのフィールドを変更していないため、エピソード数のままになっています。
- [Marks (マーク)] カードから [CNT(Episodes.csv)] フィールドをドラッグして外します。ヒント: または、右クリックして [Remove (削除)] を選択することもできます。
- [データ (データ)] ペインから [My Rating (私の評価)] を [Marks (マーク)] カードの [Label (ラベル)] にドラッグします。[データ (データ)] ペインから評価フィールドの新しいコピーをドラッグして外してください。また、ピルを [Rows (行)] シェルフから移動しないでください。
既定では [SUM (合計)] で集計されるため、このラベルは再度合計されます。このピルについても、集計を [Average (平均)] に変更します。
- [Marks (マーク)] カードの [SUM(My Rating) (合計(私の評価))] ピルを右クリックして、[Measure (メジャー)] | [Average (平均)] を変更します。
これで、値が軸に一致しました。ただし、このラベルは必要のない視覚的な要素で少し見づらくなっています。
-
[My Rating (私の評価)] を [Marks (マーク)] カードからドラッグして外します。
- シェルフからフィールドをドラッグするときは、有効なドロップエリアであるオレンジの枠内の任意の場所にドロップします。特定の場所にドロップする必要はありません。削除せずに間違ってどこかにドロップしてしまったときは、ツールバーの [Undo (元に戻す)] ボタンをクリックして、もう一度やり直します。
- シェルフからフィールドをドラッグするときは、有効なドロップエリアであるオレンジの枠内の任意の場所にドロップします。特定の場所にドロップする必要はありません。削除せずに間違ってどこかにドロップしてしまったときは、ツールバーの [Undo (元に戻す)] ボタンをクリックして、もう一度やり直します。
ラベルが表示されなくなりました。
分析のための更新された質問: 評価の平均的なシーズンの傾向は?
「評価の傾向は?」という質問から始めましたが、次は平均的な傾向とシーズンごとの評価を見ていきます。微妙な変化のように思われるかもしれませんが、より深く分析するにつれて、正しい質問をしているか、可能な限り正確であるかを振り返って確認することが重要です。そうすることで、関係者に調査結果を伝え、その理由を説明することができます。また、作成している複数の Viz を他の人が使用できるようにする場合にも一層役立ちます。
コミュニケーションとコラボレーションの精神に基づいて、必ずシートに名前を付けることをお勧めします。また、名前は何に関する分析なのかがわかるような意味のあるものにしてください。
- 画面下部にある [Sheet 2 (シート 2)] のタブをダブルクリックします。
- Tableau では、さまざまなアクションを別の方法でも実行できます。右クリック | [Rename (名前の変更)] でも可能です。
- Tableau では、さまざまなアクションを別の方法でも実行できます。右クリック | [Rename (名前の変更)] でも可能です。
- シート名を
Avg Seasonal Ratings
(平均シーズン評価) に変更し、シート タブ以外の任意の場所をクリックして変更をコミットします。