データを出力して共有する
学習の目的
この単元を完了すると、次のことができるようになります。
- 出力ステップを追加する。
- フローを実行して出力データファイルを作成する。
- Tableau Prep 出力ファイルを Tableau Desktop のデータソースとして使用する。
- フローを Tableau Server にパブリッシュする。
フローを出力する
Tableau Prep Builder でフローを作成してデータを準備したら、[ファイル] メニューの [保存] を使用してフローを保存します。これによってすべての変更が保存されるため、フローの編集を続けるか、フローを共有することもできますし、準備したデータの出力を作成して、使用したり、他のユーザーと共有したりすることもできます。
フローを保存すると、フローファイル (.tfl ファイル) が生成されます。フローファイルには、フローのデータ接続やデータを準備するために行った変更など、フロー自体に関する情報が保存されます。フラットファイルの場合、元のデータセットの抽出が含まれるパッケージドフローファイル (.tflx ファイル) を保存することもできます。ただし、いずれのフローファイルも準備されたデータではありません。
クリーニングされたデータセットを実際に生成するには、出力ステップを作成してフローを実行する必要があります。これによって、準備されたデータ出力が生成されます。
データ出力には、出力ステップを追加したステップを含め、フロー内でそれまでに適用したデータ準備操作が組み込まれるため、準備したデータを保存して共有できます。
クリーニングと準備が完了したデータを出力するには、いくつかの方法があります。準備したデータをローカルの .hyper 抽出ファイルに出力するのが適している場合があります。このファイルを使用すると Tableau Desktop に接続して分析できます。または、フローを Tableau Cloud または Tableau Server 上のパブリッシュされたデータソースとして出力するのが適している場合もあります。出力をパブリッシュすると、準備した状態でのデータへの一元管理を提供できます。
データがエンドユーザーのニーズに合うように、出力は同じフロー内のさまざまなポイントで生成できます。たとえば、クリーニング操作の実行前と実行後の出力を生成することで、追加のクリーニングが必要かどうかを判断できます。または、財務部門とマーケティング部門の両方に向けて営業データを準備しているとします。一方はコスト情報を必要としていて、もう一方はアンケート情報を必要としています。Tableau Prep では、営業データに対して行ったデータ準備を両方の出力に活用して、各オーディエンス向けに固有のデータを出力できます。
Tableau Prep Builder では次のようなタイプの出力を生成できます。
File |
クリーニングしたデータを次のファイルタイプに出力します。 Tableau データ抽出 (.hyper): Tableau のメモリ内処理データエンジンテクノロジー用に最適化された抽出ファイル。Tableau Desktop など、他の Tableau 製品での分析に役立ちます。 カンマ区切り値 (.csv): サードパーティとデータを共有するときに役立ちます。 Microsoft Excel (.xlsx): フローデータを Microsoft Excel スプレッドシートに出力します。 |
パブリッシュされたデータソース |
出力データソースを Tableau Server または Tableau Cloud にパブリッシュします。 その後、パブリッシュされたデータソースに自分または他のユーザーが他の Tableau 製品から接続することで、準備された状態のデータに誰もがアクセスできるようになります。 |
データベーステーブル |
準備したデータをデータベーステーブルに出力し、その後フローが実行されるたびに増分更新または完全更新を使用してデータベーステーブルを更新できます。SQL Server、PostgreSQL、Amazon Redshift などのいくつかのリレーショナルデータベースから選択します。 |
出力を生成する
次の例では、準備したデータソースとして使用できるように .hyper 抽出ファイルを作成してから、Tableau Desktop でそのデータに接続します。
フローの出力を生成する手順は次のとおりです。
- 出力ステップを追加するには、[フロー] ペインでステップを選択し、プラスアイコンをクリックし、[出力] を選択します。出力ファイルには、出力ステップを追加したステップを含め、フロー内でそれまでに適用したデータ準備操作が保持されます。
- [出力] ペインで、次のように出力を保存します。
- 出力の保存先: ファイル
- 名前: 出力ファイルの名前を指定します。
- 場所を指定します。
メモ: フローの入力と出力の接続では、場合によってネットワークのディレクトリ内のデータベースまたはファイルに接続する必要があります。その場合、アクセスを許可するディレクトリを許可リストに登録する必要があります。 - 出力タイプを選択します (Tableau データ抽出、Microsoft Excel ファイル、または CSV ファイル)。デフォルト出力タイプである Tableau データ抽出 .hyper ファイルは、Tableau Desktop でのパフォーマンス用に最適化されていることに注意してください。
- 新しい出力テーブルを作成するか、既存のテーブルを更新するかを選択します。
- [フローの実行] を選択します。
フローを実行すると、変更がデータセット全体に適用されます。フローを実行すると、Tableau データソース (.tds) と選択した出力タイプのファイルが生成されます。
Tableau Desktop から出力ファイルに接続すると、クリーニングして準備したデータが [データ ソース] ページのメタデータグリッドとデータグリッド、またはワークシートの [データ] ペインに表示されます。
データを分析する
Desktop で .hyper ファイルを開くと、クリーニングして準備したデータが [データ ソース] ページに表示されます。
ビジュアライゼーションでデータを分析するには、新しいワークシートを開きます。実行したデータ準備タスクの結果は [データ] ペインのフィールドに表示されます。たとえば、前の単元では、[売上] フィールドの値を修正し、データ型を数値に変更しました。
変更は出力データに保存されたため、Tableau Desktop の [データ] ペインに表示されています。[売上] は [テーブル] の下の [メジャー] エリアに連続するフィールドとして正しくリストされています。
フィールドをワークシートの行と列にドラッグすると、ダッシュボードで使用するビューの作成を開始できます。この例では、毎月の売上が地域と年ごとに表示されます。Tableau Prep Builder でユニオンを使用して地域データを組み合わせたため、すべての地域の売上データを 1 つのビューで見ることができます。
フローをパブリッシュしてデータを最新に保つ
フロー出力をローカルファイルとして保存するのに加えて、自分がパブリッシュパーミッションを持つ Tableau Server または Tableau Cloud にフロー出力をデータソースとしてパブリッシュできます。
Tableau Prep Builder の [サーバー] メニューから Tableau サイトにサインインし、出力ステップの [出力] ペインで出力ファイルの名前とプロジェクトの場所を指定します。
パブリッシュした出力は Tableau データ抽出 (.hyper) で、適切なパーミッションを持つサイトユーザーはそれを使用してデータに関する質問に答えるためのビューを作成できます。
フロー出力をデータソースとしてパブリッシュした後、それを最新に保つ必要があります。そのためには、フローが変更されるたびに Tableau Prep Builder からフロー出力を手動で再パブリッシュするか、Tableau Cloud または Tableau Server にフローをパブリッシュして、そこから手動でフローを実行することができます。
あるいは、Tableau Cloud または Tableau Server にフローをパブリッシュした後に、スケジュールに従ってフローを実行してフロー出力を更新することもできます。スケジュールに従ってフローを実行するには、Tableau Cloud と Tableau Server 向けの Data Management Add-on のコンポーネントである Tableau Prep Conductor が有効になっている必要があります。
Tableau Server または Tableau Cloud の個別ライセンス機能である Tableau Prep Conductor では、適切なパーミッションを持つユーザーが追加機能を使用できます。Tableau Prep Conductor が有効になっていると、出力ファイルではなくフローファイル (.tfl) 自体を Tableau Server または Tableau Cloud にパブリッシュして、スケジュールに従って自動的にフローを実行し、出力を更新できるため、管理者やエンドユーザーは常に最新のデータソースファイルにアクセスできます。
Tableau Prep Conductor
Tableau Prep Conductor ではスケジュールに従ってフローを実行する他にも、スケジュールされたフロー実行の失敗と成功の通知やアラートを設定してフローのステータスをモニタリングできます。
Tableau Cloud または Tableau Server でフローをスケジュールする手順は次のとおりです。
- サーバーにサインインし、[接続] をクリックします。
- サーバーメニューで [フローのパブリッシュ] を選択します。
- サーバープロジェクト名とフロー名を指定し、[パブリッシュ] をクリックします。
- Tableau Cloud または Tableau Server 環境が表示されたら、[探索] | [すべてのフロー] に移動します。
- 目的のフローを選択し、[スケジュールされたタスク] タブをクリックしてから、[新しいタスク] をクリックします。
-
[単一のタスク] または [リンクされたタスク] のいずれかを選択します。
- スケジュールを選択し、[タスクの作成] をクリックします。
スケジュールに従ったフローの実行などのタスクをスケジュールするときには、事前設定された時刻のリストから選択します。スケジュールを選択すると、それに従って Tableau Prep Conductor によってデータフローが実行されます。Tableau Cloud または Tableau Server のフローのページの [スケジュールされたタスク] タブには、フロー実行が成功したか失敗したかと、最後および次回のスケジュール実行の日時が表示されます。
フロー所有者は、成功したフロー実行のスケジュールされたタスクに関するメール通知を自分自身や他の個人ユーザーが受信するように登録できます。このメールには Tableau 環境内のデータへのリンクが含まれています。または、Excel や CSV ファイルを添付してフロー実行の詳細を含めることもできます。
このモジュールでは、Tableau Prep Builder を使用してデータに接続してデータを準備する方法、準備したデータを出力する方法、データを最新の状態に保つ方法を学習しました。