データの準備

学習の目的

この単元を完了すると、次のことができるようになります。
  • データフローを使用してデータを使用するために準備する方法を説明する。
  • データセットレシピを使用してデータを準備する。

データの準備の概要

必要なデータをすべて抽出し、2 つの新しいデータセットを作成しました。SIC Descriptions データセットには、CSV ファイルから抽出されたデータが含まれています。Opportunities_with_Accounts_and_Users データセットには、Salesforce 組織のオブジェクトから抽出されたデータが含まれています。最後の作業は、このデータを準備して、1 つのデータセットに結合することです。

現在、データジャーニーでは次の位置にいます。もう少しで完了です!

外部データの結合のデータセットレシピが強調表示されているデータジャーニーマップ

データフローでのデータの準備

前の単元では、データフローを使用して Salesforce オブジェクトからデータを抽出しました。そのときに準備も少し行われたことを覚えているでしょうか? データフローでは、商談データに取引先項目とユーザ項目が追加され、データセットが作成されます。

そのため、データフローは、抽出ツールであるばかりではなく、優れたデータ準備ツールでもあります。データフローを使用して、データを絞り込んだり、項目を追加および削除したり、別のデータセットからの行を更新したり、データに計算を追加したりできます。ただし、データを準備するには、データフローエディタを使用するか、JSON を記述して、データフローに指示を手動で追加する必要があります。これは誰にでもできることではありませんが、試してみたい場合は、「リソース」セクションのリンク先で詳細を参照してください。

ただし、この DTC Electronics の課題では、データセットレシピを使用して、データフローのないデータを準備します。

データセットレシピのデータの準備

ユーザインターフェースツールであるデータプレップを使用して、既存のデータセットからデータを取得して準備し、結果を新しいデータセットに出力するデータセットレシピを作成します。レシピを使用して、複数のデータセットのデータを結合したり、データをバケット化したり、数式項目を追加したり、項目値を変換してデータを整理したりします。対象データセットを作成する前に項目の削除や不要な行の絞り込みを行います。

レシピを作成するには、ソースに対して実行する変換仕様 (ステップ) を指定します。ソースは、1 つ以上のデータセットか、(ここでは説明していませんが) 接続済みオブジェクトにすることができます。レシピを実行すると、これらの変換仕様が適用され、結果が新しい対象データセットに出力されます。

データセットレシピの概要

対象データセットを最新の状態に保つには、レシピを定期的に実行するようにスケジュールできます。

データセットレシピの作成

データセットレシピは、データマネージャで作成、管理します。データマネージャに移動しましょう。

  1. Tableau CRM で、ギアアイコン データマネージャを開くために使用する Wave ギアアイコン をクリックし、[データマネージャ] をクリックします。新しいブラウザタブでデータマネージャが開きます。
  2. データマネージャで、[データフローとレシピ] タブをクリックします。
  3. [データフローとレシピ] タブで、[レシピ] サブタブをクリックします。[レシピ] サブタブに既存のレシピのリストが表示されます。[準備する] タブ
  4. [レシピを作成] をクリックします。
  5. データプレップの歓迎メッセージが開いている場合は閉じます。
  6. [Add Input Data (入力データを追加)] をクリックします。
  7. ベースデータセットとして使用するデータセットを、その名前の横にあるチェックボックスをクリックして選択します。このレシピでは、Opportunities_with_Accounts_and_Users をクリックします。ベースデータセットをどれにすべきかわからない場合は、準備するデータや項目を追加するデータがどのデータベースに含まれているかを考えます。それがベースデータセットです。この場合は、Opportunities_with_Accounts_and_Users データセットです。
  8. [次へ] をクリックします。レシピがデータプレップで開きます。
レシピを初めて作成する場合は、ここで一度止まって、操作に役立つコツをいくつか見ていきましょう。

デフォルトでは、レシピのステップ (ノードと呼ばれる) が上部に表示され、選択したノードの詳細とデータのリアルタイムプレビューが下部に表示されます。すべてのレシピは入力ノードから始まります。  レシピのプレビューには、最大で 100 列を表示できます。

データセットレシピのプレビュー

ここに多数の列がある場合は、[列] タブに切り替えて列を検索したり、不要な列を非表示にしたりできます。いくつかの列を非表示にして、プレビューをすっきりさせましょう。

  1. [列] タブをクリックします。レシピ内の列のリストビューが表示されます。データセットレシピのプレビューの編集
  2. [Account ID (取引先 ID)] 列を非表示にするには、列を選択し、[プレビュー] セクションと [列] セクションの上にある [非表示] ボタン (ノード名の横にある [非表示] ボタン) をクリックします。非表示の列は表示される列の下にリストされます。
  3. 今は、次の列が必要ないため、それぞれを非表示にします。
    • AccountId.BillingCountry
    • AccountId.BillingCity
    • Owner ID (所有者 ID)
    • Created Date (作成日)
    • Opportunity ID (商談 ID)
  4. [プレビュー] タブをクリックします。非表示にした列がプレビューに含まれなくなっています。

これで、レシピが少しすっきりしました。ベース商談データセットに産業区分の説明データを追加する作業に戻りましょう。

データセットレシピのデータの追加

他の任意のデータセットから、レシピ内の既存のデータに列を追加できます。Tableau CRM によって新しいデータセットの適切な行に適切な値が追加されるように、データを「一致」させる必要があります。たとえば、SIC Description データセットには、産業コード項目があり、レシピ内の取引先の産業コード項目と一致させます。「一致」させる項目は、結合キーと呼ばれます。では、実際に確認してみましょう。
  1. データプレップで、Opportunities_with_Accounts_and_Users 入力ノードの横にあるプラスボタン (入力ノードの横にあるプラスボタン) をクリックします。
  2. [結合] を選択します。
  3. SIC Descriptions データセットをクリックします。これが、追加する列が含まれる「ルックアップ」データセットです。
  4. [次へ] をクリックします。[結合] ウィンドウには 4 つの主要セクションがあります。種別、列、その他の設定が定義されている [結合] 画面。[結合種別] セクション (1) では、結合がルックアップであるか別の種別であるかを制御できます。[結合キー] セクション (2) では、データの照合方法を選択します。Tableau CRM で一致候補が検出されると、結合キーが選択されます。一致が検出されない場合、レシピとルックアップデータセットの最初の項目が選択されます。この選択を保持することも、異なるキーを選択することもできます。キーペアは 5 つまで使用できます。[列] セクション (3) では、データを追加した後にレシピに含める列を選択します。非表示にした列とルックアップデータセットからの列は選択されません。[プレビュー] セクション (4) には、含めた列のデータのプレビューが表示されます。
  5. [結合キー] セクションで、[AccountId.SIC] ルックアップキーと [SIC Code (産業コード)] ルックアップキーが選択されていることを確認します。異なるキーが選択されている場合は、各ルックアップキー項目をクリックして正しいキーを選択します。
  6. [列] セクションの下部で [SIC Description (産業区分の説明)] 列が選択されていることを確認します。ルックアップデータセットから追加する必要があるのはこの列だけです。
  7. [適用] をクリックします。[結合] ノードと [SIC Description (産業区分の説明)] 入力ノードがレシピに追加されます。データセットレシピの新しい項目

同じ方法で、引き続き他のデータセットからの列も追加できます。

レシピの出力の設定

出力ノードを追加して、期待どおりにレシピを実行できるようにしましょう。新しいデータセット用のアプリケーションを選択し、最終的に含める項目を選択します。 

  1. [結合] ノードの横にあるプラスボタン (入力ノードの横にあるプラスボタン) をクリックします。
  2. [出力] を選択します。 出力ノードの設定。設定は左側、プレビューと列は右側にあります。
  3. 出力ノードを設定します (1)。
    • データセットの表示ラベル: Opportunities with SIC Descriptions (産業区分の説明を含む商談)
    • データセット API 参照名: Opportunities_with_SIC_Descriptions
    • アプリケーションの場所: Sales Performance Datasets (営業パフォーマンスデータセット)
  4. 列のリスト (2) で、プレビューから非表示にした列は選択されていないことに注意してください。次の列を選択して、対象データセットに含めます。
    • Account ID (取引先 ID)
    • AccountId.BillingCountry
    • AccountId.BillingCity
    • Owner ID (所有者 ID)
    • Created Date (作成日)
    • Opportunity ID (商談 ID)
  5. 列のリストで、[AccountId.SIC] 列と [SIC Code (産業コード)] 列は両方選択されています。これらの列はルックアップキーであるためです。必要なのはどちらか一方のみであるため、リストの下にある [SIC Code (産業コード)] を非表示にします。
  6. [適用] をクリックします。
  7. [保存] をクリックします。
  8. レシピ名を入力します。このレシピは「Opportunities with SIC Descriptions (産業区分の説明を含む商談)」という名前にします。
  9. [データマネージャに戻る] をクリックします。

現時点では、レシピで必要な作業は完了しましたが、ここで実行できるデータ準備は他にも多数あります。いくつかを試してみたい場合は、「リソース」セクションで詳細を参照してください。

データセットレシピの実行

レシピを実行すると、追加したステップが実行され、対象データセットが作成されます。また、レシピを定期的に実行するようにスケジュールすることによって、対象データセットを最新の状態に保つこともできます。データセットを作成しましょう。

  1. データマネージャで、[データフローとレシピ] タブをクリックします。
  2. [データフローとレシピ] タブで、[レシピ] サブタブをクリックします。
  3. レシピを実行するには、[Opportunities with SIC Descriptions (産業区分の説明を含む商談)] レシピの右側にある データマネージャのデータフローメニューボタン をクリックし、[今すぐ実行] を選択します。データマネージャの上部に実行中であることを示す緑色のバナーが表示されます。
  4. データマネージャのデータフローメニューボタン を再度クリックし、[スケジュール] を選択します。
  5. 各週日の朝、データフロー実行後に実行されるようにレシピをスケジュールします。次の設定を選択し、週日午前 2 時にデータフローを 24 時間ごとに実行するようにスケジュールします。
    1. スケジュール基準: 時間
    2. 開始: 2:00 am
    3. 次の間隔で実行: 24 時間
    4. 次の曜日を選択:
  6. [保存] をクリックします。レシピがスケジュールされます。

レシピジョブの監視と新しいデータセットの検証

再びバックグラウンドで、Tableau CRM によってレシピのジョブが作成されます。データマネージャの [監視] タブで進行状況を確認できます。

また、新しいデータセットを開いてすべての項目があることを確認することもお勧めします。

  1. データマネージャの左側で、[データ] タブをクリックします。
  2. Opportunities with SIC Descriptions データセットの右側にある データマネージャのデータフローメニューボタン をクリックして [調査] を選択します。このデータセットが表示されていない場合は、ブラウザを更新します。
  3. [横棒] で、[グループを追加] (+) ボタンをクリックします。ディメンションのリストに [SIC Description (産業区分の説明)] 項目が表示されます。

お疲れ様でした。

これで完了です。対象となるデータとその場所を特定し、外部データと Salesforce データの両方を Tableau CRM に取り込みました。そして、それらを結合してクリーンアップし、必要な項目がすべて揃っていて、すぐに使用できる 1 つのデータセットを作成しました。

どこまで到達したか見てみましょう。

ジャーニーの最後に達したことを示すデータジャーニーマップ。これで完了です。
無料で学習を続けましょう!
続けるにはアカウントにサインアップしてください。
サインアップすると次のような機能が利用できるようになります。
  • 各自のキャリア目標に合わせてパーソナライズされたおすすめが表示される
  • ハンズオン Challenge やテストでスキルを練習できる
  • 進捗状況を追跡して上司と共有できる
  • メンターやキャリアチャンスと繋がることができる