Skip to main content

データの準備

学習の目的

この単元を完了すると、次のことができるようになります。

  • データ使用の準備にどのようにレシピを使用できるかを説明する。
  • レシピを使用してデータを準備する。

データの準備の概要

必要なデータをすべて抽出し、2 つの新しいデータセットを作成しました。SIC Descriptions データセットには、CSV ファイルから抽出されたデータが含まれています。Opportunities_with_Accounts_and_Users データセットには、Salesforce 組織のオブジェクトから抽出されたデータが含まれています。最後の作業は、このデータを準備して、1 つのデータセットに結合することです。

レシピでデータを準備する

Salesforce オブジェクトデータを抽出する際にレシピを紹介しましたが、実際に使用するのはデータの準備フェーズです。 

レシピを作成するには、ソースに対して実行する変換仕様 (ステップ) を指定します。ソースは、1 つ以上のデータセットまたは接続されたオブジェクトにすることができます。レシピを実行すると、この変換仕様が適用され、結果が新しい対象データセットに出力されます。

対象データセットを最新の状態に保つには、レシピを定期的に実行するようにスケジュールできます。

レシピを作成する

Salesforce オブジェクトを抽出したときの手順と同様に、Opportunities_with_Accounts_and_Users でデータセットレシピを作成し、産業区分の説明と結合できるようになりました。ここで、Opportunities_with_Accounts_and_Users は「ベースデータセット」と呼ばれるものです。これは、項目を追加して準備したいデータが含まれているデータセットです。 

  1. [データマネージャー] の左側のペインで、[レシピ] をクリックします。
  2. [新規レシピ] をクリックします。
  3. [Add Input Data (入力データを追加)] をクリックします。
  4. データセットのみが表示されるように、[外部接続オブジェクト][Salesforce オブジェクト] の選択を解除します。データセット Opportunities_with_Accounts_and_Users をクリックします。
  5. [次へ] をクリックします。レシピがデータプレップで開きます。

入力ノードをクリックすると、選択したデータの [プレビュー] が表示されます。[プレビュー] には、デフォルトでデータが最大 2000 行表示されます。

Opportunities_with_Accounts_and_Users データセットのプレビューが表示されているレシピエディター

レシピ列を非表示にする

データセットに多数の列がある場合は、[列] タブに切り替えて列を検索したり、不要な列を非表示にしたりできます。いくつかの列を非表示にして、プレビューをすっきりさせましょう。

  1. [Columns (列)] タブをクリックします。レシピ内の列のリストビューが表示されます。
    Opportunities_with_Accounts_and_Users データセットの列が表示されている、レシピエディターのデータセットプレビューの [列] リスト
  2. [Account ID (取引先 ID)] 列を非表示にするには、列を選択し、[プレビュー] セクションと [列] セクションの上にある [非表示] ボタン () をクリックします。非表示の列は表示される列の下にリストされます。
  3. 今は、次の列が必要ないため、それぞれを非表示にします。
    • 国(請求先)
    • 市区郡(請求先)
    • 所有者 ID (API 参照名の Account.OwnerId を参照)
    • Created Date (作成日)
    • Opportunity ID (商談 ID)
  4. [プレビュー] タブをクリックします。非表示にした列がプレビューに含まれなくなっています。

これで、レシピが少しすっきりしました。ベース商談データセットに産業区分の説明データを追加する作業に戻りましょう。

レシピでデータセットを結合する

商談オブジェクト、取引先オブジェクト、ユーザーオブジェクトを 1 つのデータセットに組み合わせたときに確認したように、データソースをまとめるには、オブジェクト間で項目を一致させる必要があります。産業区分の説明の産業コードと取引先の産業コード項目が一致するため、ここでの結合キーは SIC コードになります。では、レシピで結合してみましょう。

  1. データプレップで、Opportunities_with_Accounts_and_Users 入力ノードの横にあるプラスボタン (+) をクリックします。
  2. [結合] を選択します。
  3. SIC Descriptions データセットをクリックします。これが、追加する列が含まれる「ルックアップ」データセットです。
  4. [次へ] をクリックします。[結合] ウィンドウが表示されます。このウィンドウは前の単元にも出てきました。

CRM Analytics で一致候補が検出されると、結合キーが選択されます。一致が検出されない場合、レシピとルックアップデータセットの最初の項目が選択されます。この選択を保持することも、異なるキーを選択することもできます。キーペアは 5 つまで使用できます。

[列] タブで、データを追加した後にレシピに含める列を選択します。非表示にした列とルックアップデータセットからの列は選択されません。  [プレビュー] タブに、含めた列のデータのプレビューが表示されます。

この場合は、CRM Analytics で正しい結合キーが選択されていません。

  1. [結合キー] セクションで、事前選択されている値をクリックして更新します。
    • Opportunities_with_Accounts_and_Users: 産業コード
    • 産業区分の説明: 産業コード
  2. [追加] をクリックします。
  3. [適用] をクリックします。[結合] ノードと [産業区分の説明] 入力ノードがレシピに追加されます。

同じ方法で、引き続き他のデータセットからの列も追加できます。

レシピの出力の設定

レシピに含める最終的な項目を選択し、出力ノードを追加して、期待どおりにレシピを実行できるようにしましょう。. 

  1. [列] タブを見ると、非表示の列がすべてレシピに含まれています。また、[SIC Code (産業コード)] が Account.SicSICDescrip.SIC_Code として二度表示されています。どちらもルックアップキーであるためです。必要なのはどちらか一方のみであるため、リストの下にある [SIC Code (産業コード)] を非表示にします。
    出力から除外する [SIC Code (産業コード)] が選択解除されている、レシピエディターのデータセットプレビューの [列] リスト
  2. [適用] をクリックします。
  3. [結合] ノードの横にあるプラスボタン () をクリックします。
  4. [出力] を選択します。
  5. 出力ノードを設定します。
    1. データセットの表示ラベル: Opportunities with SIC Descriptions (産業区分の説明を含む商談)
    2. データセット API 参照名: Opportunities_with_SIC_Descriptions
    3. アプリケーションの場所: Sales Performance Datasets (営業パフォーマンスデータセット)
  6. [列] タブに [SIC Code (産業コード)] が 1 つのみ表示されています。
  7. [適用] をクリックします。
  8. [保存] をクリックします。
  9. レシピ名を入力します。このレシピは「Opportunities with SIC Descriptions (産業区分の説明を含む商談)」という名前にします。
  10. [データマネージャーに戻る] をクリックします。

現時点では、レシピで必要な作業は完了しましたが、ここで実行できるデータ準備は他にも多数あります。いくつかを試してみたい場合は、「リソース」セクションで詳細を参照してください。

レシピを実行する

レシピを実行すると、追加したステップが実行され、対象データセットが作成されます。また、レシピを定期的に実行するようにスケジュールすることによって、対象データセットを最新の状態に保つこともできます。データセットを作成しましょう。

  1. データマネージャーで、[レシピ] タブをクリックします。
  2. レシピを実行するには、[Opportunities with SIC Descriptions (産業区分の説明を含む商談)] レシピの右側にある をクリックし、[今すぐ実行] を選択します。データマネージャーの上部に実行中であることを示す緑色のバナーが表示されます。
  3. ドロップダウンメニューボタン を再度クリックして、[スケジュール] を選択します。
  4. 各週日の朝、データフロー実行後に実行されるようにレシピをスケジュールします。次の設定を選択し、週日午前 2 時にデータフローを 24 時間ごとに実行するようにスケジュールします。
    • スケジュール基準: 時間
    • 開始: 2:00 am
    • 次の間隔で実行: 24 時間
    • 次の曜日を選択: 月、火、水、木、金
      [Opportunities with SIC Descriptions (産業区分の説明を含む商談)] のスケジュールを示す [スケジュール] ダイアログ
  5. [保存] をクリックします。レシピがスケジュールされます。

レシピジョブの監視と新しいデータセットの検証

バックグラウンドで、CRM Analytics によってレシピのジョブが作成されます。データマネージャーの [監視] タブで進行状況を確認できます。

また、新しいデータセットを開いてすべての項目があることを確認することもお勧めします。

  1. データマネージャーで、[データアセット] タブをクリックします。
  2. Opportunities with SIC Descriptions データセットの右側にある をクリックして [Explore (調査)] を選択します。このデータセットが表示されていない場合は、ブラウザーを更新します。
  3. [横棒] で、+ ボタンをクリックします。リストに [産業区分の説明] 項目が表示されます。

お疲れさまでした。

これで完了です。対象となるデータとその場所を特定し、外部データと Salesforce データの両方を CRM Analytics に取り込みました。そして、それらを結合してクリーンアップし、必要な項目がすべて揃っていて、すぐに使用できる 1 つのデータセットを作成しました。

リソース

無料で学習を続けましょう!
続けるにはアカウントにサインアップしてください。
サインアップすると次のような機能が利用できるようになります。
  • 各自のキャリア目標に合わせてパーソナライズされたおすすめが表示される
  • ハンズオン Challenge やテストでスキルを練習できる
  • 進捗状況を追跡して上司と共有できる
  • メンターやキャリアチャンスと繋がることができる