データの準備
データの準備の概要
必要なデータをすべて抽出し、2 つの新しいデータセットを作成しました。SIC Descriptions データセットには、CSV ファイルから抽出されたデータが含まれています。Opportunities with Accounts and Users データセットには、Salesforce 組織のオブジェクトから抽出されたデータが含まれています。最後の作業は、このデータを準備して、1 つのデータセットに結合することです。
現在、データジャーニーでは次の位置にいます。もう少しで完了です!

データフローでのデータの準備
前の単元では、データフローを使用して Salesforce オブジェクトからデータを抽出しました。そのときに準備も少し行われたことを覚えているでしょうか? データフローでは、商談データに取引先項目とユーザ項目が追加され、データセットが作成されます。
そのため、データフローは、抽出ツールであるばかりではなく、優れたデータ準備ツールでもあります。データフローを使用して、データを絞り込んだり、項目を追加および削除したり、別のデータセットからの行を更新したり、データに計算を追加したりできます。ただし、データを準備するには、データフローエディタを使用するか、JSON を記述して、データフローに指示を手動で追加する必要があります。これは誰にでもできることではありませんが、試してみたい場合は、「リソース」セクションのリンク先で詳細を参照してください。
ただし、この DTC Electronics の課題では、データセットレシピを使用して、データフローのないデータを準備します。
データセットレシピのデータの準備
ユーザインターフェースツールであるデータプレップを使用して、既存のデータセットからデータを取得して準備し、結果を新しいデータセットに出力するデータセットレシピを作成します。レシピを使用して、複数のデータセットのデータを結合したり、データをバケット化したり、数式項目を追加したり、項目値を変換してデータを整理したりします。対象データセットを作成する前に項目の削除や不要な行の絞り込みを行います。
レシピを作成するには、ソースに対して実行する変換仕様 (ステップ) を指定します。ソースは、1 つ以上のデータセットか、(ここでは説明していませんが) 接続済みオブジェクトにすることができます。レシピを実行すると、これらの変換仕様が適用され、結果が新しい対象データセットに出力されます。

対象データセットを最新の状態に保つには、レシピを定期的に実行するようにスケジュールできます。
データセットレシピの作成
データセットレシピは、データマネージャで作成、管理します。データマネージャに移動しましょう。
- Analytics で、ギアアイコン
をクリックし、[データマネージャ] をクリックします。新しいブラウザタブでデータマネージャが開きます。
- データマネージャで、[データフローとレシピ] タブをクリックします。
- [データフローとレシピ] タブで、[レシピ] サブタブをクリックします。[レシピ] サブタブに既存のレシピのリストが表示されます。
- [レシピを作成] をクリックします。
- データプレップの歓迎メッセージを閉じます。
- [データを選択] をクリックします。
- ベースデータセットとして使用するデータセットを選択します。このレシピでは、[Opportunities with Accounts and Users (取引先とユーザを含む商談)] をクリックします。ベースデータセットをどれにすべきかわからない場合は、準備するデータや項目を追加するデータがどのデータベースに含まれているかを考えます。それがベースデータセットです。この例の場合は、Opportunities with Accounts and Users です。
- [次へ] をクリックします。レシピがデータプレップで開きます。
データセットレシピのデータの追加
- データプレップで、[Opportunities with Accounts and Users (取引先とユーザを含む商談)] 入力ノードの横にあるプラスボタン (
) をクリックします。
- [結合] を選択します。
- SIC Descriptions データセットをクリックします。これが、追加する列が含まれる「ルックアップ」データセットです。
-
[次へ] をクリックします。[結合] ウィンドウには 4 つの主要セクションがあります。
[結合種別] セクション (1) では、結合がルックアップであるか別の種別であるかを制御できます。[結合キー] セクション (2) では、データの照合方法を選択します。Analytics で一致候補が検出されると、結合キーが選択されます。一致が検出されない場合、レシピとルックアップデータセットの最初の項目が選択されます。この選択を保持することも、異なるキーを選択することもできます。キーペアは 5 つまで使用できます。[列] セクション (3) では、データを追加した後にレシピに含める列を選択します。非表示にした列とルックアップデータセットからの列は選択されません。[プレビュー] セクション (4) には、含めた列のデータのプレビューが表示されます。
- [結合キー] セクションで、[AccountId.SIC] ルックアップキーと [SIC Code (産業コード)] ルックアップキーが選択されていることを確認します。異なるキーが選択されている場合は、各ルックアップキー項目をクリックして正しいキーを選択します。
- [列] セクションの下部で [SIC Description (産業区分の説明)] 列が選択されていることを確認します。ルックアップデータセットから追加する必要があるのはこの列だけです。
-
[適用] をクリックします。[結合] ノードと [SIC Description (産業区分の説明)] 入力ノードがレシピに追加されます。
同じ方法で、引き続き他のデータセットからの列も追加できます。
レシピの出力の設定
出力ノードを追加して、期待どおりにレシピを実行できるようにしましょう。新しいデータセット用のアプリケーションを選択し、最終的に含める項目を選択します。
- [結合] ノードの横にあるプラスボタン (
) をクリックします。
-
[出力] を選択します。
- 出力ノードを設定します (1)。
- データセットの表示ラベル: Opportunities with SIC Descriptions (産業区分の説明を含む商談)
- データセット API 参照名: Opportunities_with_Accounts_and_Users
- アプリケーションの場所: Sales Performance Datasets (営業パフォーマンスデータセット)
- 列のリスト (2) で、プレビューから非表示にした列は選択されていないことに注意してください。次の列を選択して、対象データセットに含めます。
- Account ID (取引先 ID)
- AccountId.BillingCountry
- AccountId.BillingCity
- Owner ID (所有者 ID)
- 作成日
- Opportunity ID (商談 ID)
- 列のリストで、[AccountId.SIC] 列と [SIC Code (産業コード)] 列は両方選択されています。これらの列はルックアップキーであるためです。必要なのはどちらか一方のみであるため、リストの下にある [SIC Code (産業コード)] を非表示にします。
- [適用] をクリックします。
- [保存] をクリックします。
- レシピ名を入力します。このレシピは「Opportunities with SIC Descriptions (産業区分の説明を含む商談)」という名前にします。
- [データマネージャに戻る] をクリックします。
現時点では、レシピで必要な作業は完了しましたが、ここで実行できるデータ準備は他にも多数あります。いくつかを試してみたい場合は、「リソース」セクションで詳細を参照してください。
データセットレシピの実行
レシピを実行すると、追加したステップが実行され、対象データセットが作成されます。また、レシピを定期的に実行するようにスケジュールすることによって、対象データセットを最新の状態に保つこともできます。データセットを作成しましょう。
- データマネージャで、[データフローとレシピ] タブをクリックします。
- [データフローとレシピ] タブで、[レシピ] サブタブをクリックします。
- レシピを実行するには、[Opportunities with SIC Descriptions (産業区分の説明を含む商談)] レシピの右側にある
をクリックし、[今すぐ実行] を選択します。データマネージャの上部に実行中であることを示す緑色のバナーが表示されます。
-
を再度クリックし、[スケジュール] を選択します。
- 各週日の朝、データフロー実行後に実行されるようにレシピをスケジュールします。次の設定を選択し、週日午前 2 時にデータフローを 24 時間ごとに実行するようにスケジュールします。
- スケジュール基準: 時間
- 開始: 2:00 am
- 次の間隔で実行: 24 時間
- 次の曜日を選択: 月、火、水、木、金
- [保存] をクリックします。レシピがスケジュールされます。
レシピジョブの監視と新しいデータセットの検証
再びバックグラウンドで、Analytic によってレシピのジョブが作成されます。データマネージャの [監視] タブで進行状況を確認できます。
また、新しいデータセットを開いてすべての項目があることを確認することもお勧めします。
- データマネージャの左側で、[データ] タブをクリックします。
- Opportunities with SIC Descriptions データセットの右側にある
をクリックして [調査] を選択します。このデータセットが表示されていない場合は、ブラウザを更新します。
- [横棒] で、[グループを追加] (+) ボタンをクリックします。ディメンションのリストに [SIC Description (産業区分の説明)] 項目が表示されます。