Data 360 の一括処理データ変換入門
学習の目的
この単元を完了すると、次のことができるようになります。
- 一括処理データ変換とこの機能を使用する状況を説明する。
- データ変換ノードの種別を挙げる。
- 一括処理データ変換の作成方法を説明する。
一括処理データ変換の概要
Data 360 では、データストリームからデータが取り込まれ、データレークオブジェクト (DLO) に保存されます。DLO は、Data 360 に取り込まれたデータのストレージコンテナです。データ変換を使用すると、1 つ以上の DLO のデータにアクセスして変換し、独自のデータセットを作成できます。データ変換は、データモデルオブジェクト (DMO) に対応付けられたデータを変換する場合にも使用できます。DMO は、Salesforce 内のデータエンティティとそれらのリレーションを構造化して表したものです。
一括処理データ変換を使用する状況
ストリーミングデータ変換が継続的に実行されるのに対し、一括処理データ変換はスケジュールに従って実行されます。一括処理データ変換には、SQL ステートメントに基づくストリーミングデータ変換より多くの機能も用意されています。一括処理データ変換には、リッチなビジュアルエディターがあります。このエディターで複数の DLO のデータを結合したり、関数を使用して計算項目を作成したり、データを複数の DLO に出力したりできます。
一括処理データ変換を使用するのは、複雑なデータ変換を行う必要がある場合や、スケジュールに従ってデータを更新する必要がある場合です。一括処理データ変換では、データを結合、集計、追加できます。また、数式や検索条件を使用することも可能です。
一括処理データ変換が役立つシナリオをいくつか見てみましょう。
-
ダッシュボードのメトリクスを計算する: 取り込んだ未加工データを変換して、集計値などの使用可能な KPI や、勝率、顧客生涯価値などの計算式を作成します。
-
値を標準化する: 取り込んだ値に「Salesforce」、「salesforce.com」、「SFDC」といった表記ゆれがある場合に、単一の統一された値にまとめます。
-
ほかのデータソースで強化する: CRM、給与、使用ログ、顧客レコードなど、複数のソースのデータを結合して、ID 解決や計算済みインサイトなどの Data 360 サービスで使用できるようにします。
一括処理データ変換のしくみ
ビジュアルエディターを使用してノードをドラッグアンドドロップし、必要なデータを作成します。ノードはプロセスの各ステップを表します。ソースデータや対象データを表すこともあれば、データに対して実行するさまざまな操作を表すこともあります。
一括処理データ変換を作成するときに各種のノードを使用すれば、必要とする正確なデータを生成できます。以下は、選択可能なノード種別とその機能を示しています。
ノード種別 |
説明 |
|---|---|
集計 |
関数 (Average、Count、Maximum、Minimum、Stddevp、Stddev、Sum、Unique、Varp、Var) を使用して、データを高い粒度に積み上げ集計します。 |
AI 機能 |
Einstein Studio の AI モデルを使用して予測を行います。 |
追加 |
複数のデータセットの行を結合します。 |
検索条件 |
対象データの不要な行を削除します。 |
入力 |
DLO または DMO にソースデータを保持します。 |
結合 |
ルックアップまたは結合を使用して 2 つの入力ブランチを結合します。各入力ブランチにキー項目が必要です。たとえば、顧客データ入力ノードとチケット販売ノードのそれぞれに顧客 ID 項目が設定されています。 |
出力 |
DLO または DMO に変換済みデータを保持します。 |
変換 |
関数を使用してデータを操作します。このノードを使用して、値の計算、文字列値の変更、日付の書式設定、データ属性の編集、値のバケット化、列の削除、JSON 値の処理などを実行できます。 |
更新 |
キーペアが一致したときに、列の値を別のデータソースのデータと交換します。 |
ハンズオン Challenge: 一括処理データ変換を作成する
ステップ 1: Playground を作成する
このモジュールを受講するためには、Data 360 とサンプルデータを搭載した特別なカスタム Playground (制限時間あり) が必要です。
-
[Playground を作成] をクリックします。
- 新しい組織が Trailhead アカウントに自動的に関連付けられます。
- 組織の失効日をメモしておいて、それまでにこのバッジを完了するようにしてください。
ステップ 2: データストリームを作成する
取引先データと商談データを取り込む前に、それらを Data 360 のデータソースとして設定する必要があります。
- Data Cloud の [Data Streams (データストリーム)] タブに移動して、[New (新規)] をクリックします。
-
[Connected Sources (接続済みソース)] の下にある [Salesforce CRM] をクリックし、[Next (次へ)] をクリックします。
- Salesforce トライアル組織が事前に選択されていることを確認します。[View Bundles (バンドルを表示)] から Sales (営業) データバンドルを選択し、[Next (次へ)] をクリックします。このバンドルには、一括処理データ変換を作成するのに必要なすべてのデータストリームが含まれています。
- 残りの標準項目はすべて空白のままにして [Next (次へ)] をクリックします。
- 次の画面で、[Deploy (リリース)] をクリックします。エラーが発生した場合やデータストリームの作成に時間がかかりすぎる場合は、アクションをキャンセルしてもう一度試します。
ステップ 3: 一括処理データ変換を作成する
次に、データを結合して絞り込み、業種別の大規模売上合計を示す新しい DLO を作成します。
- データレイクオブジェクトを使用して新しい一括処理データ変換を作成します。
-
[Data Transforms (データ変換)] タブをクリックします。
-
[New Transform (新規変換)] をクリックします。
-
[Batch Data Transforms (一括処理データ変換)]、[Next (次へ)] の順に選択します。
-
[Data Lake Objects (データレイクオブジェクト)]、[Next (次へ)] の順に選択します。変換ビルダーが表示されます。
-
[Data Transforms (データ変換)] タブをクリックします。
- Opportunity (商談) オブジェクトを入力データとして追加します。
-
[Add Input Data (入力データを追加)] をクリックします。
-
[Add Input Data (入力データを追加)] テーブルが表示されたら、Opportunity_Home を選択します。
-
[Add Input Data (入力データを追加)] をクリックします。
- [Name (名前)] の横のチェックボックスをオフにします。次の値を選択して [Next (次へ)] をクリックします。
- KQ_Id
- KQ_AccountId
- KQ_OwnerId
- Account
- Owner (所有者)
- Amount (金額)
- 名前
- LeadSource
- KQ_Id
- Opportunity_Home が変換ビルダーのノードとして表示されます。
- Opportunity (商談) ノードに「Filter >30,000 (30,000 超に絞り込み)」という検索条件を追加します。
- Opportunity (商談) ノードの横にあるプラス記号を選択します。
- オブジェクトのリストから、[Filter (検索条件)] を選択します。
-
[Filter 0 (検索条件 0 )] というタイトルの横にある鉛筆アイコンを選択します。
- ノード名を
Filter >30,000(30,000 超に絞り込み) に変更します。
-
[Apply (適用)] をクリックします。
- Opportunity (商談) ノードの横にあるプラス記号を選択します。
- $30,000 を超える商談のみを表示するように検索条件を設定します。
- データプレビューテーブルで、[Filters (検索条件)] の下にある長方形のプラス記号をクリックします。
- 表示されるモーダルで [Amount (金額)] を選択します。
- [演算子] で、[>] を選択します。
- [Numeric value (数値)] に
30000と入力します。句読点や通貨は含めないでください。
-
[Done (完了)] をクリックし、[Apply (適用)] をクリックします。
- Filter >30,000 (30,000 超に絞り込み) が変換ビルダーのノードとして表示されます。
- データプレビューテーブルで、[Filters (検索条件)] の下にある長方形のプラス記号をクリックします。
- Account (取引先) オブジェクトを Filter >30,000 (30,000 超に絞り込み) ノードに結合します。
- Filter >30,000 (30,000 超に絞り込み) ノードのプラス記号をクリックします。
- オブジェクトのリストから、[Join (結合)] を選択します。
- [Select Input Data to Join (結合する入力データを選択)] テーブルで [Account_Home] を選択します。
- Filter >30,000 (30,000 超に絞り込み) ノードのプラス記号をクリックします。
- [Name (名前)] の横のチェックボックスをオフにします。次の値を選択して [Next (次へ)] をクリックします。
- KQ_Id
- Id
- 名前
- 業種
- KQ_Id
- Join (結合) ノードを使用して、Account (取引先) データと Opportunity (商談) データをまとめます。
- Account_Home ノードで [Inner Join (内部結合)] を選択します。
- [Join Keys (結合キー)] で、Filter >30,000 (30,000 超に絞り込み) と Account_Home の下にある長方形をクリックします。
- [Select Join Keys (結合キーを選択)] モーダルで、Filter >30,000 (30,000 超に絞り込み) には [Account (取引先)] を選択します。
- [Account_Home] で ID を選択します。
-
[追加] をクリックします。
- Join (結合) ノードの名前を
Get Accounts Info(取引先情報を取得) に変更します。
-
[Apply (適用)] をクリックします。
- Account_Home ノードで [Inner Join (内部結合)] を選択します。
- Aggregate (集計) ノードを使用して、同じ業種の大規模商談金額をまとめます。
- Get Accounts Info (取引先情報を取得) ノードのプラス記号をクリックします。
-
[Aggregate (集計)] を選択します。
- データプレビューテーブルで、[Aggregates (集計)] の下にあるプラス記号をクリックします。
-
[Sum (合計)]、[Amount (金額)] の順に選択します。
-
[Done (完了)] をクリックします。
- データプレビューテーブルで、[Group Rows (行をグループ化)] の下にあるプラス記号をクリックします。
- モーダルで [Industry (業種)] を選択し、[Apply (適用)] をクリックします。
- Aggregate (集計) ノードの名前を
Total Sales by Industry(業種別売上合計) に変更します。
- Get Accounts Info (取引先情報を取得) ノードのプラス記号をクリックします。
- この一括処理データ変換を使用して、業種別の大規模売上を追跡する新しい DLO を作成します。
- Total Sales by Industry (業種別売上合計) ノードのプラス記号をクリックします。
- オブジェクトのリストから、[Output (出力)] を選択します。
- [Create New and Replace (新規作成および置換)] モードを選択したままにします。
- [Object Name (オブジェクト名)] に
Large Sales by Industry(業種別大規模売上) と入力します。
- [Object Category (オブジェクトカテゴリ)] で [Other (その他)] を選択します。
- [Primary Key (主キー)] で [Account_Home.Industry__c] を選択します。
-
[Apply (適用)] をクリックします。
- Output (出力) ノードの名前を
Large Sales by Industry(業種別大規模売上) に変更します。
- データプレビューテーブルで、どの業種が最大規模の商談につながっているかを確認できます。
- Total Sales by Industry (業種別売上合計) ノードのプラス記号をクリックします。
- 変換ビルダーで [Save (保存)] をクリックします。
- 変換に
Large Sales by Industry(業種別大規模売上) という名前を付けて、[Save (保存)] をクリックします。
- 変換を実行します。
-
[Back to Data Transforms (データ変換に戻る)] をクリックします。
- テーブルで、作成した Large Sales by Industry (業種別大規模売上) という変換を探します。
- 行の末尾にある下矢印をクリックし、[Run Now (今すぐ実行)] を選択します。
- 表示されるモーダルで [Run (実行)] をクリックします。
- 変換が完了するまで待機します。これには数分かかります。
-
[Back to Data Transforms (データ変換に戻る)] をクリックします。

結果をプレビューする
変換が正常に完了したら、[Data Explorer (データエクスプローラー)] に移動し、[Large Sales by Industry (業種別大規模売上)] DLO を開いてデータを点検します。
Challenge を確認
では、作業の結果を確認しましょう。これまでの手順をすべて実行したことを確認し、[Check Challenge to Earn 500 Points (Challenge を確認して 500 ポイントを獲得)] をクリックして次の単元に進みます。
