Data 360 の実装計画を立てる
学習の目的
この単元を完了すると、次のことができるようになります。
- データの品質と構造を評価する。
- 接続方法を決定する。
始める前に
このバッジは「Data 360: データの価値を解き放つ」トレイルの一部です。このトレイルでは、Salesforce Data 360 の戦略的重要性とメリットについて解説します。このバッジでは、Data 360 を適切に実装するための準備方法について学びます。まず、データをどのように分析して、インテグレーションを決定するのかを検討し、次に実装チームを編成する方法を見ていきます。
データ評価
Data 360 は、顧客データをリアルタイムで一元化して拡充し、活用することを目的に設計されています。Agentforce のような AI ソリューションの基盤として、あるいはキャンペーンをパーソナライズする際の基盤としての Data 360 の有効性は、取り込んで使用するデータの質に左右されます。データの質が低ければ、インサイトが示されなかったり、不正確なインサイトが示されたりするため、非効率で、信頼の低下を招く可能性があります。
実装を検討する段階で、選択した最初のユースケースに必要なデータソースの質を検討することが重要です。最新のデータが揃っているのはどのソースか? 各種のソースの一意の識別子は何か? ソースにどのような種類のデータが含まれているか? Data 360 では数式のほか、一括処理変換やストリーミング変換でデータを変換できますが、事前にデータを確認して理解しておけば、時間を節約できます。
データの基本事項についての詳細は、「データ品質」や「Data 360 の一括処理データ変換: クイックルック」を参照してください。
インテグレーションに関する決定
組織は、多様なデータレイクやウェアハウス、システムにデータを保存しています。ユースケースによっては、データの品質や形式だけでなく、Data 360 とどのように統合するかも検討することが重要になります。
データを取り込む
Data 360 にデータを統合する 1 つの方法は、一括処理データ、ストリーミングデータ、リアルタイムデータのいずれかとして取り込むことです。Data 360 は、Salesforce の内部データソースのほか、数百種のサードパーティインテグレーションをサポートしています。データの変換、ガバナンス、管理の目的で一元的なシステムが必要な場合に、この点が役立ちます。
データを取り込むことが適しているのは、次のような場合です。
- データの量が膨大である。
- データがすでに Salesforce に存在するが、複数のクラウドに分散しているため、一元化する必要がある。
- データ品質標準に適合させるために、ソースデータに複雑な変換が必要である。
では、データを一括処理、ストリーミング、リアルタイムのいずれかで取り込む状況を見てみましょう。
- 一括処理: 大量のデータをスケジュールされた間隔で処理でき、時間的な制約がない場合は、一括取り込みを使用します。たとえば、四半期レポートの履歴分析では一括取り込みを実施します。
- ストリーミング: データを継続的に処理する必要があり、多少の遅延が認められる場合は、ストリーミング取り込みを使用します。たとえば、Web サイトの利用状況の監視ではストリーミング取り込みを実施します。
- リアルタイム: 極めて重要で、かつ時間的な制約があるタスクでデータを瞬時に処理する必要がある場合は、リアルタイム取り込みを使用します。たとえば、クレジットカードの不正の検出ではリアルタイム取り込みを実施します。
ゼロコピーで接続する
Snowflake、Google BigQuery、Databricks、Amazon Redshift など、外部のデータウェアハウスやデータレイクのデータに直接アクセスして、クエリを実行したり、活用したりします。データを Data 360 にコピーや複製する必要はありません。この方法は、既存のインテグレーションを維持しつつ、インテグレーションの複雑さを軽減したい場合に役立ちます。
ゼロコピーによる接続は、次の場合に適しています。
- リアルタイムのユースケース
- 既存のデータレイク
ユースケースによっては、なぜ特定の方法が優先されるのか、どのタイミングでデータにアクセスする必要があるのかを明確にしておくことが重要です。たとえば、データをリアルタイムで更新する必要のある場合もあれば、毎日あるいは毎月更新する場合もあります。
データを支える人々
次の単元では、焦点をデータから、そのデータにアクセスする必要がある人々や、実装に関与すべき人々にシフトします。
