Data Cloud の非構造化データ入門
学習の目的
このステップを完了すると、次のことができるようになります。
- Data Cloud で非構造化データを定義する。
- 非構造化データによって AI と自動化の戦略をどのように強化できるかを説明する。
- 外部 Blob ストア (Amazon S3 など) からのデータを接続する方法を説明する。
非構造化データとは?
組織が収集するデータは一般に、構造化、半構造化、非構造化の 3 つの形式を取ります。組織が収集する非構造化データの割合は増えていますが、効果的に活用できているのはそのほんの一部です。大量のデータをワークストリームに、特に検索や取得の目的で効果的に統合するのは容易なことではありません。Data Cloud では非構造化データがサポートされているため、その状況を変えることができます。
非構造化データは一貫した特定の形式がないデータであり、一般的なリレーショナルデータベースには簡単に保存できません。構造がないために、特に検索や分析が困難になります。ただし、大規模言語モデル (LLM) などの AI テクノロジーでは、非構造化データを効果的に処理することができます。この機能を利用することで、多くの企業がますます増加する膨大な非構造化データを自社のデータ駆動戦略に組み込んでいます。
非構造化データのよくある形式として、チャットのトランスクリプト、音声ファイルや動画ファイル、メール、法的ドキュメント、その他の大型テキスト (書籍など) が挙げられます。Salesforce の非構造化データの例には、ナレッジ記事やセールスコールのトランスクリプトからのデータなどがあります。
非構造化データを使用して AI と自動化の戦略を強化する
Data Cloud で非構造化データを接続すると、Einstein 生成 AI (プロンプトビルダーと Agentforce)、自動化 (Flow Builder)、分析 (Tableau と CRM Analytics) アプリケーションでお客様中心の成果を実現できます。たとえば、ナレッジ記事データを使用してお客様への応答を生成することでサービス返信のおすすめを向上させたり、過去のメールを使用してパーソナライズされたメッセージを生成するプロンプトテンプレートを作成したりできます。または、Flow Builder と Agentforce を使用して、サービスエージェントがケースの解決に取り組むときや新しいケースを登録するときに類似するケースデータを表示することもできます。
外部 Blob ストアからの非構造化データを接続する
Data Cloud は HTML、TXT、PDF 形式の非構造化データを参照できます (今後のリリースで形式は追加されます)。Data Cloud ではすでに Amazon S3、Azure Blob Storage、Google Cloud Storage からの接続をサポートしているため、これらの接続をすでに設定済みであれば数回のクリックによる設定だけで非構造化データを取り込むことができます。
外部 Blob ストアと Data Cloud の間の接続を作成したら、非構造化データレイクオブジェクト (UDLO) を作成してそれを非構造化データモデルオブジェクト (UDMO) に対応付けることによって Data Cloud で非構造化データを参照できます。
UDLO と UDMO のスキーマは同じであるため、Data Cloud ではこの 2 つのオブジェクト間の項目レベルの対応付けが自動的に作成されます。スキーマについての詳細は Salesforce ヘルプを参照してください。
UDLO と UDMO とのリレーションは 1 対 1 または N 対 1 になります。つまり、各 UDLO は 1 つの UDMO にしか対応付けられませんが、複数の UDLO を 1 つの UDMO に対応付けることができます。例を見てみましょう。
あなたが複数の外部 Blob ストアからのケース記録データを参照しているとします。3 つの異なる UDLO が次の 3 つのソースからのデータを参照しています: CaseRecordingsFromAWSBucket1、CaseRecordingsFromAWSBucket2、CaseRecordingsfromGCS。これらのソースは論理的に同じオブジェクトであるため、個々の UDLO は 1 つの UDMO、CaseRecordings に対応付けられます。
外部 Blob ストアからの非構造化データを Data Cloud に接続すると、システム管理者とユーザーは関連性の高いコンテンツを問題の解決、ケースの管理、Einstein 生成 AI アプリケーション用の効果的なプロンプトの作成に役立てることができます。
Data Cloud を含むカスタム Playground にサインアップする
このプロジェクトを完了するには、Data Cloud とサンプルデータを含むカスタム Playground が必要です。まだ作成していない場合は、このページの上部にある [Playground を作成] ボタンをクリックし、手順に従ってカスタム Playground を作成して Trailhead に接続してください。
カスタム Playground を起動したら、ナレッジ記事からのコンテンツを非構造化データとして取り込むことができます。「Challenge」セクションで [ステップを確認して 100 ポイントを獲得] をクリックして、プロジェクトの次のステップへ進んでください。