Skip to main content

Data Cloud の非構造化データ入門

学習の目的

このステップを完了すると、次のことができるようになります。

  • Data Cloud で非構造化データを定義する。
  • 非構造化データによって AI と自動化の戦略をどのように強化できるかを説明する。
  • 外部 Blob ストア (Amazon S3 など) からのデータを接続する方法を説明する。
メモ

メモ

日本語で受講されている方へ
Challenge は日本語の Trailhead Playground で開始し、かっこ内の翻訳を参照しながら進めていってください。Challenge での評価は英語データを対象に行われるため、英語の値のみをコピーして貼り付けるようにしてください。日本語の組織で Challenge が不合格だった場合は、(1) この手順に従って [Locale (地域)] を [United States (米国)] に切り替え、(2) [Language (言語)] を [English (英語)] に切り替えてから、(3) [Check Challenge (Challenge を確認)] ボタンをクリックしてみることをお勧めします。

翻訳版 Trailhead を活用する方法の詳細は、自分の言語の Trailhead バッジを参照してください。

非構造化データとは?

組織が収集するデータは一般に、構造化、半構造化、非構造化の 3 つの形式を取ります。組織が収集する非構造化データの割合は増えていますが、効果的に活用できているのはそのほんの一部です。大量のデータをワークストリームに、特に検索や取得の目的で効果的に統合するのは容易なことではありません。Data Cloud では非構造化データがサポートされているため、その状況を変えることができます。

非構造化データは一貫した特定の形式がないデータであり、一般的なリレーショナルデータベースには簡単に保存できません。構造がないために、特に検索や分析が困難になります。ただし、大規模言語モデル (LLM) などの AI テクノロジーでは、非構造化データを効果的に処理することができます。この機能を利用することで、多くの企業がますます増加する膨大な非構造化データを自社のデータ駆動戦略に組み込んでいます。

非構造化データのよくある形式として、チャットのトランスクリプト、音声ファイルや動画ファイル、メール、法的ドキュメント、その他の大型テキスト (書籍など) が挙げられます。Salesforce の非構造化データの例には、ナレッジ記事やセールスコールのトランスクリプトからのデータなどがあります。

非構造化データを使用して AI と自動化の戦略を強化する

Data Cloud で非構造化データを接続すると、Einstein 生成 AI (プロンプトビルダーと Agentforce)、自動化 (Flow Builder)、分析 (Tableau と CRM Analytics) アプリケーションでお客様中心の成果を実現できます。たとえば、ナレッジ記事データを使用してお客様への応答を生成することでサービス返信のおすすめを向上させたり、過去のメールを使用してパーソナライズされたメッセージを生成するプロンプトテンプレートを作成したりできます。または、Flow Builder と Agentforce を使用して、サービスエージェントがケースの解決に取り組むときや新しいケースを登録するときに類似するケースデータを表示することもできます。

外部 Blob ストアからの非構造化データを接続する

Data Cloud は HTML、TXT、PDF 形式の非構造化データを参照できます (今後のリリースで形式は追加されます)。Data Cloud ではすでに Amazon S3、Azure Blob Storage、Google Cloud Storage からの接続をサポートしているため、これらの接続をすでに設定済みであれば数回のクリックによる設定だけで非構造化データを取り込むことができます。

外部 Blob ストアと Data Cloud の間の接続を作成したら、非構造化データレイクオブジェクト (UDLO) を作成してそれを非構造化データモデルオブジェクト (UDMO) に対応付けることによって Data Cloud で非構造化データを参照できます。

UDLO と UDMO のスキーマは同じであるため、Data Cloud ではこの 2 つのオブジェクト間の項目レベルの対応付けが自動的に作成されます。スキーマについての詳細は Salesforce ヘルプを参照してください。

UDLO と UDMO とのリレーションは 1 対 1 または N 対 1 になります。つまり、各 UDLO は 1 つの UDMO にしか対応付けられませんが、複数の UDLO を 1 つの UDMO に対応付けることができます。例を見てみましょう。

あなたが複数の外部 Blob ストアからのケース記録データを参照しているとします。3 つの異なる UDLO が次の 3 つのソースからのデータを参照しています: CaseRecordingsFromAWSBucket1、CaseRecordingsFromAWSBucket2、CaseRecordingsfromGCS。これらのソースは論理的に同じオブジェクトであるため、個々の UDLO は 1 つの UDMO、CaseRecordings に対応付けられます。

外部 Blob ストアからの非構造化データを Data Cloud に接続すると、システム管理者とユーザーは関連性の高いコンテンツを問題の解決、ケースの管理、Einstein 生成 AI アプリケーション用の効果的なプロンプトの作成に役立てることができます。

メモ

Data Cloud では、非構造化データをインポートするのではなく、UDMO が外部 Blob ストアから参照します。

Data Cloud を含むカスタム Playground にサインアップする

このプロジェクトを完了するには、Data Cloud とサンプルデータを含むカスタム Playground が必要です。まだ作成していない場合は、このページの上部にある [Playground を作成] ボタンをクリックし、手順に従ってカスタム Playground を作成して Trailhead に接続してください。

メモ

このカスタム Playground は、このバッジの Challenge に対応するよう設計されているため、ほかのバッジでは機能しない可能性があります。使用している Trailhead Playground や特別な Developer Edition 組織が推奨されているものであることを必ず確認してください。

カスタム Playground を起動したら、ナレッジ記事からのコンテンツを非構造化データとして取り込むことができます。「Challenge」セクションで [ステップを確認して 100 ポイントを獲得] をクリックして、プロジェクトの次のステップへ進んでください。

Salesforce ヘルプで Trailhead のフィードバックを共有してください。

Trailhead についての感想をお聞かせください。[Salesforce ヘルプ] サイトから新しいフィードバックフォームにいつでもアクセスできるようになりました。

詳細はこちら フィードバックの共有に進む