Skip to main content

Agentforce のガードレールと信頼パターンを検討する

学習の目的

この単元を完了すると、次のことができるようになります。

  • プラットフォームのガードレールについて説明する。
  • Agentforce のガードレールについて説明する。
  • Agentforce のガードレールをカスタマイズする方法を説明する。
  • Salesforce でエージェントの構築に使用する信頼パターンについて説明する。

ガードレールで信頼を確保する

AI は速いペースで進化しています。AI がこれほど急速に変化すれば、不安を覚えるのも無理はありません。Salesforce では、製品チームと Office of Ethical and Humane Use (OEHU) が製品に対する信頼を維持することが不可欠であることを認識し、以下の方法でエージェント型 AI のリスクと懸念事項に対処しています。

  • 信頼できるエージェントを構築するために必要な対策を特定する。
  • テスト計画を作成する。
  • 製品に倫理的なガードレールを組み込む。
  • お客様に適切な倫理ガイダンスを示す。

こうしたガイドラインを製品に組み込んで、明確な倫理ガイドラインを示せば、企業が AI テクノロジーを責任もって扱い、全員の安全性と信頼性を確保できます。

では、詳細を確認していきましょう。1 つ目は、製品全体に対するグローバルコントロールとなるプラットフォームのガードレールです。

プラットフォームのガードレール

Salesforce には、プラットフォームの安全かつ倫理的で、法規制に準拠した動作を保証することを目的とする一連の包括的なポリシー、ガイドライン、プロトコルが定められています。代表的なガードレールは以下のとおりです。

  • 許容される使用に関するポリシー (AUP): お客様による Salesforce サービスの使用に関する一般的な規則で、プラットフォームやそのユーザーに害悪を及ぼす可能性がある行為を禁じています。
  • AI の許容される使用に関するポリシー (AI AUP): お客様による Salesforce AI テクノロジーの使用に関する一般的な規則で、製品を責任ある方法で使用することを定めています。
  • モデル封じ込めポリシー: AI モデルの使用法に関する明確なルールです。AI モデルを一定の制限内で使用することを規定し、悪用や意図しない影響を防止します。

こうした対策により、プラットフォームの整合性、セキュリティ、倫理的な標準を維持するフレームワークが構築されます。たとえば、AUP には、プラットフォームをスパムやフィッシングに使用できないことが規定されています。AI AUP には、人間が最終的な判断を下さない限り、AI が法的または重要な決定を下せないことが明記されています。モデル封じ込めポリシーでは、AI モデルがアクセス可能なデータの種類を制限して、データの漏洩や悪用を防止します。

Agentforce のガードレール

Agentforce のガードレールは、特定の Salesforce Cloud または製品、ビジネス用途向けに定められた一連のルール、ガイドライン、ベストプラクティスで、エージェントが現地の法令や標準に確実に準拠するようにします。Agentforce には、AI のハルシネーションを最小限に抑える倫理的なガードレールや、プロンプトインジェクションのような脅威や悪意のある攻撃を防ぐためのセキュリティガードレールが設定されています。

「エージェント種別」「トピックとトピックの指示」「アクション」という 3 つのオレンジの円が重なった中心に「信頼」という盾が示されています。

エージェント種別

Salesforce では、特定のクラウドや一般的なユースケース向けの標準エージェントを用意しています。エージェント種別ごとに独自の設定やガードレールでエージェントの動作を定義できます。たとえば、Agentforce サービスエージェント (ASA) 種別は、トピックの指示を使用して、会話を AI エージェントから人間の担当者にエスカレーションする時点を決定します。セールスデベロップメント担当 (SDR) エージェント種別には、エージェントがリードへの対応を開始できる時点や、エージェントからメールを送信できる状況とその方法の条件を示すエンゲージメントルールをシステム管理者が定義できます。

トピック、トピックの指示、アクション

どのエージェントにも、トピックとアクションのセットが事前構築されています。

トピックは、エージェントが成すべき特定のジョブに関連するアクションのカテゴリです。トピックには、ジョブで使用できるツールであるアクションと、エージェントにどのように判断するかを伝える指示がまとめられています。この 2 つを備えたトピックが、エージェントが処理できる機能の範囲を定義します。Salesforce には、一般的なユースケース向けの標準トピックのライブラリが存在します。

トピックの指示は、エージェントの行動のガイドラインを設定し、ジョブを効果的に遂行するために必要なコンテキストを示します。各トピックは、特定のジョブに関連するアクションのカテゴリで、アクション (ツール) と指示 (判断のガイドライン) で構成されます。指示は、さまざまなユースケースにおいて、エージェントがトピックのアクションをどのように使用するか判断できるようにします。こうした指示は概して、「常に…」「決して…」「x の場合は、y…」「最初のステップとして…」などと表現され、動作を明確で一貫性のあるものにします。

アクションは、エージェントが作業をどのように遂行するかです。エージェントにはアクションのライブラリ (エージェントが実行できる一連のジョブ) が存在します。たとえば、ユーザーがエージェントにメールの作成を手伝って欲しいと依頼すると、エージェントはメールのドラフトを作成して推敲するアクションを起動し、関連性の高い Salesforce データでグラウンディングします。Salesforce にはすぐに使える標準アクションが用意されています。デフォルトで標準のトピックやアクションが含まれているメリットは、エージェントがさまざまな一般的なタスクですぐにユーザーをサポートできることです。

ガードレールをカスタマイズする

さらに細かく管理する場合は、エージェントのトピックの指示を使用して境界を定め、コンテキストを設定して、エージェントの動作を定義します。エージェントの標準トピックの指示を変更することや、カスタムトピックをゼロから作成することができます。

これらのガードレールはシステム管理者が管理し、通常は社内のリーダーか主な意思決定者が承認します。このため、ガイドラインは確定的で、組織のバリューやコンプライアンス要件が反映されています。

Einstein Trust Layer

AI エージェントは、Salesforce にネイティブに組み込まれたセキュアな AI アーキテクチャである Einstein Trust Layer に統合されます。

企業のセキュリティ標準を念頭に設計された Trust Layer により、顧客データを侵害することなく、生成 AI を活用できます。また、信頼できるデータを使用して生成 AI の応答を向上させることもできます。

  1. データグラウンディング: Trust Layer で、生成プロンプトが信頼できる会社データでグラウンディングされ強化されます。
  2. データ保持ゼロ: 各自のデータがサードパーティの LLM プロバイダーに保持されることはありません。
  3. 有害検出: 潜在的に有害な LLM 応答を検出してフラグを立てます。
  4. AI 監視: AI のやり取りがイベントログに記録されるため、各ユーザーのやり取りを表示できます。

エージェントの信頼パターン

Salesforce では製品全般に、安全性を向上させるための標準の製品設計である信頼パターンを実装しています。その数例をご紹介します。

信頼パターン

ハルシネーションを軽減する

トピック分類を使用して、ユーザー入力を特定のトピックにマッピングします。このため、エージェントが不正確な情報や関係のない情報を生成するリスクが軽減します。

エージェントがメールを生成する頻度を制限する

エージェントがメールを生成する頻度を制限して、ユーザーを煩わせないようにし、コミュニケーションを有意義なものにします。

ユーザーのプライバシーを尊重する

CRM ソフトウェアにオプトアウト機能を搭載して、ユーザーが AI エージェントからコミュニケーションを受信する頻度を管理できるようにします。

設計の段階から透明性を確保する

AI が生成したコンテンツであることを直接的かつ明白な方法で開示します。

AI から人間へのスムーズな引き継ぎを可能にする

エージェントから人間へのスムーズな引き継ぎを促進します。例として、AI が生成したメールを営業マネージャーにも CC することや、人間が監視するダッシュボードを使用することが挙げられます。

実装のベストプラクティス

組織に Agentforce のガードレールを実装するときは、次のベストプラクティスに従います。

ベストプラクティス

ポリシーを理解する

各自の業界、地域、ユースケースに適用されるポリシーのリストを作成します。これらのポリシーに従って、エージェントが実行できることと実行できないことの境界を設定します。こうすれば、エージェントにどのトピックを割り当てることができるのか判断しやすくなります。

厳格なセキュリティ対策を実施する

エージェントのアクセスを、割り当てられたタスクの遂行に必要な範囲に制限します。エージェントがデータ保護要件や規制要件を遵守していることを確認します。トピックの指示を使用して、エージェントが従うべきルールを設定します。

人間による監視を促進する

人間の担当者に引き継ぐ状況とその方法に関する明確なガイドラインを設定します。トピックの指示を使用して、こうしたガイドラインを明記します。

監視と監査を実施する

初期テストの後も継続的に監視すれば、エージェントが設計どおり動作していることを確認できます。Einstein Trust Layer の監査履歴機能を使用して、AI のアクションや結果に関する詳細なインサイトを取得します。

ユーザーのプライバシーを尊重する

オプトアウト機能を使用して、ユーザーがコミュニケーションの頻度を管理し、プライバシーを確保できるようにします。

定期的に評価を実施する

バイアス、説明可能性、堅牢性の評価を定期的に実施して、継続的な安全性と信頼性を監視します。

リソース

Salesforce ヘルプで Trailhead のフィードバックを共有してください。

Trailhead についての感想をお聞かせください。[Salesforce ヘルプ] サイトから新しいフィードバックフォームにいつでもアクセスできるようになりました。

詳細はこちら フィードバックの共有に進む