Découverte des garde-fous et des modèles de confiance d’Agentforce
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Décrire les garde-fous de la plate-forme
- Décrire les garde-fous Agentforce
- Expliquer comment personnaliser des garde-fous Agentforce
- Expliquer les modèles de confiance utilisés pour créer des agents chez Salesforce
Les garde-fous, des outils pour assurer la confiance
L’IA évolue rapidement. Face à des changements aussi rapides, il est naturel de ressentir une certaine anxiété. Chez Salesforce, notre équipe produit et notre Bureau pour une utilisation éthique et humaine (OEHU) ont tout à fait conscience qu’il est impératif de maintenir la confiance envers nos produits. Voici comment ils s’attaquent aux risques et aux préoccupations liés à l’IA agentique :
- Ils identifient les contrôles nécessaires à la création d’un agent fiable
- Ils élaborent une stratégie de test
- Ils ajoutent des garde-fous éthiques aux produits
- Ils fournissent de meilleures lignes directrices éthiques à nos clients
Le fait d’intégrer ces garde-fous à nos produits et d’établir des lignes directrices éthiques claires aide les entreprises à utiliser la technologie d’IA de manière responsable. Ainsi, tout demeure sûr et fiable pour l’ensemble des utilisateurs.
Explorons tout ceci de manière un peu plus détaillée, en commençant par les garde-fous de la plate-forme, qui fournissent des contrôles globaux pour l’ensemble de nos produits.
Garde-fous de la plate-forme
Salesforce comprend un ensemble complet de politiques, de lignes directrices et de protocoles conçus pour garantir un fonctionnement sûr, éthique et conforme de la plate-forme. Ces garde-fous comprennent les éléments suivants :
- La politique d’utilisation acceptable (PUA) : il s’agit de règles générales relatives à l’utilisation des services Salesforce par les clients, interdisant les activités susceptibles de nuire à la plate-forme ou à ses utilisateurs.
- La politique d’utilisation acceptable de l’IA (PUA IA) : il s’agit de règles spécifiques relatives à l’utilisation des technologies d’IA de Salesforce par les clients, garantissant une utilisation responsable de nos produits.
-
Les politiques de confinement des modèles : il s’agit de règles claires sur l’utilisation des modèles IA. Ces règles garantissent que les modèles IA sont utilisés dans le respect de limites claires afin d’éviter qu’ils ne soient mal utilisés ou qu’ils n’aient des effets inattendus.
Ces contrôles créent un cadre qui maintient l’intégrité, la sécurité et les normes éthiques de la plate-forme. Par exemple, la PUA stipule que vous ne pouvez pas utiliser la plate-forme pour envoyer des spams ou des e-mails d’hameçonnage. La PUA IA stipule que l’IA ne peut pas prendre de décisions importantes ou de nature juridique sans qu’un individu prenne la décision finale. Les politiques de confinement des modèles peuvent limiter les types de données auxquelles un modèle IA peut accéder afin d’éviter les fuites de données ou leur utilisation abusive.
Garde-fous Agentforce
Les garde-fous Agentforce sont un ensemble de règles, de lignes directrices et de meilleures pratiques conçues pour un cas d’utilisation métier, un produit ou une solution Cloud Salesforce spécifique, et pour s’assurer que les agents respectent les lois et les normes locales. Agentforce inclut des garde-fous éthiques pour minimiser les hallucinations de l’IA, ainsi que des garde-fous de sécurité pour prévenir les menaces et les attaques malveillantes, telles que les injections d’invites.
Type d’agent
Salesforce propose des agents prêts à l’emploi pour des solutions Cloud spécifiques et des cas d’utilisation courants. Les différents types d’agents peuvent avoir leurs propres paramètres et garde-fous visant à définir le comportement de chaque agent. Par exemple, l’agent de service Agentforce (ASA) utilise des instructions de rubrique pour déterminer quand transférer à un représentant une conversation menée par un agent IA. Le type d’agent Représentant du développement des ventes (SDR) dispose de règles d’engagement définies par l’administrateur relatives aux conditions dans lesquelles l’agent peut commencer à travailler sur la piste, ainsi qu’à la manière dont les e-mails de l’agent peuvent être envoyés et à quel moment.
Rubrique, instructions de rubrique et actions
Chaque agent comprend un ensemble de rubriques et d’actions prédéfinies.
Les rubriques sont une catégorie d’actions liées à une tâche particulière à effectuer par les agents. Les rubriques contiennent des actions, qui sont les outils disponibles pour la tâche, et des instructions, qui indiquent à l’agent comment prendre des décisions. Ensemble, les rubriques définissent l’ensemble des capacités que votre agent peut gérer. Salesforce met à disposition une bibliothèque de rubriques standard pour les cas d’utilisation les plus courants.
Les instructions de rubrique définissent des lignes directrices pour le comportement des agents, en leur fournissant le contexte nécessaire pour effectuer leurs tâches de manière efficace. Chaque rubrique est une catégorie d’actions liées à une tâche spécifique, contenant des actions (outils) et des instructions (lignes directrices pour la prise de décision). Les instructions aident les agents à prendre des décisions sur la manière d’utiliser les actions d’une rubrique dans différents cas d’utilisation. Ces instructions sont généralement formulées de la manière suivante : « Toujours… », « Ne jamais… », « Si x, alors y… » ou « Dans un premier temps,… », afin de garantir un comportement clair et cohérent.
Les actions définissent la manière dont les agents accomplissent leurs tâches. Les agents disposent d’une bibliothèque d’actions, qui est un ensemble de tâches qu’ils peuvent effectuer. Par exemple, si un utilisateur demande à un agent de l’aider à rédiger un e-mail, l’agent lance une action qui rédige et révise l’e-mail en l’ancrant dans des données Salesforce pertinentes. Salesforce fournit d’emblée certaines actions, appelées actions standard. L’avantage d’inclure des rubriques et des actions standard par défaut est que votre agent est immédiatement prêt à aider les utilisateurs dans la réalisation de nombreuses tâches courantes.
Personnalisation des garde-fous
Pour bénéficier d’un contrôle plus précis, utilisez des instructions de rubrique d’agent pour établir des limites, spécifier un contexte et définir le comportement des agents. Vous pouvez modifier les instructions d’une rubrique d’agent standard ou créer une rubrique personnalisée de toutes pièces.
Ces garde-fous sont définis par votre administrateur et généralement approuvés par votre direction interne ou vos principaux décideurs. Cela garantit que les lignes directrices font autorité et qu’elles sont en phase avec les valeurs et les exigences de conformité de votre organisation.
Couche de confiance Einstein
Les agents IA sont intégrés à la couche de confiance Einstein, une architecture d’IA sécurisée intégrée nativement à Salesforce.
Conçue pour respecter les standards de sécurité des entreprises, la couche de sécurité vous permet de bénéficier de l’IA générative sans compromettre les données de vos clients. En outre, elle vous permet d’utiliser des données fiables pour améliorer les réponses de l’IA générative.
-
Ancrage des données : la couche de confiance garantit que les invites génératives sont fondées sur des données d’entreprise fiables et enrichies par ces dernières.
-
Rétention zéro : vos données ne sont jamais conservées par un fournisseur LLM tiers.
-
Détection de la toxicité : les réponses potentiellement nuisibles issues de grands modèles de langage sont détectées et signalées.
-
Surveillance de l’IA : les interactions de l’IA sont capturées dans les journaux d’événements, ce qui vous donne une visibilité sur les résultats de chaque interaction utilisateur.
Modèles de confiance des agents
Dans l’ensemble de nos produits, nous implémentons plusieurs modèles de confiance clés, qui sont des conceptions de produits standard conçues pour améliorer la sécurité. Voici quelques exemples.
Modèle de confiance |
Exemple |
---|---|
Réduire les hallucinations. |
Nous utilisons la classification par rubrique pour mapper les saisies utilisateur à des rubriques spécifiques. Cela réduit le risque qu’un agent génère des informations incorrectes ou non pertinentes. |
Limiter la fréquence d’envoi des e-mails générés par les agents. |
Nous limitons la fréquence d’envoi des e-mails générés par les agents afin de ne pas submerger les utilisateurs et de veiller à ce que les communications soient pertinentes. |
Respecter la vie privée des utilisateurs. |
Nous incluons une fonction de désabonnement dans le logiciel CRM, qui permet aux utilisateurs de contrôler la fréquence à laquelle ils reçoivent des communications de la part des agents IA. |
Faire de la transparence un impératif de conception. |
Nous veillons à ce que le contenu généré par l’IA soit présenté comme tel de manière directe et transparente. |
Faciliter les transitions entre l’IA et les individus. |
Nous faisons en sorte que le passage entre un traitement par un agent à un traitement par un individu s’effectue en toute fluidité. Il peut s’agir par exemple de mettre en copie un directeur commercial sur des e-mails générés par l’IA, ou de fournir un tableau de bord pour permettre une supervision humaine. |
Implémentation des meilleures pratiques
Lorsque vous implémentez les garde-fous Agentforce dans votre organisation, suivez ces meilleures pratiques :
Meilleures pratiques |
Exemple |
---|---|
Comprendre les politiques. |
Répertoriez les politiques applicables à votre secteur d’activité, à votre zone géographique et à votre cas d’utilisation. Utilisez-les pour définir les limites de ce que l’agent peut et ne peut pas faire. Elles peuvent aider à déterminer les rubriques qui peuvent être attribuées à votre agent. |
Mettre en place des mesures de sécurité robustes. |
Limitez l’accès des agents aux éléments dont ils ont besoin pour accomplir les tâches qui leur sont attribuées. Assurez-vous que les agents respectent les exigences en matière de protection des données et de réglementation. Utilisez des instructions de rubrique pour définir les règles que l’agent doit suivre. |
Faciliter la supervision humaine. |
Définissez des lignes directrices claires sur la manière et le moment de passer le relais à un représentant humain. Utilisez des instructions de rubrique pour énoncer ces lignes directrices. |
Surveiller et auditer. |
En plus de réaliser des tests initiaux, le fait d’exercer un contrôle continu permet de s’assurer que les agents fonctionnent comme prévu. Utilisez la fonctionnalité Audit Trail (Journal d’audit) de la couche de confiance Einstein pour obtenir des informations détaillées sur les actions et les résultats de l’IA. |
Respecter la vie privée des utilisateurs. |
Utilisez la fonctionnalité de désabonnement pour permettre aux utilisateurs de contrôler la fréquence des communications et de protéger leur vie privée. |
Procéder à des évaluations régulières. |
Effectuez régulièrement des évaluations des biais, de l’explicabilité et de la robustesse afin de surveiller de manière continue la sécurité et la fiabilité. |