Augmentation des agents et des invites avec des connaissances commerciales pertinentes
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Expliquer pourquoi la génération augmentée de récupération (RAG) améliore la précision et la pertinence des réponses du LLM dans les modèles d’agent et d’invite
- Décrire comment configurer et utiliser la RAG dans votre organisation Salesforce
Qu’est-ce que la génération augmentée de récupération ?
La génération augmentée de récupération (RAG) est un moyen courant d’ancrer les requêtes d’invite avec des modèles de langage de grande taille (LLM). L’ancrage ajoute des connaissances spécifiques au domaine ou des informations sur le client à l’invite, donnant au LLM du contexte pour répondre plus précisément à une question ou à une tâche.
Concrètement, la RAG permet de réaliser les actions suivantes :
-
Récupérer des informations pertinentes provenant d’un magasin de connaissances contenant du contenu structuré et non structuré.
-
Améliorer l’invite en combinant ces informations avec l’invite d’origine.
- Avec l’invite augmentée, le LLM va générer une réponse.
De nombreux LLM sont généralement entraînés sur Internet sur du contenu statique et disponible publiquement. La RAG ajoute des informations spécifiques au domaine pour aider les LLM à fournir de meilleures réponses à vos questions. Grâce à la RAG, vous pouvez extraire des informations précieuses de toutes sortes de contenus, tels que des réponses du service client, des requêtes, des articles Knowledge, des transcriptions de conversations, des réponses à des appels d’offres, des e-mails, des notes de réunion, des questions fréquemment posées (FAQ) et plus encore.
Solutions Agentforce à démarrage rapide avec le générateur Agentforce et la bibliothèque de données Agentforce
Le générateur Agentforce vous permet de facilement choisir des articles Knowledge ou charger des fichiers qui seront récupérés par les agents en quelques clics. Il suffit de sélectionner ou de créer une bibliothèque de données Agentforce, qui est une bibliothèque de contenu que l’agent utilise pour répondre aux questions. Sélectionnez la source à partir de laquelle la bibliothèque de données extrait les informations pertinentes : la base Salesforce Knowledge ou des fichiers que vous chargez (texte, HTML et PDF). Au moment de l’exécution, votre agent utilise ces informations pour ancrer les invites LLM et produire des réponses améliorées, plus précises et plus pertinentes.
Lorsque vous ajoutez une bibliothèque de données, vous créez automatiquement tous les éléments nécessaires à une solution fonctionnelle, basée sur la RAG. Si vous le souhaitez, vous pouvez ensuite personnaliser ces éléments pour affiner les solutions de RAG en fonction de vos cas d’utilisation. Nous reviendrons là-dessus plus tard.
Obtention de connaissances commerciales pertinentes auprès des agents
Les agents acquièrent des connaissances pertinentes à partir d’une bibliothèque de données en utilisant l’action standard Answer Questions with Knowledge (Répondre aux questions avec Knowledge). Cette action récupère de manière dynamique le contenu Knowledge ou du fichier que vous avez spécifié lors de la création ou de la sélection d’une bibliothèque.
À chaque fois que l’action Answer Questions with Knowledge (Répondre aux questions avec Knowledge) est exécutée :
- L’action exécute le modèle d’invite associé. Le récupérateur est invoqué avec une requête dynamique.
- La requête fait une recherche dans la bibliothèque de données.
- La requête récupère le contenu pertinent.
- L’invite d’origine est complétée avec les informations récupérées dans la bibliothèque de données, puis soumise au LLM.
- La réponse générée par le LLM est transmise à l’agent.
Obtention des connaissances commerciales pertinentes dans les invites
Au moment de l’exécution, les modèles d’invites extraient des informations pertinentes de votre bibliothèque de données pour ancrer les invites LLM afin d’obtenir des réponses plus précises. Si vous utilisez un modèle d’invite personnalisé, intégrez simplement dans le générateur d’invites un récupérateur de recherche Einstein que vous pouvez sélectionner lorsque vous insérez une ressource. Vous pouvez également utiliser un récupérateur personnalisé qui ajuste les paramètres de recherche pour chaque invite donnée.
À chaque fois qu’un modèle d’invite avec un récupérateur est exécuté :
- Le récupérateur est invoqué avec une requête dynamique initiée à partir du modèle d’invite.
- La requête est vectorisée (convertie en représentations numériques). La vectorisation permet à la recherche de trouver des correspondances sémantiques dans l’index de recherche (qui est déjà vectorisé).
- La requête récupère le contenu pertinent à partir des données indexées dans l’index de recherche.
- L’invite d’origine est complétée avec les informations récupérées à partir de l’index de recherche.
- L’invite est soumise au LLM, qui génère et renvoie la réponse à l’invite.
Personnalisation avancée dans Data Cloud
Lorsque vous ajoutez une bibliothèque de données, dans le générateur Agentforce ou depuis Setup (Configuration), Salesforce crée automatiquement une solution optimisée par RAG en utilisant les paramètres par défaut pour tous les composants : magasin de données vectorielles, index de recherche, récupérateur, modèle d’invite et action standard. Vous pouvez configurer et personnaliser ces composants individuellement.
La préparation des données implique la réalisation des tâches suivantes dans Data Cloud.
- Connectez vos données non structurées (effectuez l’ingestion de celles-ci).
- Créez une configuration d’index de recherche qui segmente et vectorise le contenu. Data Cloud utilise un index de recherche pour gérer le contenu structuré et non structuré de manière optimisée pour la recherche. Vous disposez de deux options de recherche : la recherche vectorielle et la recherche hybride. La recherche hybride combine la recherche vectorielle et par mot-clé.
- La segmentation divise le texte en unités plus petites, reflétant des passages du contenu original, tels que des phrases ou des paragraphes.
- La vectorisation convertit les segments en représentations numériques du texte qui capturent les similarités sémantiques.
- La segmentation divise le texte en unités plus petites, reflétant des passages du contenu original, tels que des phrases ou des paragraphes.
- Stockez et gérez l’index de recherche.
Lorsqu’un index de recherche est créé, Data Cloud crée automatiquement un récupérateur par défaut pour celui-ci. Ce récupérateur est une ressource que vous intégrez dans un modèle d’invite pour rechercher et renvoyer des informations pertinentes à partir du magasin de connaissances. Pour prendre en charge une variété de cas d’utilisation, vous pouvez créer des récupérateurs personnalisés dans Einstein Studio, qui concentrent votre recherche sur le sous-ensemble d’informations pertinent à ajouter à l’invite.
Découverte de RAG en action
Cette vidéo montre à quel point il est facile d’améliorer un modèle d’invite à l’aide de la RAG.
Conclusion
La bibliothèque de données Agentforce et la RAG dans Data Cloud sont intégrées à la plateforme d’IA générative Einstein. Intégrez nativement la fonctionnalité RAG dans des applications prêtes à l’emploi, telles que le générateur Agentforce et le générateur d’invites. Avec la RAG, vous pouvez ancrer et améliorer en toute sécurité vos solutions Agentforce avec des données propriétaires issues d’un modèle de données harmonisé.
Ressources
- Aide Salesforce : Données non structurées dans Data Cloud
- Aide Salesforce : Data Cloud - Segmentation et vectorisation des données
- Aide Salesforce : Data Cloud - Recherche vectorielle
- Trailhead : Données non structurées dans Data Cloud
- Blog Salesforce : RAG - les trois lettres les plus en vogue en IA générative