Amélioration de l’IA grâce à des données réelles
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Décrire les avantages de l’utilisation de la bibliothèque de données Agentforce
- Définir quatre concepts clés impliqués dans la transformation et l’organisation des données d’IA
- Expliquer le fonctionnement des processus de configuration et d’exécution de la bibliothèque de données Agentforce
Avant de commencer
Avant de commencer ce module, nous vous invitons à consulter entièrement le contenu recommandé suivant.
Pourquoi ancrer l’IA dans des données ?
Vos données jouent un rôle crucial pour garantir le fonctionnement précis et efficace des systèmes d’IA. Si vous donnez une mauvaise réponse à un client, vous risquez de le dissuader d’acheter à l’avenir. Si les représentants de service reçoivent des informations incorrectes, ils risquent de frustrer les clients au lieu de les aider. Si vous fournissez des recommandations obsolètes à vos représentants commerciaux, ils risquent de ne pas atteindre leurs objectifs et de perdre de précieuses opportunités commerciales.
Bien que les données constituent la colonne vertébrale de tout système d’IA performant, les modèles IA sont par nature généralistes : ils sont entraînés sur d’importants ensembles de données qui leur fournissent une vaste base de connaissances. Cela signifie qu’ils ne disposent pas des informations spécialisées nécessaires pour effectuer des tâches spécifiques ou répondre à des questions techniques propres à votre cas d’utilisation unique.
L’ancrage dans des données réelles permet aux modèles IA d’aller au-delà de leurs ensembles d’entraînement statiques. Lorsque vous ancrez votre modèle IA dans des sources d’information vérifiées telles que votre base de connaissances Salesforce, vos fichiers chargés ou des sites Web, le LLM peut renvoyer des réponses plus précises aux demandes des clients, suggérer de meilleures réponses aux agents, fournir des résumés de recherche sophistiqués, et bien plus encore.

Le défi des données d’entreprise
La plupart des entreprises stockent leurs bases de connaissances dans des formats non structurés, tels que des collections de vidéos, d’images, de documents, d’e-mails, de données de capteur, de publications de réseau social, de fichiers audio, etc., qui ne s’intègrent pas facilement dans des feuilles de calcul ou des bases de données. Il est plus difficile d’effectuer des recherches dans ces données, qui représentent près de 90 % des données d’entreprise, mais elles regorgent d’informations précieuses, telles que les commentaires des clients, les perceptions, les opinions, le ton et le sentiment. Comment pouvez-vous alors exploiter le potentiel de ces données ?
Découvrez la bibliothèque de données Agentforce, un outil puissant qui peut vous aider à ancrer l’IA dans vos données réelles. Grâce à la bibliothèque de données Agentforce, vous pouvez facilement connecter votre base de connaissances aux fonctionnalités d’IA de Salesforce, ce qui vous garantit un contenu généré par l’IA à jour et adapté à votre organisation et à vos cas d’utilisation. Lorsque vous configurez une bibliothèque de données Agentforce, vous obtenez les outils dont vous avez besoin pour transformer de grands ensembles de données non structurées ou semi-structurées en un contenu plus utile et exploitable. Voyons comment.
Transformation des données pour une utilisation efficace avec de grands modèles de langage
Les bibliothèques de données Agentforce facilitent la liaison d’agents et de grands modèles de langage (LLM) à vos données non structurées en automatisant plusieurs étapes de configuration dans Data 360 et le générateur d’instructions génératives. Il s’agit notamment d’envoyer des flux de données vers Data 360, de mapper des objets de données, et de créer un index de recherche et un récupérateur. Résultat : vos outils d’IA utilisent toujours les informations les plus récentes et les plus pertinentes.
Avant de découvrir les étapes simples de configuration d’une bibliothèque de données, examinons quelques concepts clés, à savoir l’ancrage, la segmentation, l’indexation et les récupérateurs.
Ancrage
L’ancrage consiste à ajouter des connaissances propres à un domaine ou des informations client à une instruction générative, donnant au LLM le contexte dont il a besoin pour répondre plus précisément à une question ou à une tâche. Comme nous l’avons mentionné, vos sources d’ancrage peuvent inclure des articles Knowledge, des fichiers chargés, des sites Web, des transcriptions de conversations et plus encore. Toutefois, la recherche dans des documents longs et complexes peut prendre beaucoup de temps et nécessiter de nombreuses ressources, alors que les LLM ont une limite maximale de jetons ou de mots pour la quantité de texte qu’ils peuvent traiter en une seule fois.
Segmentation et indexation
Pour remédier à cela, les sources de données sont divisées en parties plus petites, appelées « segments ». Une recherche est ensuite effectuée dans les segments et seules les informations les plus pertinentes devant être prises en compte par le LLM sont renvoyées.

Une fois les données segmentées, elles sont organisées et catégorisées dans un index de recherche. Le stockage des informations dans un index de recherche organisé facilite et accélère la récupération de données spécifiques lorsque cela est nécessaire. Lorsque les données sont segmentées et organisées de cette manière, les recherches sont plus efficaces, les résultats sont plus pertinents et le traitement de très grands ensembles de données devient possible.
Imaginez une grande boutique en ligne proposant des millions de produits. Un catalogue ou une taxonomie de site Web bien organisé permet aux clients de trouver rapidement les produits qu’ils recherchent selon différentes catégories, telles que le nom, le type, la marque ou même des caractéristiques spécifiques. Le fait de diviser les données en plus petites parties et de les organiser dans un index de recherche revient à créer un catalogue pour votre contenu. Les LLM peuvent ensuite utiliser ce catalogue ou cet index pour trouver les bonnes informations afin de répondre aux requêtes des utilisateurs.
Récupérateurs
Les récupérateurs agissent comme des guides entre les données et les fonctionnalités. Ils sont conçus pour extraire et fournir automatiquement des données pertinentes provenant de plusieurs bases de données, systèmes ou plates-formes. Lorsqu’un utilisateur pose une question, le récupérateur attribué à chaque bibliothèque de données détermine les ensembles de données dans Data 360 auxquels les outils d’IA Salesforce peuvent accéder. Les récupérateurs sont donc particulièrement importants dans des applications telles que les moteurs de recherche, les systèmes de questions/réponses et les systèmes de recommandation.
Vous venez de découvrir quelques notions de base sur l’organisation des données dans le cadre de l’IA. Voyons maintenant comment ces processus fonctionnent lors de la configuration et de l’exécution de la bibliothèque de données.
Que se passe-t-il lors de la configuration ?
Lorsque vous créez une bibliothèque de données, les processus qui connectent vos données à vos fonctionnalités et agents IA démarrent immédiatement. Tout d’abord, un flux de données est créé, suivi des objets lac de données et des objets modèle de données. Ces objets sont ensuite mappés entre eux et la segmentation des données commence. Le temps nécessaire à la segmentation varie en fonction de facteurs, tels que le nombre, la taille et la complexité des articles Knowledge ou des fichiers chargés, ainsi que le nombre de champs Knowledge sélectionnés pour la segmentation. Lorsque la segmentation est terminée et que l’index de recherche est prêt, un récupérateur est créé. Chaque bibliothèque de données Agentforce dispose de son propre récupérateur unique, qui peut pointer vers le même index de recherche mais fonctionne de manière indépendante.

Que se passe-t-il lors de l’exécution ?
Une fois le récupérateur configuré et l’index de recherche entièrement préparé, le système est prêt à traiter les requêtes des utilisateurs au moment de l’exécution.
Lors de l’exécution, la requête de l’utilisateur est ajoutée au modèle d’instruction générative, qui référence le récupérateur se connectant aux données pertinentes. Le système recherche ensuite dans l’index de recherche les informations les plus pertinentes et les intègre à l’instruction générative. Le LLM reçoit cette instruction générative enrichie, qui comprend la requête de l’utilisateur, les informations ajoutées et les instructions, puis génère une réponse. Le planificateur de services examine cette réponse pour s’assurer qu’elle est conforme aux instructions. Enfin, l’utilisateur final reçoit une réponse qui satisfait précisément à sa requête et qui est contextualisée avec des informations pertinentes, propres au domaine et adaptées à la tâche spécifique.

En résumé
Bon travail ! Dans cette unité, vous avez appris pourquoi il est important d’ancrer l’IA dans vos données, et vous avez découvert certains termes spécialisés et processus techniques. Il est maintenant temps de passer à la configuration, qui, vous le constaterez par vous-même, est très simple !
Ressources
- Blog Salesforce : Qu’est-ce que la génération augmentée de récupération (RAG) ?
- Blog Salesforce : Les directeurs des systèmes d’information dévoilent les 3 principales stratégies pour exploiter le potentiel de l’IA avec des données non structurées
- Aide Salesforce : Découverte des bibliothèques de données
