Skip to main content

Création d’une configuration d’index de recherche

Objectifs d’apprentissage

Une fois cette unité terminée, vous pourrez :

  • Décrire le fonctionnement des configurations d’index de recherche et de l’ancrage dans Data Cloud
  • Créer une configuration d’index de recherche vectorielle
Remarque

Remarque

Vous souhaitez apprendre en français ? Commencez le défi dans un Trailhead Playground en français et utilisez les traductions fournies entre crochets pour naviguer. Copiez et collez uniquement les valeurs en anglais, car les validations de défi reposent sur les données en anglais. Si vous ne réussissez pas le défi dans votre organisation en français, nous vous recommandons (1) de définir le paramètre régional sur les États-Unis, (2) de définir la langue sur l’anglais en suivant les instructions ici, puis (3) de cliquer à nouveau sur le bouton « Vérifier le défi ».

Consultez le badge Trailhead dans votre langue pour découvrir comment profiter de l’expérience Trailhead traduite.

Ancrage de la recherche sur des données non structurées avec des configurations d’index de recherche

L’ancrage de la recherche sur des données structurées et non structurées améliore votre utilisation de l’IA générative, des analyses et des outils d’automatisation sur Salesforce Platform. Grâce à l’ancrage, les applications telles qu’Agentforce, Tableau et Flow Builder intègrent des données propres aux clients. Les résultats des recherches sont ainsi ajustés aux intentions et aux contextes de vos utilisateurs. Cet alignement se traduit par du contenu généré par l’IA plus précis et plus pertinent, des informations plus approfondies issues des analyses et des flux de travail d’automatisation plus efficaces pour vos équipes et vos clients.

Pour ancrer une recherche, vous devez diviser vos données non structurées en segments sémantiquement appropriés et, à partir de ces segments, créer des plongements vectoriels, c’est-à-dire des représentations numériques de vos données segmentées. Le contenu segmenté, stocké dans l’index de recherche Data Cloud, est recherchable et peut être utilisé dans les applications d’IA générative Einstein (Générateur d’invites et Agentforce), ainsi que les applications d’automatisation (Flow Builder) et d’analyse (Tableau).

Diagramme montrant le flux de création et d’utilisation d’un index vectoriel.

Segmentation de données non structurées

Dans l’unité précédente, nous avons expliqué comment Data Cloud référence les données non structurées par le biais d’objets modèle de données non structurés. Vous pouvez également segmenter les objets modèle de données non structurés ou tout objet modèle de données avec des champs de texte, tels que les articles Salesforce Knowledge. C’est ce que vous ferez dans cette unité.

Lorsque vous segmentez des objets modèle de données non structurés ou des objets modèle de données, vous les divisez en segments gérables et sémantiquement significatifs. Ces unités de texte sont stockées dans Data Cloud dans des objets modèle de données segment, qui sont créés à partir d’objets modèle de données ou d’objets modèle de données non structurés.

Fonctionnement de la segmentation

Data Cloud prend en charge plusieurs stratégies de segmentation.

L’extraction de passages fondée sur la sémantique utilise le sens sémantique inhérent aux balises HTML pour segmenter un document en passages. Les éléments HTML tels que les titres (<h1>, <h2>), les listes (<ul>, <ol>) ou le texte en gras (<strong>) opérant comme sous-titre sont considérés comme des limites logiques pour les passages.

La stratégie d’extraction de passages fondée sur une fenêtre utilise des éléments de niveau bloc, tels que les balises <div> et <p>, ou du texte brut séparé par des sauts de ligne pour segmenter les documents en passages. Si un paragraphe ne contient pas d’élément HTML, l’extraction se fait au niveau de la phrase.

En savoir plus sur les stratégies de segmentation dans l’aide Salesforce.

Pour l’instant, voyons ce qui se passe une fois vos données segmentées.

Création de plongements vectoriels à partir de contenu segmenté

Une fois que Data Cloud a segmenté votre contenu, il crée un plongement vectoriel (une représentation numérique du contenu segmenté qui peut être récupéré ou utilisé dans vos applications d’IA générative, d’automatisation ou d’analyse Salesforce).

Les plongements vectoriels sont des représentations numériques du texte, qui stockent les relations entre les mots ou les phrases. Le plongement capture la signification sémantique du contenu, de sorte que les segments de contenu ayant des similarités sémantiques ont des plongements vectoriels similaires. Ces représentations aident les machines à traiter et à comprendre le langage de manière efficace.

Dans Data Cloud, les plongements vectoriels sont référencés par des objets modèle de données index, que nous examinerons de plus près ultérieurement dans cette unité.

Remarque

Vous trouverez davantage d’informations sur les plongements vectoriels et le contenu segmenté dans l’aide Salesforce.

Création de configurations d’index de recherche vectorielle

Pour que vos données non structurées soient prêtes pour la recherche, vous devez les segmenter et les vectoriser. Pour ce faire, vous créez une configuration d’index de recherche. Vous devez créer une configuration d’index de recherche pour tout objet de données comportant des champs de texte qui contiennent des concepts informationnels, des éléments narratifs ou des descriptions détaillées que vos utilisateurs recherchent pour obtenir des résultats pertinents. Ces données peuvent être des articles Salesforce Knowledge ou d’autres documents texte (comme des transcriptions de chat) stockés dans un magasin blob externe comme Amazon S3.

Création d’une configuration d’index de recherche vectorielle à partir d’articles Knowledge

Dans l’unité précédente, vous avez créé un flux de données et un objet lac de données à partir du paquet Knowledge dans le connecteur Salesforce CRM, qui fournit quelques exemples d’articles Knowledge.

L’objet Version de l’article Knowledge est utile pour l’indexation, car vous pouvez l’utiliser pour interroger, récupérer ou rechercher tous les types d’articles en fonction de leur version. L’objet Version de l’article Knowledge inclut les champs suivants qui doivent être indexés pour la recherche :

  • Name (Nom) : le nom ou le titre de l’article Knowledge
  • Description : la description ou le résumé de l’article Knowledge, mappé à partir du résumé
  • Custom text fields (Champs de texte personnalisés) : tous les champs de texte enrichi (limite de 131 Ko) contenant des données non structurées

Création d’une configuration d’index de recherche vectorielle pour l’objet modèle de données Version de l’article Knowledge

Vous effectuerez ces étapes dans votre organisation Data Cloud afin de réussir le défi à la fin de cette unité.

Remarque

La configuration avancée vous donne plus de contrôle sur les choix de segmentation et de vectorisation, mais ce défi implique d’utiliser principalement les valeurs par défaut.

  1. Si vous ne l’avez pas déjà fait, lancez votre Playground compatible avec Data Cloud.
  2. Depuis le lanceur d’applications, sélectionnez Data Cloud.
  3. Cliquez sur Search Index (Index de recherche) | New (Nouveau).
    Si vous ne voyez pas Search Index (Index de recherche) dans la navigation Data Cloud, cliquez sur le menu déroulant More (Plus), puis sélectionnez Search Index (Index de recherche).
  4. Cliquez sur Advanced Setup (Configuration avancée) | Next (Suivant).
  5. Sur la page Select Source Object (Sélectionner l’objet source), sélectionnez Vector Search (Recherche vectorielle) et l’objet modèle de données Version de l’article Knowledge, puis cliquez sur Next (Suivant).
  6. Sur la page Select Fields to Chunk (Sélectionner les champs à segmenter), cliquez sur Manage Fields (Gérer les champs).
  7. Cliquez sur Select All Fields (Sélectionner tous les champs), puis sur Save (Enregistrer).
  8. Laissez la stratégie de segmentation par défaut et cliquez sur Next (Suivant).
  9. Sur la page Select a Vectorization Strategy (Sélectionner une stratégie de vectorisation), laissez la stratégie de vectorisation par défaut et cliquez sur Next (Suivant).
  10. Sur la page Select Related Fields for Search Filtering (Sélectionner les champs associés pour le filtrage de la recherche), n’ajoutez aucun champ et cliquez sur Next (Suivant).
  11. Sur la page Search Index Configuration Details (Détails de configuration de l’index de recherche), remplacez le nom de la configuration de l’index de recherche généré automatiquement par My_kav. (Le nom d’API de la configuration de l’index de recherche est automatiquement renseigné.)
  12. Cliquez sur Save (Enregistrer).

Nous avons terminé ! Votre nouvelle configuration d’index de recherche, My_kav, est répertoriée sous l’onglet Search index (Index de recherche).

Affichage des objets modèle de données segment et des objets modèle de données index Version de l’article Knowledge

Une fois que vous avez créé une configuration d’index de recherche, son statut passe à Submitted (Soumis), puis à In-progress (En cours) pendant le traitement des données de l'objet modèle de données/objet modèle de données non structuré source. S’il n’y a pas d’échec, le statut passe de Submitted (Soumis) à In-progress (En cours) puis à Ready (Prêt). Vous ne verrez aucun enregistrement dans l’explorateur de données tant que le statut de l’index de recherche n’a pas le statut Ready (Prêt).

Remarque

La durée du traitement des données dans l’index de recherche par Data Cloud est variable et peut prendre plusieurs minutes, alors allez prendre une boisson ou dégourdissez-vous les jambes. À votre retour, cliquez sur Refresh (Actualiser) et vérifiez si le statut de l’index de recherche est défini sur Ready (Prêt).

Le contenu le plus utile d’un article Knowledge se trouve dans le champ Description. En général, les échantillons d’articles sont suffisamment courts pour ne former qu’un seul segment. Cela signifie que pour chaque enregistrement dans l’objet modèle de données segment et l’objet modèle de données index Version de l’article Knowledge, il existe respectivement un segment et un vecteur. Les contenus plus longs peuvent avoir plusieurs enregistrements dans chaque objet modèle de données.

Jetons un coup d’œil rapide à l’objet modèle de données segment et à l’objet modèle de données index que nous avons créés pour l’objet modèle de données Version de l’article Knowledge.

  1. Vérifiez que le statut de l’index de recherche est définir sur Ready (Prêt).
  2. Depuis Data Cloud, cliquez sur Data Explorer (Explorateur de données).
  3. Dans le menu déroulant Object (Objet), sélectionnez Data Model Object (Objet modèle de données).
  4. Dans le champ Select an Object (Sélectionner un objet), sélectionnez le segment My_kav.
    Vous devriez maintenant pouvoir afficher la liste de tous les segments créés par Data Cloud à partir des échantillons d’articles Knowledge.
  5. Dans le champ Select an Object (Sélectionner un objet), sélectionnez l’index My_kav.
    Vous devriez maintenant pouvoir afficher la liste de tous les enregistrements vectoriels créés par Data Cloud à partir des échantillons d’articles Knowledge.

Vous pouvez utiliser les objets modèle de données segment et index contenus dans l’index de recherche dans tout Salesforce dans des applications telles que Flow Builder, Agentforce, Générateur d’invites et même Tableau. Vous pouvez également consulter la documentation relative à la recherche vectorielle pour en savoir plus sur l’exécution des requêtes de recherche vectorielle.

Le fait d’associer des données non structurées à Data Cloud vous permet d'ancrer les résultats de la recherche sur la base d'une grande quantité de données pour un large éventail de cas d’utilisation axés sur le client. En segmentant et en vectorisant ces données, vous pouvez utiliser la recherche vectorielle dans les applications d’IA générative Einstein, Flow Builder et même Tableau pour améliorer vos capacités d’IA, d’analyse et d’automatisation.

Ressources

Partagez vos commentaires sur Trailhead dans l'aide Salesforce.

Nous aimerions connaître votre expérience avec Trailhead. Vous pouvez désormais accéder au nouveau formulaire de commentaires à tout moment depuis le site d'aide Salesforce.

En savoir plus Continuer à partager vos commentaires