Premiers pas avec les données non structurées dans Data Cloud
Objectifs d’apprentissage
Une fois cette étape terminée, vous pourrez :
- Définir les données non structurées dans Data Cloud
- Expliquer comment les données non structurées améliorent vos stratégies d’IA et d’automatisation
- Décrire comment associer des données à partir d’un magasin blob externe (comme Amazon S3)
Que sont les données non structurées ?
Les données collectées par votre organisation prennent généralement trois formes : structurées, semi-structurées et non structurées. Les organisations collectent une part de plus en plus importante de données non structurées, mais elles n’en exploitent efficacement qu’une très petite partie. Il peut être difficile d’intégrer efficacement de grandes quantités de données dans les flux de travail, en particulier à des fins de recherche et de récupération. Avec la prise en charge des données non structurées dans Data Cloud, il est temps de changer cela.
Les données non structurées sont des données qui n’ont pas de format spécifique et cohérent, et qui ne peuvent pas être facilement stockées dans une base de données relationnelle classique. Leur manque de structure rend la recherche ou l’analyse de ces données particulièrement difficile. Cependant, les technologies d’IA, telles que les grands modèles de langage (LLM), peuvent traiter efficacement les données non structurées. Cette capacité permet à de nombreuses entreprises d’incorporer des volumes de plus en plus importants de données non structurées dans leurs stratégies axées sur les données.
Les formes courantes de données non structurées incluent les transcriptions de chat, les fichiers audio et vidéo, les e-mails, les documents juridiques et d’autres textes volumineux, tels que les manuels. Dans Salesforce, les données provenant d’articles Knowledge ou de transcriptions d’appels commerciaux sont des exemples de données non structurées.
Utilisation de données non structurées pour améliorer vos stratégies d’IA et d’automatisation
Lorsque vous associez vos données non structurées dans Data Cloud, vous pouvez générer des résultats centrés sur le client dans vos applications d’IA générative Einstein (Générateur d’invites et Agentforce), d’automatisation (Flow Builder) et d’analyse (Tableau et CRM Analytics). Par exemple, vous pouvez améliorer les recommandations de réponse du service client en générant des réponses à la clientèle à l’aide de données des articles Knowledge, ou créer des modèles d’invite qui utilisent des e-mails antérieurs pour générer des messages personnalisés. Vous pouvez également utiliser Flow Builder et Agentforce pour montrer aux agents de service des données de requêtes similaires afin de les aider à résoudre ou à consigner des requêtes.
Association de données non structurées à partir de magasins blob externes
Data Cloud peut référencer des données non structurées aux formats HTML, TXT et PDF (des formats supplémentaires sont à venir dans les prochaines versions). Comme Data Cloud prend déjà en charge les associations depuis Amazon S3, Azure Blob Storage et Google Cloud Storage, il suffit de quelques clics de configuration pour importer vos données non structurées si vous avez déjà configuré ces associations.
Une fois que vous avez créé une association entre votre magasin blob externe et Data Cloud, vous pouvez référencer des données non structurées dans Data Cloud en créant un objet lac de données non structuré et en le mappant à un objet modèle de données non structuré.
Data Cloud crée automatiquement des mappages au niveau du champ entre les objets lac de données non structurés et les objets modèle de données non structurés, car les schémas des deux objets sont identiques. Vous pouvez trouver davantage d’informations sur ces schémas dans l’aide Salesforce.
La relation entre les objets lac de données non structurés et les objets modèle de données non structurés peut être une relation 1:1 ou N:1. Cela signifie que chaque objet lac de données non structuré peut être mappé à un seul objet modèle de données non structuré au maximum, tandis que plusieurs objets lac de données non structurés peuvent être mappés à un seul objet modèle de données non structuré. Voyons un exemple.
Imaginez que vous référencez des données d’enregistrement de requête provenant de plusieurs magasins blob externes. Trois objets lac de données non structurés différents font référence à des données provenant de ces trois sources : CaseRecordingsFromAWSBucket1, CaseRecordingsFromAWSBucket2 et CaseRecordingsfromGCS. Étant donné que ces sources représentent logiquement le même objet, les objets lac de données non structurés individuels sont mappés à un objet modèle de données non structuré : CaseRecordings.
Lorsque vous associez des données non structurées à partir de vos magasins blob externes à Data Cloud, vous fournissez à vos administrateurs et utilisateurs un contenu plus pertinent pour les aider à résoudre les problèmes, à gérer les requêtes et à créer des invites efficaces pour les applications d’IA générative Einstein.
Inscription à un Playground personnalisé avec Data Cloud.
Pour mener à bien ce projet, vous avez besoin d’un Playground personnalisé contenant Data Cloud et nos échantillons de données. Si vous n’avez pas encore cliqué sur le bouton Create Playground (Créer un Playground) en haut de cette page, faites-le maintenant. Ensuite, suivez les étapes pour créer un Playground personnalisé et le connecter à Trailhead.
Une fois que vous avez lancé votre Playground personnalisé, vous êtes prêt à démarrer l’ingestion du contenu d’un article Knowledge sous forme de données non structurées. Cliquez sur Vérifier l’étape dans la section Défi pour gagner 100 points et passer à l’étape suivante de ce projet.