Erstellen einer Suchindexkonfiguration
Lernziele
Nach dieser Lektion sind Sie in der Lage, die folgenden Aufgaben auszuführen:
- Beschreiben, wie Suchindexkonfigurationen und Kontextbildung in Data 360 funktionieren
- Erstellen einer Vektorsuchindex-Konfiguration
Verankern einer Suche in unstrukturierten Daten mit Suchindexkonfigurationen
Die Suche auf Basis unstrukturierter und strukturierter Daten verbessert die Nutzung generativer KI-, Analyse- und Automatisierungstools auf der gesamten Salesforce-Plattform. Die in Kontext verankerte Suche bringt kundenspezifische Daten in Anwendungen wie Agentforce, Tableau und Flow Builder ein und stellt sicher, dass die Ergebnisse gut auf die Absichten und Kontexte Ihrer Benutzer abgestimmt sind. Diese Ausrichtung führt zu genaueren und relevanteren KI-generierten Inhalten, tieferen Erkenntnissen aus Analysen und effizienteren Automatisierungsabläufen für Ihre Teams und Kunden.
Zum Verankern der Suche müssen Sie Ihre unstrukturierten Daten in semantisch passende Segmente aufteilen und aus diesen Segmenten Vektoreinbettungen erstellen – numerische Darstellungen Ihrer in Segmente unterteilten Daten. Die im Data 360-Suchindex gespeicherten segmentierten Inhalte können in generativen KI-Anwendungen von Einstein (Prompt-Generator und Agentforce) sowie in Automatisierungs- (Flow Builder) und Analyseanwendungen (Tableau) durchsucht und verwendet werden.

Segmentieren unstrukturierter Daten
In der vorherigen Lektion haben wir behandelt, wie Data 360 über unstrukturierte Datenmodellobjekte (UDMOs) auf unstrukturierte Daten verweist. Auch UDMOs oder beliebige DMOs mit Textfeldern, wie etwa Salesforce Knowledge-Artikel, lassen sich segmentieren. Genau damit wollen wir uns in dieser Lektion befassen.
Wenn Sie UDMOs oder DMOs segmentieren, teilen Sie sie in handhabbare, semantisch bedeutsame Segmente auf. Diese Texteinheiten werden in Data 360 in CDMOs (Chunk Data Model Objects, Segment-Datenmodellobjekte) gespeichert, die aus Datenmodellobjekten oder unstrukturierten Datenmodellobjekten erstellt werden.
Funktionsweise der Segmentierung
Data 360 unterstützt verschiedene Strategien zur Segmentierung.
Die auf Semantik basierende Extraktion von Textpassagen verwendet die inhärente semantische Bedeutung von HTML-Tags, um ein Dokument in Textpassagen aufzuteilen. HTML-Elemente wie Überschriften (<h1>, <h2>), Listen (<ul>, <ol>) oder fett formatierter Text (<strong>), der als Untertitel fungiert, werden als logische Grenzen von Textpassagen angesehen.
Die fensterbasierte Extraktionsstrategie für Textpassagen verwendet Elemente auf Blockebene, wie <div>- und <p>-Tags oder unformatierten Text, der durch Zeilenumbrüche getrennt ist, um Dokumente in Textpassagen zu segmentieren. Wenn ein Absatz überhaupt kein HTML enthält, erfolgt die Extraktion auf Satzebene.
Weitere Informationen zur Segmentierungsstrategie finden Sie in der Salesforce-Hilfe.
Sehen wir uns zunächst an, was geschieht, nachdem Ihre Daten segmentiert wurden.
Erstellen von Vektoreinbettungen aus segmentierten Inhalten
Nachdem Data 360 Ihre Inhalte segmentiert hat, erstellt es eine Vektoreinbettung – eine numerische Darstellung der aufgeteilten Inhalte, die in Ihren generativen KI-, Automatisierungs- oder Analyseanwendungen von Salesforce abgerufen oder verwendet werden kann.
Vektoreinbettungen sind numerische Darstellungen von Text, die Beziehungen zwischen Wörtern oder Formulierungen speichern. Die Einbettung erfasst die semantische Bedeutung des Inhalts, daher haben Inhaltssegmente, die semantisch ähnlich sind, ähnliche Vektoreinbettungen. Diese Darstellungen unterstützen Maschinen dabei, Sprache effektiv zu verarbeiten und zu verstehen.
In Data 360 wird auf Vektoreinbettungen durch Index-Datenmodellobjekte (IDMOs) verwiesen, die wir uns später in dieser Lektion genauer ansehen werden.
Erstellen von Vektorsuchindex-Konfigurationen
Damit Ihre unstrukturierten Daten zum Durchsuchen bereit werden, müssen Sie sie segmentieren und vektorisieren. Zu diesem Zweck erstellen Sie eine Suchindexkonfiguration. Sie möchten eine Suchindexkonfiguration für alle Datenobjekte mit Textfeldern erstellen, die Informationskonzepte, Beschreibungen oder detaillierte Erläuterungen enthalten, nach denen Ihre Benutzer suchen, um relevante Ergebnisse zu finden. Ein Beispiel für solche Daten sind Salesforce Knowledge-Artikel oder andere Textdokumente (wie Chat-Abschriften), die in einem externen Blob-Speicher wie Amazon S3 gespeichert sind.
Erstellen einer Vektorsuchindex-Konfiguration aus Knowledge-Artikeln
In der vorhergegangenen Lektion haben Sie aus dem Knowledge-Paket im Salesforce CRM-Konnektor einen Datenstrom und ein Data Lake-Objekt erstellt, wodurch Ihnen eine Reihe von Knowledge-Musterartikeln zur Verfügung steht.
Die Indizierung des Knowledge-Artikelversionsobjekts ist nützlich, da Sie dieses Objekt zum Abfragen, Abrufen und Durchsuchen aller Arten von Artikeln anhand ihrer Version verwenden können. Das Knowledge-Artikelversion-Objekt enthält diese Felder, die für die Suche indiziert werden sollten.
-
Name: Der Name oder Titel des Knowledge-Artikels
-
Description (Beschreibung): Die Beschreibung oder Zusammenfassung des Knowledge-Artikels, aus der Zusammenfassung zugeordnet
-
Benutzerdefinierte Textfelder: Alle RTF-Felder (Grenzwert 131K), die die unstrukturierten Daten enthalten
Erstellen einer Vektorsuchindex-Konfiguration für das Knowledge-Artikelversion-DMO
Sie führen diese Schritte in Ihrer Data 360-Organisation durch, um die Aufgabe am Ende dieser Einheit zu bestehen.
- Starten Sie Ihren Data Cloud-Playground, wenn das noch nicht erfolgt ist.
- Wählen Sie im App Launcher Data Cloud aus.
- Klicken Sie auf Search Index (Suchindex) | New (Neu).
Wenn "Suchindex" in der Data Cloud-Navigation nicht angezeigt wird, klicken Sie auf das Dropdown-Menü More (Mehr) und wählen Sie dann Search Index (Suchindex) aus.
- Klicken Sie auf Advanced Setup (Erweitertes Setup) | Next (Weiter).
- Wählen Sie auf der Seite "Select Source Object" (Quellobjekt auswählen) Vector Search (Vektorsuche), das Knowledge-Artikelversion-DMO aus und klicken Sie auf Next (Weiter).
- Klicken Sie auf der Seite "Select Fields to Chunk" (Zu segmentierende Felder auswählen) auf Manage Fields (Felder verwalten).
- Klicken Sie auf Select All Fields (Alle Felder auswählen) und klicken Sie auf Save (Speichern).
- Behalten Sie den Standardwert für die Segmentierungsstrategie bei und klicken Sie auf Next (Weiter).
- Behalten Sie auf der Seite "Select a Vectorization Strategy" (Vektorisierungsstrategie auswählen) die standardmäßige Vektorisierungsstrategie bei und klicken Sie auf Next (Weiter).
- Fügen Sie auf der Seite "Select Related Fields for Search Filtering" (Verwandte Felder für die Suchfilterung auswählen) keine Felder hinzu und klicken Sie auf Next (Weiter).
- Ersetzen sie auf der Seite "Search Index Configuration Details" (Details der Suchindexkonfiguration) den automatisch generierten Namen der Suchindexkonfiguration durch
My_kav. (Der API-Name der Suchindexkonfiguration wird automatisch eingetragen).
- Klicken Sie auf Save (Speichern).
Geschafft! Ihre neue Suchindexkonfiguration, My_kav, ist auf der Suchindex-Registerkarte aufgelistet.
Anzeigen der CDMO und IDMOs der Knowledge-Artikelversion
Nachdem Sie eine Suchindexkonfiguration erstellt haben, ändert sich deren Status zu "Submitted" (Übermittelt) und anschließend zu "In Progress" (In Bearbeitung), während die Daten aus der Quell-DMO/UDMO verarbeitet werden. Wenn keine Fehler auftreten, ändert sich der Status von "Submitted" (Übermittelt) zu "In Progress" (In Bearbeitung) und anschließend zu "Ready" (Bereit). Es werden keine Datensätze im Daten-Explorer angezeigt, bis der Status des Suchindex "Ready" (Bereit) ist.
Der nützlichste Inhalt eines Knowledge-Artikels befindet sich im Feld "Description" (Beschreibung). Normalerweise sind die Musterartikel so klein, dass sie lediglich aus einem Segment bestehen. Das bedeutet, dass es für jeden Datensatz im CDMO und IDMO der Knowledge-Artikelversion jeweils ein Segment und einen Vektor gibt, aber längere Inhalte könnten mehr Datensätze in jedem DMO aufweisen.
Sehen wir uns kurz das CDMO und IDMO an, die wir für das DMO der Knowledge-Artikelversion erstellt haben.
- Überzeugen Sie sich, dass der Status des Suchindex "Ready" (Bereit) ist.
- Klicken Sie in Data Cloud auf Data Explorer (Daten-Explorer).
- Wählen Sie im Objekt-Dropdown-Menü Data Model Object (Datenmodellobjekt) aus.
- Wählen Sie im Feld "Select an Object" (Objekt auswählen) das Segment My_kav aus.
Jetzt sollten Sie in der Lage sein, eine Liste aller Segmente zu sehen, die Data 360 aus den Knowledge-Musterartikeln erstellt hat.
- Wählen Sie im Feld "Select an Object" (Objekt auswählen) den My_kav -Index aus.
Sie sollten jetzt in der Lage sein, eine Liste aller Vektordatensätze anzuzeigen, die Data 360 aus den Knowledge-Musterartikeln erstellt hat.
Sie können die im Suchindex enthaltenen CDMOs und IDMOs in Salesforce in Anwendungen wie Flow Builder, Agentforce, Prompt-Generator und sogar Tableau verwenden. Oder sehen Sie sich die Dokumentation zur Vektorsuche an, um mehr über das Ausführen von Vektorsuchabfragen zu erfahren.
Durch die Verknüpfung unstrukturierter Daten mit Data 360 können Sie Suchergebnisse für eine Vielzahl von kundenorientierten Anwendungsfällen auf einer Fülle von Daten aufbauen. Durch Segmentierung und Vektorisierung dieser Daten können Sie die Vektorsuche in generativen KI-Anwendungen von Einstein, in Flow Builder und sogar in Tableau nutzen, um Ihre KI-, Analyse- und Automatisierungsfähigkeiten zu verbessern.
