Erstellen einer Suchindexkonfiguration

Lernziele

Nach dieser Lektion sind Sie in der Lage, die folgenden Aufgaben auszuführen:

Beschreiben, wie Suchindexkonfigurationen und Kontextbildung in Data 360 funktionieren
Erstellen einer Vektorsuchindex-Konfiguration

Hinweis

Lernen Sie auf Deutsch? Beginnen Sie die Aufgabe in einem Trailhead Playground in der Sprache Deutsch und verwenden Sie für die Navigation die in Klammern angegebenen Übersetzungen. Kopieren und fügen Sie nur die Angaben in Englisch ein, da zur Überprüfung der Aufgabe Daten in Englisch benötigt werden. Wenn Sie die Aufgabe in Ihrer deutschen Organisation nicht bestehen, empfehlen wir Ihnen folgende Vorgehensweise: (1) Stellen Sie das Gebietsschema auf USA um, (2) legen Sie Englisch als Sprache fest (Anweisungen dazu finden Sie hier) und (3) klicken Sie erneut auf die Schaltfläche "Check Challenge" (Aufgabe überprüfen).

Weitere Details dazu, wie Sie die übersetzte Trailhead-Umgebung optimal nutzen können, finden Sie unter dem Badge "Trailhead in Ihrer Sprache".

Verankern einer Suche in unstrukturierten Daten mit Suchindexkonfigurationen

Die Suche auf Basis unstrukturierter und strukturierter Daten verbessert die Nutzung generativer KI-, Analyse- und Automatisierungstools auf der gesamten Salesforce-Plattform. Die in Kontext verankerte Suche bringt kundenspezifische Daten in Anwendungen wie Agentforce, Tableau und Flow Builder ein und stellt sicher, dass die Ergebnisse gut auf die Absichten und Kontexte Ihrer Benutzer abgestimmt sind. Diese Ausrichtung führt zu genaueren und relevanteren KI-generierten Inhalten, tieferen Erkenntnissen aus Analysen und effizienteren Automatisierungsabläufen für Ihre Teams und Kunden.

Zum Verankern der Suche müssen Sie Ihre unstrukturierten Daten in semantisch passende Segmente aufteilen und aus diesen Segmenten Vektoreinbettungen erstellen – numerische Darstellungen Ihrer in Segmente unterteilten Daten. Die im Data 360-Suchindex gespeicherten segmentierten Inhalte können in generativen KI-Anwendungen (Prompt-Generator und Agentforce) sowie in Automatisierungs- (Flow Builder) und Analyseanwendungen (Tableau) durchsucht und verwendet werden.

Segmentieren unstrukturierter Daten

In der vorherigen Lektion haben wir behandelt, wie Data 360 über unstrukturierte Datenmodellobjekte (UDMOs) auf unstrukturierte Daten verweist. Auch UDMOs oder beliebige DMOs mit Textfeldern, wie etwa Salesforce Knowledge-Artikel, lassen sich segmentieren. Genau damit wollen wir uns in dieser Lektion befassen.

Wenn Sie UDMOs oder DMOs segmentieren, teilen Sie sie in handhabbare, semantisch bedeutsame Segmente auf. Diese Texteinheiten werden in Data 360 in CDMOs (Chunk Data Model Objects, Segment-Datenmodellobjekte) gespeichert, die aus Datenmodellobjekten oder unstrukturierten Datenmodellobjekten erstellt werden.

Funktionsweise der Segmentierung

Data 360 unterstützt verschiedene Strategien zur Segmentierung.

Die auf Semantik basierende Extraktion von Textpassagen verwendet die inhärente semantische Bedeutung von HTML-Tags, um ein Dokument in Textpassagen aufzuteilen. HTML-Elemente wie Überschriften (<h1>, <h2>), Listen (<ul>, <ol>) oder fett formatierter Text (<strong>), der als Untertitel fungiert, werden als logische Grenzen von Textpassagen angesehen.

Die fensterbasierte Extraktionsstrategie für Textpassagen verwendet Elemente auf Blockebene, wie <div>- und <p>-Tags oder unformatierten Text, der durch Zeilenumbrüche getrennt ist, um Dokumente in Textpassagen zu segmentieren. Wenn ein Absatz überhaupt kein HTML enthält, erfolgt die Extraktion auf Satzebene.

Weitere Informationen zur Segmentierungsstrategie finden Sie in der Salesforce-Hilfe.

Sehen wir uns zunächst an, was geschieht, nachdem Ihre Daten segmentiert wurden.

Erstellen von Vektoreinbettungen aus segmentierten Inhalten

Nachdem Data 360 Ihre Inhalte segmentiert hat, erstellt es eine Vektoreinbettung – eine numerische Darstellung der aufgeteilten Inhalte, die in Ihren generativen KI-, Automatisierungs- oder Analyseanwendungen von Salesforce abgerufen oder verwendet werden kann.

Vektoreinbettungen sind numerische Darstellungen von Text, die Beziehungen zwischen Wörtern oder Formulierungen speichern. Die Einbettung erfasst die semantische Bedeutung des Inhalts, daher haben Inhaltssegmente, die semantisch ähnlich sind, ähnliche Vektoreinbettungen. Diese Darstellungen unterstützen Maschinen dabei, Sprache effektiv zu verarbeiten und zu verstehen.

In Data 360 wird auf Vektoreinbettungen durch Index-Datenmodellobjekte (IDMOs) verwiesen, die wir uns später in dieser Lektion genauer ansehen werden.

Weitere Informationen zu den Vektoreinbettungen und segmentierten Inhalten finden Sie in der Salesforce-Hilfe.

Erstellen von Vektorsuchindex-Konfigurationen

Damit Ihre unstrukturierten Daten zum Durchsuchen bereit werden, müssen Sie sie segmentieren und vektorisieren. Zu diesem Zweck erstellen Sie eine Suchindexkonfiguration. Sie möchten eine Suchindexkonfiguration für alle Datenobjekte mit Textfeldern erstellen, die Informationskonzepte, Beschreibungen oder detaillierte Erläuterungen enthalten, nach denen Ihre Benutzer suchen, um relevante Ergebnisse zu finden. Ein Beispiel für solche Daten sind Salesforce Knowledge-Artikel oder andere Textdokumente (wie Chat-Abschriften), die in einem externen Blob-Speicher wie Amazon S3 gespeichert sind.

Erstellen einer Vektorsuchindex-Konfiguration aus Knowledge-Artikeln

In der vorhergegangenen Lektion haben Sie aus dem Knowledge-Paket im Salesforce CRM-Konnektor einen Datenstrom und ein Data Lake-Objekt erstellt, wodurch Ihnen eine Reihe von Knowledge-Musterartikeln zur Verfügung steht.

Die Indizierung des Knowledge-Artikelversionsobjekts ist nützlich, da Sie dieses Objekt zum Abfragen, Abrufen und Durchsuchen aller Arten von Artikeln anhand ihrer Version verwenden können. Das Knowledge-Artikelversion-Objekt enthält diese Felder, die für die Suche indiziert werden sollten.

Name: Der Name oder Titel des Knowledge-Artikels
Description (Beschreibung): Die Beschreibung oder Zusammenfassung des Knowledge-Artikels, aus der Zusammenfassung zugeordnet
Benutzerdefinierte Textfelder: Alle RTF-Felder (Grenzwert 131K), die die unstrukturierten Daten enthalten

Wenn Sie einen Suchindex im erweiterten Generator erstellen, können Sie Ihren Suchindex optimieren, um genauere Ergebnisse zu liefern, indem Sie auf die verwendeten Strategien für die Feldauswahl und die Aufteilung achten. Weitere Informationen finden Sie unter Optimieren von Suchindizes: Feldauswahl und Chunking.

Erstellen einer Vektorsuchindex-Konfiguration für das Knowledge-Artikelversion-DMO

Sie führen diese Schritte in Ihrer Data 360-Organisation durch, um die Aufgabe am Ende dieser Einheit zu bestehen.

Advanced Setup (Erweitertes Setup) gibt Ihnen mehr Kontrolle über die Optionen zur Segmentierung und Vektorisierung, aber für diese Aufgabe verwenden Sie größtenteils die Standardwerte.

Starten Sie Ihren Data Cloud-Playground, wenn das noch nicht erfolgt ist.
Wählen Sie im App Launcher Data Cloud aus.
Klicken Sie auf Search Indexes (Suchindizes) und dann auf New (Neu).
Wenn "Search Index" (Suchindex) nicht in der Data Cloud-Navigation angezeigt wird, klicken Sie auf das Dropdown-Menü More (Mehr) und wählen Sie dann Search Indexes (Suchindizes) aus.
Klicken Sie auf Advanced Setup (Erweitertes Setup) und dann auf Next (Weiter).
Wählen Sie auf der Seite "Select Source Object" (Quellobjekt auswählen) Vector Search (Vektorsuche), das Knowledge-Artikelversion-DMO aus und klicken Sie auf Next (Weiter). Wenn eine Fehlermeldung angezeigt wird, ignorieren Sie sie.
Klicken Sie auf der Seite "Select Fields to Chunk" (Zu segmentierende Felder auswählen) auf Manage Fields (Felder verwalten).
Wählen Sie alle Felder aus und klicken Sie auf Save (Speichern).
Behalten Sie den Standardwert für die Segmentierungsstrategie bei und klicken Sie auf Next (Weiter).
Behalten Sie auf der Seite "Select a Vectorization Strategy" (Vektorisierungsstrategie auswählen) die standardmäßige Vektorisierungsstrategie bei und klicken Sie auf Next (Weiter).
Fügen Sie auf der Seite "Select Related Fields for Search Filtering" (Verwandte Felder für die Suchfilterung auswählen) keine Felder hinzu und klicken Sie auf Next (Weiter).
Ersetzen sie auf der Seite "Search Index Configuration Details" (Details der Suchindexkonfiguration) den automatisch generierten Namen der Suchindexkonfiguration durch My_kav. (Der API-Name der Suchindexkonfiguration wird automatisch eingetragen).
Klicken Sie auf Save (Speichern).

Geschafft! Ihre neue Suchindexkonfiguration, My_kav, ist auf der Suchindex-Registerkarte aufgelistet.

Anzeigen der CDMO und IDMOs der Knowledge-Artikelversion

Nachdem Sie eine Suchindexkonfiguration erstellt haben, ändert sich deren Status zu "Submitted" (Übermittelt) und anschließend zu "In Progress" (In Bearbeitung), während die Daten aus der Quell-DMO/UDMO verarbeitet werden. Wenn keine Fehler auftreten, ändert sich der Status von "Submitted" (Übermittelt) zu "In Progress" (In Bearbeitung) und anschließend zu "Ready" (Bereit). Es werden keine Datensätze im Daten-Explorer angezeigt, bis der Status des Suchindex "Ready" (Bereit) ist.

Es kann einige Minuten dauern, bis Data 360 die Daten im Suchindex verarbeitet hat, aber die Dauer kann variieren. Holen Sie sich also ein Getränk oder strecken Sie die Beine aus. Wenn Sie zurückkommen, klicken Sie auf "Refresh" (Aktualisieren) und überprüfen Sie, ob der letzte Ausführungsstatus des Suchindex "Ready" (Bereit) lautet.

Der nützlichste Inhalt eines Knowledge-Artikels befindet sich im Feld "Description" (Beschreibung). Normalerweise sind die Musterartikel so klein, dass sie lediglich aus einem Segment bestehen. Das bedeutet, dass es für jeden Datensatz im CDMO und IDMO der Knowledge-Artikelversion jeweils ein Segment und einen Vektor gibt, aber längere Inhalte könnten mehr Datensätze in jedem DMO aufweisen.

Sehen wir uns kurz das CDMO und IDMO an, die wir für das DMO der Knowledge-Artikelversion erstellt haben.

Überzeugen Sie sich, dass der Status des Suchindex "Ready" (Bereit) ist.
Klicken Sie in Data Cloud auf Data Explorer (Daten-Explorer).
Wählen Sie im Objekt-Dropdown-Menü Data Model Object (Datenmodellobjekt) aus.
Wählen Sie im Feld "Select an Object" (Objekt auswählen) das Segment My_kav aus.
Jetzt sollten Sie in der Lage sein, eine Liste aller Segmente zu sehen, die Data 360 aus den Knowledge-Musterartikeln erstellt hat.
Wählen Sie im Feld "Select an Object" (Objekt auswählen) den My_kav -Index aus.
Sie sollten jetzt in der Lage sein, eine Liste aller Vektordatensätze anzuzeigen, die Data 360 aus den Knowledge-Musterartikeln erstellt hat.

Sie können die im Suchindex enthaltenen CDMOs und IDMOs in Salesforce in Anwendungen wie Flow Builder, Agentforce, Prompt-Generator und sogar Tableau verwenden. Oder sehen Sie sich die Dokumentation zur Vektorsuche an, um mehr über das Ausführen von Vektorsuchabfragen zu erfahren.

Durch die Verknüpfung unstrukturierter Daten mit Data 360 können Sie Suchergebnisse für eine Vielzahl von kundenorientierten Anwendungsfällen auf einer Fülle von Daten aufbauen. Durch Segmentierung und Vektorisierung dieser Daten können Sie die Vektorsuche in generativen KI-Anwendungen von Einstein, in Flow Builder und sogar in Tableau nutzen, um Ihre KI-, Analyse- und Automatisierungsfähigkeiten zu verbessern.

Geschätzte Zeit

Themen

Benötigen Sie Hilfe?

Data 360 – Ressourcen