Kennenlernen der Suchindextypen in Data 360
Lernziele
Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:
- Beschreiben der in Data 360 unterstützten Suchindizes
- Bestimmen, welcher Suchindex für Ihren Anwendungsfall erstellt werden sollte
Verwenden der Suche in Data 360 für die Kontextbildung von KI
Das Bilden von Kontext für KI aus kundenspezifischen Daten erhöht den Wert von generativer KI in Anwendungen, Analysen und Automatisierungstools auf der gesamten Salesforce Platform. Kontextbildung für KI kann mit unstrukturierten, teilweise strukturierten oder strukturierten Daten erreicht werden. Durch Verwenden der Benutzerabfrage zum Abrufen der relevanten CRM-Daten für die Kontextbildung des KI-Modells stellen Anwendungen wie Agentforce, Tableau und Flow Builder sicher, dass die Ergebnisse genau an den Absichten Ihrer Benutzer ausgerichtet sind. Nutzen Sie die Suchfunktion in Data 360, um genaue und relevante KI-generierte Inhalte, tiefere Einblicke aus Analysen und effizientere Automatisierungsworkflows für Ihre Teams und Kunden zu gewährleisten.
In Data 360 können Sie Suchindizes für beliebige Daten erstellen, einschließlich unstrukturierter Daten in Knowledge Bases. Data 360 unterstützt die folgenden Typen von Suchindizes.
- Vektorsuche
- Hybridsuche
Zum Erstellen von Suchindizes in Data 360 importieren Sie Ihre Daten in Data 360. Data 360 erfasst unstrukturierte Daten, ordnet sie Standard-Datenmodellobjekten (DMO) oder unstrukturierten Datenmodellobjekten (UDMO) zu und erstellt aus den Daten aussagekräftige Inhaltssegmente. Anschließend erstellt Data 360 Vektoreinbettungen, um einen Suchindex aufzubauen, der Anwendungen beim Verständnis semantischer und lexikalischer Ähnlichkeiten mit den Daten unterstützt.
Auswählen eines Suchtyps
Bevor Sie entscheiden, welcher Suchtyp für Ihren speziellen Anwendungsfall und Ihr Datenset am besten geeignet ist, wollen wir zunächst untersuchen, wie sich diese Suchtypen voneinander unterscheiden und welche Art von Suchanfragen die relevantesten Ergebnisse liefert.
Vektorsuche
Die Vektorsuche, auch als semantische Suche bekannt, umfasst das Abrufen semantisch ähnlicher Daten (oder Datensegmente) für eine bestimmte Suchanfrage. Zu diesen Daten können auch Videos, Audiomaterial und Anrufabschriften gehören. Die Vektorsuche erfolgt durch Segmentieren der Daten, die Erstellung von Vektoreinbettungen und die Suche nach Vektoreinbettungen, die semantische Ähnlichkeiten mit der Suchanfrage aufweisen.

Die Vektorsuche funktioniert gut für Suchabfragen in langer Form, mit denen die Benutzer nach allgemeinen Informationen suchen. Die Suchabfrage ruft Daten ab, die einen hohen Vektorsuchwert aufweisen, der mit den semantisch am besten passenden Ergebnissen korreliert.
Hier ist beispielsweise eine Suchanfrage, die nach Informationen zur Funktionsweise des Google Chrome-Browsers sucht. Die Suchabfrage ruft die Segmente mit der höchsten Punktzahl in der Vektorsuche ab, die sich auf die größte semantische Übereinstimmung mit der Suchabfrage bezieht.
Abfrage:
select c.Chunk_c, v.score_c from vector_search(table(WikiArticle_c_vector_search_2_index__dlm), 'how does Google Chrome internet browser work', '', 100) as v join WikiArticle_c_vector_search_2_ chunk_dlm as c on v.SourceRecordId_c=c.RecordId_c ORDER by v.score_c desc limit 3;
Ergebnis:

Hybridsuche
Die Hybridsuche kombiniert die Stärken der semantisch orientierten Vektorsuche mit der Fähigkeit der Stichwortsuche, Fachvokabular zu verarbeiten. Die Hybridsuche führt die aus beiden Sucharten abgerufenen Informationen zusammen und ordnet die Ergebnisse dann mithilfe einer Funktion zur Bewertung dieser Fusion, um die relevantesten Informationen anzuzeigen.
Die standardmäßige Funktion zur Bewertung der Fusion, die für Hybridsuchen eingesetzt wird, wurde anhand interner Benchmarks für eine Vielzahl suchbasierter Aufgaben optimiert. Die Trainings- und Auswertungsdaten basieren auf tatsächlichen, erfassten Abfragen aus Einstein Search und Anwendungen der generativen KI wie Antworten von Einstein Search.

Die Hybridsuche ist eine hervorragende Option für Suchabfragen in langer Form, die auch spezifische Suchbegriffe beinhalten. Die Suchabfrage ruft Daten ab, die eine hohe Punktzahl in der Stichwortsuche aufweisen, was genauer Übereinstimmung mit Stichwörtern entspricht, und einer hohen Punktzahl in der Vektorsuche, die der höchsten semantischen Übereinstimmung entspricht. Dies führt dazu, dass Daten mit einem hohen Wert für die Hybridsuche abgerufen werden, der mit den relevantesten Suchergebnissen korreliert.
Für dasselbe Abfragebeispiel, das wir für die Vektorsuche verwendet haben, begünstigt die Stichwortsuche höher bewertete Positionen für relevantere Inhalte und bietet dem LLM damit eine bessere Grundlage.
Abfrage:
select c.Chunk__c, h.hybrid_score__c, h.keyword_score__c, h.vector_score__c from hybrid_search(table(WikiArticle_c_hybrid_search_2_index__dlm), 'how does Google Chrome internet browser work ?', '', 100) as h join WikiArticle_c_hybrid_search_2_chunk__dlm as c on h.SourceRecordId__c=c.RecordId__c ORDER by h.hybrid_score__c desc limit 2;
Ergebnis:

Zusammenfassung
Erstellen Sie Suchindizes in Data 360, um KI im Kontext der unstrukturierten, halb strukturierten oder strukturierten Daten Ihres Unternehmens zu verankern.
Wählen Sie einen Suchtyp aus, der für die Suchanfragen Ihrer Endbenutzer und Anwendungen am besten geeignet ist. Wenn die Suchabfragen Ihrer Benutzer hauptsächlich allgemeine Informationen betreffen oder die Suchabfragen lang sind (mehr als fünf Wörter), dann ist eine Vektorsuche für dieses Szenario ausreichend. Die Vektorsuche liefert relevante Ergebnisse, wenn eine Benutzerabfrage kontextbezogenen Inhalt hat, was in der Regel bei längeren Abfragen der Fall ist.
Damit Sie die genauesten und relevantesten Ergebnisse erhalten, in denen sowohl semantische Suchtreffer als auch Stichwortsuchtreffer für eine Suchanfrage kombiniert sind, erstellen Sie einen Hybridsuchindex.
Ressourcen
- Salesforce-Hilfe: Verwenden unstrukturierter Daten in Data 360
- Salesforce-Hilfe: Vektorsuche
- Salesforce-Hilfe: Hybridsuche
- Salesforce Engineering-Blogpost: Wie die Hybridsuche von Data Cloud Stichwort- und Vektorabfrage kombiniert, um das Suchergebnis zu verbessern
