Skip to main content
Register now for TDX! Join the must-attend event to experience what’s next and learn how to build it.

Kennenlernen der Suchindextypen in Data 360

Lernziele

Nachdem Sie diese Lektion abgeschlossen haben, sind Sie in der Lage, die folgenden Aufgaben auszuführen:

  • Beschreiben der in Data 360 unterstützten Suchindizes
  • Bestimmen, welcher Suchindex für Ihren Anwendungsfall erstellt werden sollte

Verwenden der Suche in Data 360 für die Kontextbildung von KI

Das Bilden von Kontext für KI aus kundenspezifischen Daten erhöht den Wert von generativer KI in Anwendungen, Analysen und Automatisierungstools auf der gesamten Salesforce Platform. Kontextbildung für KI kann mit unstrukturierten, teilweise strukturierten oder strukturierten Daten erreicht werden. Durch Verwenden der Benutzerabfrage zum Abrufen der relevanten CRM-Daten für die Kontextbildung des KI-Modells stellen Anwendungen wie Agentforce, Tableau und Flow Builder sicher, dass die Ergebnisse genau an den Absichten Ihrer Benutzer ausgerichtet sind. Nutzen Sie die Suchfunktion in Data 360, um genaue und relevante KI-generierte Inhalte, tiefere Einblicke aus Analysen und effizientere Automatisierungsworkflows für Ihre Teams und Kunden zu gewährleisten.

In Data 360 können Sie Suchindizes für beliebige Daten erstellen, einschließlich unstrukturierter Daten in Knowledge Bases. Data 360 unterstützt die folgenden Typen von Suchindizes.

  • Vektorsuche
  • Hybridsuche

Zum Erstellen von Suchindizes in Data 360 importieren Sie Ihre Daten in Data 360. Data 360 erfasst unstrukturierte Daten, ordnet sie Standard-Datenmodellobjekten (DMO) oder unstrukturierten Datenmodellobjekten (UDMO) zu und erstellt aus den Daten aussagekräftige Inhaltssegmente. Anschließend erstellt Data 360 Vektoreinbettungen, um einen Suchindex aufzubauen, der Anwendungen beim Verständnis semantischer und lexikalischer Ähnlichkeiten mit den Daten unterstützt.

Note

Die Definitionen von Vektoreinbettungen und anderen Data 360-Begriffen finden Sie im Glossar der Begriffe in Data 360.

Auswählen eines Suchtyps

Bevor Sie entscheiden, welcher Suchtyp für Ihren speziellen Anwendungsfall und Ihr Datenset am besten geeignet ist, wollen wir zunächst untersuchen, wie sich diese Suchtypen voneinander unterscheiden und welche Art von Suchanfragen die relevantesten Ergebnisse liefert.

Vektorsuche

Die Vektorsuche, auch als semantische Suche bekannt, umfasst das Abrufen semantisch ähnlicher Daten (oder Datensegmente) für eine bestimmte Suchanfrage. Zu diesen Daten können auch Videos, Audiomaterial und Anrufabschriften gehören. Die Vektorsuche erfolgt durch Segmentieren der Daten, die Erstellung von Vektoreinbettungen und die Suche nach Vektoreinbettungen, die semantische Ähnlichkeiten mit der Suchanfrage aufweisen.

In Data 360 erfasste Daten aus verschiedenen Datenquellen. Data 360 teilt die Daten in Segmente auf und erstellt Vektoreinbettungen, um einen Vektorindex aufzubauen. C360-Anwendungen wie Tableau, Agentforce usw. fragen diesen Vektorindex anschließend ab und erhalten so relevante Ergebnisse.

Die Vektorsuche funktioniert gut für Suchabfragen in langer Form, mit denen die Benutzer nach allgemeinen Informationen suchen. Die Suchabfrage ruft Daten ab, die einen hohen Vektorsuchwert aufweisen, der mit den semantisch am besten passenden Ergebnissen korreliert.

Hier ist beispielsweise eine Suchanfrage, die nach Informationen zur Funktionsweise des Google Chrome-Browsers sucht. Die Suchabfrage ruft die Segmente mit der höchsten Punktzahl in der Vektorsuche ab, die sich auf die größte semantische Übereinstimmung mit der Suchabfrage bezieht.

Abfrage:

select c.Chunk_c, v.score_c from vector_search(table(WikiArticle_c_vector_search_2_index__dlm),
 'how does Google Chrome internet browser work', '', 100) as v join WikiArticle_c_vector_search_2_
chunk_dlm as c on v.SourceRecordId_c=c.RecordId_c ORDER by v.score_c desc limit 3;

Ergebnis:

Die Abbildung zeigt Abfrageergebnisse für eine Vektorsuche in absteigender Reihenfolge der in der Vektorsuche erzielten Punktzahl. Datensegmente mit der größten semantischen Übereinstimmung mit der Suchabfrage werden in den Ergebnissen zuoberst angezeigt.

Hybridsuche

Die Hybridsuche kombiniert die Stärken der semantisch orientierten Vektorsuche mit der Fähigkeit der Stichwortsuche, Fachvokabular zu verarbeiten. Die Hybridsuche führt die aus beiden Sucharten abgerufenen Informationen zusammen und ordnet die Ergebnisse dann mithilfe einer Funktion zur Bewertung dieser Fusion, um die relevantesten Informationen anzuzeigen.

Die standardmäßige Funktion zur Bewertung der Fusion, die für Hybridsuchen eingesetzt wird, wurde anhand interner Benchmarks für eine Vielzahl suchbasierter Aufgaben optimiert. Die Trainings- und Auswertungsdaten basieren auf tatsächlichen, erfassten Abfragen aus Einstein Search und Anwendungen der generativen KI wie Antworten von Einstein Search.

Daten aus verschiedenen Datenquellen werden in Data 360 erfasst. Data 360 teilt die Daten in Segmente auf und erstellt Vektoreinbettungen. Aus den segmentierten und vektorisierten Daten erstellt Data 360 einen Vektorsuchindex und einen Stichwort-Suchindex. Die Fusionsbewertungsfunktion der Hybridsuche bewertet anschließend die abgerufenen Ergebnisse und stellt die relevanteste Antwort den C360-Anwendungen zur Verfügung, die die Daten abfragen.

Die Hybridsuche ist eine hervorragende Option für Suchabfragen in langer Form, die auch spezifische Suchbegriffe beinhalten. Die Suchabfrage ruft Daten ab, die eine hohe Punktzahl in der Stichwortsuche aufweisen, was genauer Übereinstimmung mit Stichwörtern entspricht, und einer hohen Punktzahl in der Vektorsuche, die der höchsten semantischen Übereinstimmung entspricht. Dies führt dazu, dass Daten mit einem hohen Wert für die Hybridsuche abgerufen werden, der mit den relevantesten Suchergebnissen korreliert.

Für dasselbe Abfragebeispiel, das wir für die Vektorsuche verwendet haben, begünstigt die Stichwortsuche höher bewertete Positionen für relevantere Inhalte und bietet dem LLM damit eine bessere Grundlage.

Abfrage:

select c.Chunk__c, h.hybrid_score__c, h.keyword_score__c, h.vector_score__c from
hybrid_search(table(WikiArticle_c_hybrid_search_2_index__dlm), 'how does Google Chrome
internet browser work ?', '', 100) as h join WikiArticle_c_hybrid_search_2_chunk__dlm
as c on h.SourceRecordId__c=c.RecordId__c ORDER by h.hybrid_score__c desc limit 2;

Ergebnis:

Die Abbildung zeigt Abfrageergebnisse für eine Hybridsuche in absteigender Reihenfolge der in der Hybridsuche erzielten Punktzahl. Datensegmente mit der größten Übereinstimmung mit der Suchabfrage bei der semantischen und der Stichwortsuche werden in den Ergebnissen zuoberst angezeigt.

Note

Für die gleiche Abfrage im bereits verwendeten Google Chrome-Beispiel ist die Hybridsuche wesentlich leistungsfähiger als eine reine Vektorsuche, da sie Datensegmente zurückgibt, die sowohl Informationen über die Funktionsweise von Browsern als auch spezifische Details zu Google Chrome-Browser zurückgibt.

Zusammenfassung

Erstellen Sie Suchindizes in Data 360, um KI im Kontext der unstrukturierten, halb strukturierten oder strukturierten Daten Ihres Unternehmens zu verankern.

Wählen Sie einen Suchtyp aus, der für die Suchanfragen Ihrer Endbenutzer und Anwendungen am besten geeignet ist. Wenn die Suchabfragen Ihrer Benutzer hauptsächlich allgemeine Informationen betreffen oder die Suchabfragen lang sind (mehr als fünf Wörter), dann ist eine Vektorsuche für dieses Szenario ausreichend. Die Vektorsuche liefert relevante Ergebnisse, wenn eine Benutzerabfrage kontextbezogenen Inhalt hat, was in der Regel bei längeren Abfragen der Fall ist.

Damit Sie die genauesten und relevantesten Ergebnisse erhalten, in denen sowohl semantische Suchtreffer als auch Stichwortsuchtreffer für eine Suchanfrage kombiniert sind, erstellen Sie einen Hybridsuchindex.

Ressourcen

Teilen Sie Ihr Trailhead-Feedback über die Salesforce-Hilfe.

Wir würden uns sehr freuen, von Ihren Erfahrungen mit Trailhead zu hören: Sie können jetzt jederzeit über die Salesforce-Hilfe auf das neue Feedback-Formular zugreifen.

Weitere Infos Weiter zu "Feedback teilen"