Conoscere i tipi di indici di ricerca in Data 360
Obiettivi di apprendimento
Al completamento di questa unità, sarai in grado di:
- Descrivere gli indici di ricerca supportati in Data 360.
- Identificare l’indice di ricerca da creare per casi d’uso specifici.
Utilizzare le ricerche in Data 360 per radicare l’IA nel contesto
Il radicamento dell’IA nel contesto di dati specifici dei clienti incrementa il valore dell’IA generativa nelle applicazioni, nelle funzionalità analitiche e negli strumenti di automazione in Salesforce Platform nel suo complesso. Il radicamento dell’IA nel contesto può essere realizzato con dati non strutturati, semi-strutturati o strutturati. Recuperando dati pertinenti dal CRM tramite query utente per radicare il modello di IA nel contesto, applicazioni come Agentforce, Tableau e Flow Builder assicurano che gli output siano perfettamente in linea con l’intento degli utenti. Grazie alle ricerche in Data 360 è possibile ottenere contenuti generati dall’IA accurati e pertinenti, approfondimenti più completi dagli strumenti di analisi e flussi di lavoro automatizzati più efficienti per i team e per i clienti.
In Data 360 è possibile creare indici di ricerca su qualsiasi tipo di dati, inclusi i dati non strutturati delle knowledge base. Data 360 supporta i seguenti tipi di indici di ricerca:
- Ricerca vettoriale
- Ricerca ibrida
Per creare indici di ricerca in Data 360 è necessario importare i dati nella piattaforma. Data 360 importa i dati non strutturati, li mappa su oggetti modello di dati (DMO, Data Model Object) standard o su oggetti modello di dati non strutturati (UDMO, Unstructured Data Model Object) e crea blocchi di contenuti significativi a partire da quei dati. Successivamente, Data 360 crea incorporamenti vettoriali per creare un indice di ricerca che consenta alle applicazioni di comprendere somiglianze semantiche e lessicali all’interno dei dati.
Selezionare un tipo di ricerca
Prima di decidere quale tipo di ricerca è più adatto al tuo caso d’uso specifico e al tuo set di dati, vediamo quali sono le differenze tra questi tipi di ricerca e quali tipi di query di ricerca restituiscono le risposte più pertinenti.
Ricerca vettoriale
La ricerca vettoriale, nota anche come ricerca semantica, consiste nel recuperare dati (o blocchi di dati) semanticamente simili in base a una determinata query di ricerca. I dati possono includere anche video, audio e trascrizioni di chiamate. Il recupero mediante ricerca vettoriale viene effettuato attraverso la suddivisione dei dati in blocchi, la creazione di incorporamenti vettoriali e la ricerca di incorporamenti vettoriali che presentano forti somiglianze semantiche con la query di ricerca.

La ricerca vettoriale funziona bene nel caso di query di ricerca lunghe che gli utenti utilizzano per recuperare informazioni generali. La query di ricerca recupera i dati che presentano un elevato punteggio di ricerca vettoriale correlato alle corrispondenze semantiche più prossime.
Ad esempio, di seguito è riportata una query che ricerca informazioni su come funziona il browser Google Chrome. La query recupera i blocchi con il punteggio di ricerca vettoriale più elevato, che è correlato alla corrispondenza semantica più prossima alla query di ricerca.
Query:
select c.Chunk_c, v.score_c from vector_search(table(WikiArticle_c_vector_search_2_index__dlm), 'how does Google Chrome internet browser work', '', 100) as v join WikiArticle_c_vector_search_2_ chunk_dlm as c on v.SourceRecordId_c=c.RecordId_c ORDER by v.score_c desc limit 3;
Risultato:

Ricerca ibrida
La ricerca ibrida combina i vantaggi della ricerca vettoriale sensibile alla semantica con la capacità della ricerca per parole chiave di gestire il vocabolario di un dominio specifico. Questo tipo di ricerca combina le informazioni recuperate da entrambi i tipi di ricerca e, successivamente, ordina i risultati utilizzando una funzione di fusione dei ranking per mostrare le informazioni più rilevanti.
La funzione di fusione dei ranking predefinita della ricerca ibrida è ottimizzata mediante benchmark interni per una varietà di attività basate sulla ricerca. I dati di addestramento e valutazione sono basati su query effettivamente acquisite da Ricerca Einstein e applicazioni di IA generativa come Risposte Ricerca Einstein.

La ricerca ibrida è un’ottima opzione per query di ricerca lunghe in cui sono inclusi anche termini di ricerca specifici. La query recupera i dati che presentano un elevato punteggio di ricerca per parole chiave, correlato a corrispondenze esatte con le parole chiave, e un elevato punteggio di ricerca vettoriale, correlato alle corrispondenze semantiche più prossime. Ciò consente di recuperare dati con un punteggio di ricerca ibrida elevato, correlato ai risultati di ricerca più pertinenti.
Considerando lo stesso esempio di query che abbiamo utilizzato per la ricerca vettoriale, la ricerca per parole chiave promuove i contenuti più pertinenti in posizioni di ranking più elevate, fornendo così all’LLM un miglior radicamento nel contesto.
Query:
select c.Chunk__c, h.hybrid_score__c, h.keyword_score__c, h.vector_score__c from hybrid_search(table(WikiArticle_c_hybrid_search_2_index__dlm), 'how does Google Chrome internet browser work ?', '', 100) as h join WikiArticle_c_hybrid_search_2_chunk__dlm as c on h.SourceRecordId__c=c.RecordId__c ORDER by h.hybrid_score__c desc limit 2;
Risultato:

Riepilogo
Gli indici di ricerca in Data 360 consentono di radicare l’IA nel contesto dei dati non strutturati, semi-strutturati o strutturati dell’organizzazione.
È possibile selezionare il tipo di ricerca più adatto alle query di ricerca utilizzate dagli utenti e dalle applicazioni. Se le query degli utenti riguardano principalmente informazioni generali o se sono lunghe (ossia contengono più di cinque parole), una ricerca vettoriale è sufficiente. La ricerca vettoriale fornisce risultati pertinenti quando l’utente dispone di contenuti contestuali, che generalmente corrispondono a query più lunghe.
Per ottenere risultati più accurati e pertinenti in cui le corrispondenze derivanti dalla ricerca semantica e quelle derivanti dalla ricerca per parole chiave sono combinate, è opportuno creare un indice di ricerca ibrida.
Risorse
- Guida di Salesforce: Dati non strutturati in Data 360
- Guida di Salesforce: Ricerca vettoriale
- Guida di Salesforce: Ricerca ibrida
- Post del blog Salesforce Engineering: How Data Cloud Hybrid Search Combines Keyword and Vector Retrieval to Elevate the Search Experience (In che modo la ricerca ibrida di Data Cloud combina il recupero per parole chiave e quello vettoriale per migliorare l’esperienza di ricerca)
