Creare una configurazione dell’indice di ricerca
Obiettivi di apprendimento
Al completamento di questa unità, sarai in grado di:
- Spiegare come funzionano le configurazioni dell’indice di ricerca e il radicamento nel contesto in Data 360.
- Creare una configurazione dell’indice di ricerca vettoriale.
Radicare la ricerca nel contesto di dati non strutturati con le configurazioni dell’indice di ricerca
Il radicamento della ricerca nel contesto dei dati strutturati e non strutturati migliora l’uso dell’IA generativa e degli strumenti di analisi e di automazione in tutta Salesforce Platform. La ricerca radicata nel contesto importa i dati specifici del cliente in applicazioni come Agentforce, Tableau e Flow Builder, assicurando output messi a punto per gli intenti e i contesti specifici degli utenti. Questo allineamento consente di ottenere contenuti generati dall’IA più accurati e pertinenti, approfondimenti più completi dagli strumenti di analisi e flussi di lavoro automatizzati più efficienti per i team e per i clienti.
Per radicare la ricerca nel contesto, devi segmentare i dati non strutturati in blocchi di dati semanticamente appropriati e, da quei blocchi, creare incorporamenti vettoriali, ovvero rappresentazioni numeriche dei blocchi di dati. Il contenuto suddiviso in blocchi, archiviato nell’indice di ricerca di Data 360, può essere consultato tramite la ricerca e utilizzato nelle applicazioni di IA generativa Einstein (Generatore di prompt e Agentforce) e per applicazioni di automazione (Flow Builder) e di analisi (Tableau).

Suddividere in blocchi i dati non strutturati
Nell’unità precedente abbiamo visto come Data 360 fa riferimento ai dati non strutturati attraverso oggetti modelli dati non strutturati (UDMO). È anche possibile suddividere in blocchi gli UDMO o qualsiasi DMO che contenga campi di testo, quali ad esempio gli articoli Knowledge di Salesforce. In questa unità faremo proprio questo.
Quando suddividi gli UDMO o i DMO, li frammenti in blocchi semanticamente sensati e gestibili. Queste unità di testo sono archiviate in Data 360 come oggetti modello di dati in blocchi (CDMO), creati a partire da oggetti modello di dati o oggetti modello di dati non strutturati.
Capire come funziona la suddivisione in blocchi
Data 360 supporta varie strategie per la divisione in blocchi.
L’estrazione dei passaggi basati sulla semantica usa il significato semantico inerente nei tag HTML per segmentare un documento in passaggi. Come confini logici dei passaggi sono usati elementi HTML come le intestazioni (<h1>, <h2>), gli elenchi (<ul>, <ol>) o il testo in grassetto (<strong>) che fungono da sotto-intestazioni.
La strategia di estrazione dei passaggi basata su finestre usa elementi a livello di blocco come i tag <div> e <p> oppure testo non elaborato separato da interruzioni di linea per suddividere i documenti in passaggi. Se un paragrafo non contiene alcun elemento HTML, l’estrazione avviene a livello di frase.
Puoi trovare ulteriori informazioni sulle strategie di suddivisione in blocchi nella Guida di Salesforce.
Per ora limitiamoci a vedere cosa succede dopo aver suddiviso i dati in blocchi.
Creare incorporamenti vettoriali a partire dal contenuto suddiviso in blocchi
Dopo aver suddiviso il contenuto in blocchi, Data 360 crea un incorporamento vettoriale, ovvero una rappresentazione numerica del contenuto segmentato in blocchi che può essere recuperato o utilizzato nelle applicazioni di IA generativa, di automazione o di analisi di Salesforce.
Gli incorporamenti vettoriali sono rappresentazioni numeriche di testo che archiviano le relazioni tra parole o frasi. L’incorporamento coglie il significato semantico del contenuto, affinché i blocchi di contenuto semanticamente simili abbiano incorporamenti vettoriali simili. Queste rappresentazioni aiutano le macchine a elaborare e comprendere il linguaggio in modo efficace.
In Data 360, gli incorporamenti vettoriali sono consultati dagli oggetti modello di dati indice (IDMO), che vedremo meglio più avanti in questa unità.
Creare configurazioni di indici di ricerca vettoriali
Per preparare i dati non strutturati per la ricerca devi suddividerli in blocchi e vettorizzarli. A questo scopo crei una configurazione dell’indice di ricerca. Devi creare una configurazione indice di ricerca per ogni oggetto dati con campi di testo che contengano i concetti informativi, le narrazioni o le descrizioni dettagliate in cui gli utenti eseguono ricerche per trovare risultati pertinenti. Esempi di questo tipo di dati sono gli articoli di Salesforce Knowledge o altri documenti di testo, come le trascrizioni delle chat, archiviati un archivio BLOB esterno, ad esempio Amazon S3.
Creare una configurazione di indice di ricerca vettoriale dagli articoli Knowledge
Nell’unità precedente hai creato uno stream di dati e un oggetto data lake dal bundle Knowledge del connettore Salesforce CRM, che fornisce alcuni articoli Knowledge di esempio.
L’oggetto Knowledge Article Version è utile per l’indice, in quanto puoi usare questo oggetto per interrogare, recuperare o consultare tutti i tipi di articoli in base alla loro versione. L’oggetto include i seguenti campi, che devono essere indicizzati per la ricerca.
-
Name (Nome): il nome o il titolo dell’articolo Knowledge
-
Description (Descrizione): la descrizione o il riepilogo dell’articolo Knowledge, mappato da Summary (Riepilogo)
-
Custom text fields (Campi di testo personalizzati): qualsiasi campo di testo rtf (limitato a 131K) che contenga dati non strutturati
Creare una configurazione di indice di ricerca vettoriale per il DMO Knowledge Article Version
Completerai questi passaggi nella tua organizzazione Data 360 per superare la sfida alla fine di questa unità.
- Se non lo hai già fatto, avvia il tuo playground con Data Cloud.
- Nell’App Launcher (Programma di avvio app), seleziona Data Cloud.
- Fai clic su Search Index (Indice di ricerca) | New (Crea).
Se non trovi Search Index (Indice di ricerca), nel menu di navigazione Data Cloud fai clic sul menu a discesa More (Altro) e seleziona Search Index (Indice di ricerca).
- Fai clic su Advanced Setup (Impostazione avanzata) | Next (Avanti).
- Nella pagina Select Source Object (Seleziona oggetto di origine), scegli Vector Search (Ricerca vettoriale) e il DMO Knowledge Article Version, quindi fai clic su Next (Avanti).
- Nella pagina Select Fields to Chunk (Seleziona i campi da suddividere in blocchi), fai clic su Manage Fields (Gestisci campi).
- Fai clic su Select All Fields (Seleziona tutti i campi) e quindi su Save (Salva).
- Lascia invariata la strategia di suddivisione in blocchi predefinita e fai clic su Next (Avanti).
- Nella pagina Select a Vectorization Strategy (Seleziona una strategia di vettorizzazione) lascia invariata la strategia di vettorizzazione predefinita e fai clic su Next (Avanti).
- Nella pagina Select Related Fields for Search Filtering (Seleziona campi correlati per i filtri di ricerca) non aggiungere alcun campo e fai clic su Next (Avanti).
- Nella pagina Search Index Configuration Details (Dettagli configurazione indice di ricerca) sostituisci il testo autogenerato di Search Index Configuration Name (Nome configurazione indice di ricerca) con
My_kav. Il campo Search Index Configuration API Name (Nome API configurazione indice di ricerca) viene compilato automaticamente.
- Fai clic su Save (Salva).
Fatto! La tua configurazione del nuovo indice di ricerca, My_kav, è nell’elenco della scheda Search Index (Indice di ricerca).
Visualizzare il CDMO e gli IDMO Knowledge Article version
Dopo che hai creato la configurazione dell’indice di ricerca, il suo stato cambia in Submitted (Inviato) per poi passare a In progress (In corso) durante l’elaborazione dei dati dal DMO/UDMO di origine. Se tutto è andato bene, lo stato cambia da Submitted (Inviato) a In Progress (In corso) e a Ready (Pronto). Non saranno visibili record in Data Explorer (Explorer dati) fino a quando Search index status (Stato indice di ricerca) non sarà Ready (Pronto).
Il contenuto più utile di un articolo Knowledge si trova nel campo Description (Descrizione). In genere gli articoli di esempio hanno dimensioni ridotte e sono composti da un unico blocco. Significa che per ogni record del CDMO e IDMO Knowledge Article Version ci sono rispettivamente un solo blocco e un solo vettore, ma un contenuto più lungo potrebbe avere più record in ogni DMO.
Rivediamo rapidamente il CDMO e l’IDMO che abbiamo creato per il DMO Knowledge Article Version.
- Verifica che il Search index status (Stato indice di ricerca) sia impostato su Ready (Pronto).
- In Data Cloud, fai clic su Data Explorer (Explorer dati).
- Nel menu a discesa Object (Oggetto) seleziona Data Model Object (Oggetto modello di dati).
- Nel menu Select an Object field (Selezionare un campo oggetto) seleziona My_kav chunk.
Dovresti vedere un elenco di tutti i blocchi creati da Data 360 a partire dagli articoli Knowledge di esempio.
- Nel campo Select an Object (Seleziona un campo oggetto) seleziona My_kav index (Indice My_Kav).
Dovresti vedere un elenco di tutti i record vettoriali creati da Data 360 a partire dagli articoli Knowledge di esempio.
Puoi usare il CDMO e gli IDMO contenuti nell’indice di ricerca in tutta Salesforce in applicazioni come Flow Builder, Agentforce, Generatore di prompt e persino Tableau. In alternativa, puoi vedere i documenti di ricerca vettoriale per comprendere meglio l’esecuzione di query di ricerca vettoriale.
Il collegamento dei dati non strutturati a Data 360 permette di radicare i risultati di ricerca in un’enorme quantità di dati, per diversi casi d’uso focalizzati sul cliente. Tramite la suddivisione in blocchi e la vettorizzazione di tali dati, puoi usare la ricerca vettoriale nelle applicazioni di IA generativa Einstein, in Flow Builder e persino in Tableau per potenziare le funzionalità di IA, analytics e automazione.
