Creare una configurazione dell’indice di ricerca

Obiettivi di apprendimento

Al completamento di questa unità, sarai in grado di:

Spiegare come funzionano le configurazioni dell’indice di ricerca e il radicamento nel contesto in Data 360.
Creare una configurazione dell’indice di ricerca vettoriale.

Nota

Stai seguendo la formazione in italiano? Inizia la sfida in un Trailhead Playground in italiano e utilizza le traduzioni fornite tra parentesi per la navigazione. Per quanto riguarda i valori da inserire, copia e incolla solo quelli in lingua inglese, perché la convalida della sfida è basata sul fatto che i dati siano in inglese. Se non superi la sfida nella tua organizzazione italiana, ti consigliamo di (1) selezionare Stati Uniti per le impostazioni internazionali, (2) selezionare Inglese per la lingua seguendo le istruzioni riportate qui e, successivamente, (3) fare nuovamente clic sul pulsante "Controlla la sfida".

Visita il badge Trailhead nella tua lingua per informazioni dettagliate su come usufruire dell'esperienza Trailhead in altre lingue.

Radicare la ricerca nel contesto di dati non strutturati con le configurazioni dell’indice di ricerca

Il radicamento della ricerca nel contesto dei dati strutturati e non strutturati migliora l’uso dell’IA generativa e degli strumenti di analisi e di automazione in tutta Salesforce Platform. La ricerca radicata nel contesto importa i dati specifici del cliente in applicazioni come Agentforce, Tableau e Flow Builder, assicurando output messi a punto per gli intenti e i contesti specifici degli utenti. Questo allineamento consente di ottenere contenuti generati dall’IA più accurati e pertinenti, approfondimenti più completi dagli strumenti di analisi e flussi di lavoro automatizzati più efficienti per i team e per i clienti.

Per radicare la ricerca nel contesto, devi segmentare i dati non strutturati in blocchi di dati semanticamente appropriati e, da quei blocchi, creare incorporamenti vettoriali, ovvero rappresentazioni numeriche dei blocchi di dati. Il contenuto suddiviso in blocchi, archiviato nell’indice di ricerca di Data 360, può essere utilizzato per le ricerche e in applicazioni di IA generativa (Generatore di prompt e Agentforce), di automazione (Flow Builder) e di analisi (Tableau).

Suddividere in blocchi i dati non strutturati

Nell’unità precedente abbiamo visto come Data 360 fa riferimento ai dati non strutturati attraverso oggetti modello di dati non strutturati (UDMO). È anche possibile suddividere in blocchi gli UDMO o qualsiasi DMO che contenga campi di testo, quali ad esempio gli articoli Knowledge di Salesforce. In questa unità faremo proprio questo.

Quando suddividi gli UDMO o i DMO, li frammenti in blocchi semanticamente sensati e gestibili. Queste unità di testo sono archiviate in Data 360 come oggetti modello di dati in blocchi (CDMO), creati a partire da oggetti modello di dati o oggetti modello di dati non strutturati.

Come funziona la suddivisione in blocchi

Data 360 supporta varie strategie per la divisione in blocchi.

L’estrazione dei passaggi basati sulla semantica usa il significato semantico inerente nei tag HTML per segmentare un documento in passaggi. Come confini logici dei passaggi sono usati elementi HTML come le intestazioni (<h1>, <h2>), gli elenchi (<ul>, <ol>) o il testo in grassetto (<strong>) che fungono da sotto-intestazioni.

La strategia di estrazione dei passaggi basata su finestre usa elementi a livello di blocco come i tag <div> e <p> oppure testo non elaborato separato da interruzioni di linea per suddividere i documenti in passaggi. Se un paragrafo non contiene alcun elemento HTML, l’estrazione avviene a livello di frase.

Puoi trovare ulteriori informazioni sulle strategie di suddivisione in blocchi nella Guida di Salesforce.

Per ora limitiamoci a vedere cosa succede dopo aver suddiviso i dati in blocchi.

Creare incorporamenti vettoriali a partire dal contenuto suddiviso in blocchi

Dopo aver suddiviso il contenuto in blocchi, Data 360 crea un incorporamento vettoriale, ovvero una rappresentazione numerica del contenuto segmentato in blocchi che può essere recuperato o utilizzato nelle applicazioni di IA generativa, di automazione o di analisi di Salesforce.

Gli incorporamenti vettoriali sono rappresentazioni numeriche di testo che archiviano le relazioni tra parole o frasi. L’incorporamento coglie il significato semantico del contenuto, affinché i blocchi di contenuto semanticamente simili abbiano incorporamenti vettoriali simili. Queste rappresentazioni aiutano le macchine a elaborare e comprendere il linguaggio in modo efficace.

In Data 360, gli oggetti modello di dati indice (IDMO), che vedremo meglio più avanti in questa unità, fanno riferimento a incorporamenti vettoriali.

Consulta la Guida di Salesforce per informazioni più approfondite sugli incorporamenti vettoriali e sul contenuto suddiviso in blocchi.

Creare configurazioni di indici di ricerca vettoriali

Per preparare i dati non strutturati per la ricerca devi suddividerli in blocchi e vettorizzarli. A questo scopo crei una configurazione dell’indice di ricerca. Devi creare una configurazione indice di ricerca per ogni oggetto dati con campi di testo che contengano i concetti informativi, le narrazioni o le descrizioni dettagliate in cui gli utenti eseguono ricerche per trovare risultati pertinenti. Esempi di questo tipo di dati sono gli articoli di Salesforce Knowledge o altri documenti di testo, come le trascrizioni delle chat, archiviati un archivio BLOB esterno, ad esempio Amazon S3.

Creare una configurazione di indice di ricerca vettoriale dagli articoli Knowledge

Nell’unità precedente hai creato uno stream di dati e un oggetto data lake dal bundle Knowledge del connettore Salesforce CRM, che fornisce alcuni articoli Knowledge di esempio.

L’oggetto Knowledge Article Version è utile per l’indice, in quanto puoi usarlo per interrogare, recuperare o eseguire ricerche su tutti i tipi di articoli in base alla loro versione. L’oggetto include i seguenti campi, che devono essere indicizzati per la ricerca.

Name (Nome): il nome o il titolo dell’articolo Knowledge
Description (Descrizione): la descrizione o il riepilogo dell’articolo Knowledge, mappato da Summary (Riepilogo)
Custom text fields (Campi di testo personalizzati): qualsiasi campo di testo rtf (limitato a 131K) che contenga dati non strutturati

Quando crei un indice di ricerca con il generatore avanzato, puoi ottimizzarlo in modo che restituisca risultati più accurati prestando attenzione alla selezione dei campi e alle strategie che adotti per la suddivisione in blocchi. Per ulteriori informazioni, vedi Ottimizzazione degli indici di ricerca: Selezione e suddivisione dei campi.

Creare una configurazione di indice di ricerca vettoriale per il DMO Knowledge Article Version

Completerai questi passaggi nella tua organizzazione Data 360 per superare la sfida alla fine di questa unità.

Con Advanced Setup (Impostazione avanzata) hai più controllo sulla suddivisione in blocchi e le opzioni di vettorizzazione. Tuttavia, per questa sfida userai principalmente le impostazioni predefinite.

Se non lo hai già fatto, avvia il tuo playground con Data Cloud.
Nell’App Launcher (Programma di avvio app), seleziona Data Cloud.
Fai clic su Search Indexes (Indici di ricerca) e poi su New (Crea).
Se non trovi Search Indexes (Indici di ricerca), nel menu di navigazione di Data Cloud fai clic sul menu a discesa More (Altro) e seleziona Search Indexes (Indici di ricerca).
Fai clic su Advanced Setup (Impostazione avanzata) e poi su Next (Avanti).
Nella pagina Select Source Object (Seleziona oggetto di origine), scegli Vector Search (Ricerca vettoriale) e il DMO Knowledge Article Version, quindi fai clic su Next (Avanti). Se viene visualizzato un messaggio di errore, ignoralo.
Nella pagina Select Fields to Chunk (Seleziona i campi da suddividere in blocchi), fai clic su Manage Fields (Gestisci campi).
Seleziona tutti i campi e fai clic su Save (Salva).
Lascia invariata la strategia di suddivisione in blocchi predefinita e fai clic su Next (Avanti).
Nella pagina Select a Vectorization Strategy (Seleziona una strategia di vettorizzazione) lascia invariata la strategia di vettorizzazione predefinita e fai clic su Next (Avanti).
Nella pagina Select Related Fields for Search Filtering (Seleziona campi correlati per i filtri di ricerca) non aggiungere alcun campo e fai clic su Next (Avanti).
Nella pagina Search Index Configuration Details (Dettagli configurazione indice di ricerca) sostituisci il testo autogenerato in Search Index Configuration Name (Nome configurazione indice di ricerca) con My_kav. Il campo Search Index Configuration API Name (Nome API configurazione indice di ricerca) viene compilato automaticamente.
Fai clic su Save (Salva).

Fatto! La configurazione del nuovo indice di ricerca, My_kav, è elencata nella scheda Search Indexes (Indici di ricerca).

Visualizzare il CDMO e gli IDMO Knowledge Article version

Dopo che hai creato la configurazione dell’indice di ricerca, il suo stato cambia in Submitted (Inviato) per poi passare a In progress (In corso) durante l’elaborazione dei dati dal DMO/UDMO di origine. Se tutto è andato bene, lo stato cambia da Submitted (Inviato) a In Progress (In corso) e a Ready (Pronto). Non saranno visibili record in Data Explorer (Explorer dati) fino a quando Search index status (Stato indice di ricerca) non sarà Ready (Pronto).

Data 360 può impiegare diversi minuti per elaborare i dati nell’indice di ricerca. Puoi approfittarne per fare una pausa e muoverti un po’. Quando torni, fai clic su Refresh (Aggiorna) e controlla se il valore visualizzato sotto Search Index Last Run Status (Stato ultima esecuzione indice di ricerca) è impostata su Ready (Pronto).

Il contenuto più utile di un articolo Knowledge si trova nel campo Description (Descrizione). In genere gli articoli di esempio hanno dimensioni ridotte e sono composti da un unico blocco. Significa che per ogni record del CDMO e IDMO Knowledge Article Version ci sono rispettivamente un solo blocco e un solo vettore, ma un contenuto più lungo potrebbe avere più record in ogni DMO.

Rivediamo rapidamente il CDMO e l’IDMO che abbiamo creato per il DMO Knowledge Article Version.

Verifica che il Search index status (Stato indice di ricerca) sia impostato su Ready (Pronto).
In Data Cloud, fai clic su Data Explorer (Explorer dati).
Nel menu a discesa Object (Oggetto) seleziona Data Model Object (Oggetto modello di dati).
Nel menu Select an Object field (Selezionare un campo oggetto) seleziona My_kav chunk.
Dovresti vedere un elenco di tutti i blocchi creati da Data 360 a partire dagli articoli Knowledge di esempio.
Nel campo Select an Object (Seleziona un campo oggetto) seleziona My_kav index (Indice My_Kav).
Dovresti vedere un elenco di tutti i record vettoriali creati da Data 360 a partire dagli articoli Knowledge di esempio.

Puoi usare il CDMO e gli IDMO contenuti nell’indice di ricerca in tutta Salesforce in applicazioni come Flow Builder, Agentforce, Generatore di prompt e persino Tableau. In alternativa, puoi vedere i documenti di ricerca vettoriale per comprendere meglio l’esecuzione di query di ricerca vettoriale.

Il collegamento dei dati non strutturati a Data 360 permette di radicare i risultati di ricerca in un’enorme quantità di dati, per diversi casi d’uso focalizzati sul cliente. Tramite la suddivisione in blocchi e la vettorizzazione di tali dati, puoi usare la ricerca vettoriale nelle applicazioni di IA generativa Einstein, in Flow Builder e persino in Tableau per potenziare le funzionalità di IA, analytics e automazione.

Tempo stimato

Argomenti

Hai bisogno di aiuto?

Risorse per Data 360