Migliorare l’IA con dati provenienti dal mondo reale
Obiettivi di apprendimento
Al completamento di questa unità, sarai in grado di:
- Descrivere i vantaggi dell’utilizzo della Libreria dati Agentforce.
- Descrivere i quattro concetti chiave che intervengono nella trasformazione e nell’organizzazione dei dati dell’IA.
- Spiegare il funzionamento dei processi di impostazione e runtime della Libreria dati Agentforce.
Prima di iniziare
Prima di iniziare questo modulo, ti consigliamo di completare i contenuti seguenti:
Perché radicare l’IA nel contesto con i dati?
I tuoi dati svolgono un ruolo cruciale nell’assicurare che i sistemi IA funzionino in modo preciso ed efficace. Dare una risposta sbagliata a un cliente può significare scoraggiarlo dal fare acquisti in futuro. Se si forniscono agli addetti all’assistenza informazioni errate, si rischia di frustrare i clienti anziché supportarli. Fornendo consigli obsoleti agli addetti alle vendite, potresti impedire loro di raggiungere gli obiettivi di profitto prefissati e portarli a perdere preziose opportunità di business.
Se i dati sono la spina dorsale di ogni sistema IA di successo, i modelli di IA nascono generalisti: vengono addestrati su insiemi di dati massicci che gli forniscono un’ampia base di conoscenze. Questa ampia base di conoscenze corrisponde alla carenza delle informazioni specialistiche necessarie per eseguire determinate attività o per rispondere a domande tecniche riguardo ai casi d’uso specifici.
Il radicamento dei dati nel contesto del mondo reale porta i modelli di IA a superare i loro insiemi di addestramento statici. Con il radicamento del tuo modello IA nel contesto di fonti di informazioni verificate, come la knowledge base Salesforce e i file o i siti web che hai caricato, l’LLM è in grado di rispondere con maggiore precisione alle richieste dei clienti, suggerire risposte migliori agli agenti, creare elaborati riepiloghi delle ricerche e molto altro.

La sfida dei dati aziendali
La maggior parte delle aziende archiviano le loro knowledge base in formati non strutturati, come raccolte di video, immagini, documenti, email, dati raccolti da sensori, post sui social, file audio e altro ancora, tutti formati non perfettamente inseribili all’interno di fogli di calcolo e database. Questi dati rappresentano circa il 90% dei dati aziendali e, benché non siano facili da usare per le ricerche, contengono comunque tante informazioni di grande importanza, tra cui i feedback dei clienti e le loro opinioni, percezioni, tono e sentiment. Come sbloccare il potenziale di questi dati?
È qui che interviene la Libreria dati Agentforce, uno strumento potente che può aiutarti a radicare l’IA nel contesto dei tuoi dati del mondo reale. Grazie alla Libreria dati Agentforce, puoi collegare facilmente la tua knowledge base alle funzionalità IA di Salesforce per avere la certezza di ricevere contenuti aggiornati generati dall’IA e personalizzati per la tua organizzazione e i tuoi casi d’uso. Quando imposti una Libreria dati Agentforce ricevi gli strumenti necessari per trasformare grande insiemi di dati parzialmente o per niente strutturati in più utili contenuti ricercabili. Vediamo come.
Trasformare i dati per un utilizzo più efficiente grazie ai Large Language Model
Le Librerie dati Agentforce facilitano il collegamento di agenti e Large Language Model (LLM) ai tuoi dati non strutturati tramite l’automazione di diverse fasi della configurazione di Data 360 e Generatore di prompt, tra cui il pushing degli stream di dati a Data 360, la mappatura degli oggetti dati e la creazione di un indice e un retriever di ricerca. Il risultato finale è che gli strumenti IA che utilizzi funzionano sempre con le informazioni più aggiornate e pertinenti.
Prima di apprendere i semplici passaggi da seguire per configurare una libreria dati, rivediamo alcuni concetti chiave: radicamento nel contesto, suddivisione in blocchi, indicizzazione e retriever.
Radicamento nel contesto
Il radicamento nel contesto si ha quando aggiungi conoscenze specifiche del dominio o informazioni sul cliente al prompt, fornendo all’LLM il contesto necessario per rispondere con maggiore precisione a una domanda o un’attività. Come già accennato, tra le tue risorse per il radicamento nel contesto posso essere inclusi articoli Knowledge, file caricati, siti web, trascrizioni di conversazioni e altro ancora. Tuttavia, le ricerche nei documenti lunghi e complessi possono richiedere molto tempo e numerose risorse; inoltre, per gli LLM esiste un limite massimo di token o parole di testo che è possibile elaborare contemporaneamente.
Suddivisione in blocchi e indicizzazione
Per affrontare questo problema, le fonti dei dati vengono suddivise in parti più piccole, denominate blocchi. Dunque, eseguiamo ricerche all’interno dei blocchi e facciamo in modo che gli LLM prendano in considerazione soltanto le informazioni più pertinenti.

Una volta suddivisi in blocchi, i dati sono organizzati e categorizzati in un indice di ricerca. L’archiviazione delle informazioni in un indice di ricerca organizzato agevola e velocizza il recupero di dati specifici quando necessario. Quando i dati vengono suddivisi in blocchi e organizzati in questo modo, le ricerche sono più efficienti, il grado di pertinenza dei risultati è più elevato e diventa possibile gestire insiemi di dati di dimensioni molto grandi.
Immagina un grande store online con milioni di prodotti. Un catalogo o una tassonomia del sito web ben organizzati consentono ai clienti di trovare rapidamente i prodotti che cercano attraverso diverse categorie, tra cui nome, tipo, brand o persino funzionalità specifiche. Suddividere i dati in blocchi più piccoli e organizzarli in un indice di ricerca è come creare un catalogo dei tuoi contenuti e metterlo a disposizione degli LLM perché trovino le informazioni giuste per rispondere alle query degli utenti.
Retriever
I retriever fungono da puntatori tra i dati e le funzionalità: sono progettati per estrarre e fornire automaticamente dati pertinenti provenienti da diversi database, sistemi o piattaforme. Quando un utente pone una domanda, il retriever assegnato a ciascuna libreria dati stabilisce a quali set di dati possono accedere gli strumenti della IA di Salesforce in Data 360. I retriever sono dunque particolarmente importanti nelle applicazioni come i motori di ricerca, i sistemi di risposta a domande e i sistemi di suggerimento.
Hai appena appreso alcune nozioni di base sull’organizzazione dei dati nell’IA. Ora vediamo come si comportano questi processi durante la configurazione e il runtime della libreria dati.
Che cosa succede durante la configurazione?
Quando crei una libreria dati, il processo che connette i dati ai tuoi agenti e alle tue funzionalità di IA ha inizio immediatamente. Innanzitutto viene creato uno stream di dati, seguito dal data lake e dagli oggetti modello di dati. Questi oggetti vengono quindi mappati insieme e ha inizio la suddivisione in blocchi. Il tempo necessario per la suddivisione in blocchi varia in base a fattori come il numero, le dimensioni e la complessità degli articoli Knowledge o dei file caricati, nonché in base al numero di campi Knowledge selezionati per la suddivisione in blocchi. Una volta completata la suddivisione in blocchi e preparato l’indice di ricerca, viene creato un retriever. Ciascuna Libreria dati Agentforce dispone di un proprio retriever univoco, che può puntare a uno stesso indice di ricerca ma opera in modo indipendente.

Che cosa succede durante il runtime?
Una volta completate la configurazione del retriever e la preparazione dell’indice di ricerca, il sistema è pronto per gestire le query utente in runtime.
Durante il runtime la query utente viene aggiunta al modello di prompt che fa riferimento al collegamento del retriever ai dati pertinenti. Successivamente il sistema esegue ricerche nell’indice per trovare le informazioni più pertinenti e le incorpora nel prompt. Il modello LLM riceve dunque il prompt così arricchito, in cui sono incluse la query utente, le informazioni aggiunte e le istruzioni del prompt, e genera una risposta. Il Pianificatore servizio rivede la risposta per accertarsi che sia in linea con le istruzioni del prompt. Infine, l’utente finale riceve una risposta precisa e contestualizzata per la sua query sulla base di informazioni pertinenti specifiche per il dominio e personalizzate per l’attività in questione.

Ricapitolando
Ottimo lavoro! In questa unità hai imparato perché è importante radicare nel contesto l’IA con i tuoi dati e hai acquisito familiarità con termini specifici e processi tecnici. È il momento di passare all’impostazione, così avrai modo di vedere quanto è semplice!
Risorse
- Blog di Salesforce: What Is Retrieval Augmented Generation (RAG) (Che cos’è la Generazione aumentata di recupero (RAG))
- Blog di Salesforce: CIOs Reveal Top 3 Strategies for Unlocking AI’s Potential with Unstructured Data (I CIO rivelano le tre principali strategie per sbloccare il potenziale dell’IA con dati non strutturati)
- Guida di Salesforce: Informazioni sulle librerie di dati
