Skip to main content
Unisciti a noi al TDX, a San Francisco o su Salesforce+, il 5-6 marzo per la conferenza degli sviluppatori sull'era degli Agenti IA. Registrati ora.

Preparare i dati

Obiettivi di apprendimento

Al completamento di questa unità, sarai in grado di:

  • Spiegare come identificare e risolvere le sfide associate ai dati.
  • Definire i requisiti relativi ai dati per il tuo progetto.

L'importanza della preparazione dei dati

Per avviare un progetto di IA, è necessario che i dati di un'organizzazione siano pronti, vale a dire: i dati da utilizzare per il progetto devono essere accurati, disponibili, accessibili e gestiti in modo sicuro.

In molte organizzazioni, la qualità dei dati rappresenta un formidabile ostacolo all'implementazione di progetti di IA. E per una buona ragione: i dati sono le fondamenta degli algoritmi di IA, in quanto consentono loro di apprendere, adattarsi e prendere decisioni migliori. Dati di alta qualità possono migliorare l'accuratezza, l'efficienza, l'affidabilità e l'equità dei sistemi basati sull'IA.

Prima di implementare un progetto di IA, è fondamentale risolvere i problemi di qualità dei dati. Tuttavia, l'idea che i dati debbano essere perfetti non deve ostacolare la realizzazione di un progetto. Molti progetti si arenano sulla preparazione dei dati perché i team cercano di inseguire la perfezione. Bisogna invece lavorare con il proprio team per identificare obiettivi ragionevoli per la preparazione dei dati. Le eventuali lacune nei dati che interessano l'output dell'IA possono essere colmate durante la fase di sviluppo.

Questa unità fornisce una panoramica sui metodi per valutare la qualità dei dati e prepararli per un progetto di IA.

Nota

Consulta Worksheet: AI Data Prep Checklist and Considerations (Foglio di lavoro: Lista di controllo e considerazioni sulla preparazione dei dati per l'IA) per pianificare la strategia per i dati del tuo progetto IA.

Creare un inventario dei dati

Becca sa che il modo migliore di ottenere una visione completa dei dati da utilizzare nel suo progetto è crearne un inventario. Un inventario dei dati consente di gestire gli asset di dati e identificare potenziali problemi.

Per creare un inventario dei dati, è possibile seguire questi passaggi:

  1. Identificare i dati necessari per il progetto.
  2. Identificare dove questi dati sono archiviati.
  3. Rispondere ad alcune domande sui dati:
    • Il tipo di dati è strutturato, non strutturato o semi-strutturato? Per ulteriori informazioni sulla classificazione dei dati, vedi Nozioni fondamentali sui dati per l'IA.
    • Con quale frequenza vengono aggiornati i dati?
    • I dati vengono aggiornati in tempo reale, ogni ora, ogni giorno oppure sono statici?
    • In che modo è possibile accedere ai dati?
    • Sono stati implementati degli standard di governance per i dati?
    • Quali sono alcune problematiche legate ai dati che possono causare problemi nel progetto?

L'inventario dei dati di Coral Cloud

Continuiamo a seguire il progetto di Becca per l'automazione del processo di accettazione di Coral Cloud Resorts. Facciamo un ripasso del piano di implementazione di Becca evidenziando in grassetto i punti chiave relativi ai dati.

  1. Utilizzare un flusso per creare un record Evento Ospite basato sui dati delle prenotazioni più recenti presenti in Data Cloud.
  2. Addestrare Agentforce ad avviare il flusso utilizzando il linguaggio conversazionale. Quindi, ad esempio, quando l'ospite Sofia Rodriguez arriva per iniziare il suo soggiorno, lo staff può semplicemente chiedere ad Einstein di "effettuare l'accettazione di Sofia Rodriguez", e Einstein si occuperà del resto.
  3. Utilizzare il Generatore di prompt per generare un'email di benvenuto personalizzata che fornisce consigli su escursioni che potrebbero interessare all'ospite e inviarla.

Becca esamina il suo piano per individuare i dati che sono necessari per implementare la soluzione.

  • Nel passaggio 1 ha bisogno dei dati relativi alle prenotazioni. Coral Cloud utilizza una piattaforma esterna chiamata Reserv-o-matic per archiviare i dati delle prenotazioni, quindi Becca utilizza Data Cloud per importare quei dati in Salesforce.
  • Nel passaggio 2 ha bisogno di recuperare i dati della prenotazione in base al nome del cliente. I dati sui clienti sono disponibili in Salesforce.
  • Nel passaggio 3 sono necessari i dati relativi alle escursioni che l'ospite ha acquistato precedentemente. Anche la cronologia degli acquisti dei clienti è disponibile in Salesforce.

Dopo aver individuato le origini dei dati, Becca crea un inventario dei dati.

Nome dei dati

Origine dei dati

Tipo di dati

Frequenza di aggiornamento

Considerazioni

Record Referente

CRM

Strutturati

Giornaliera

Il formato delle date è MM/GG/AA

Prenotazioni

Reserv-o-matic

Strutturati

In tempo reale

Il formato delle date è GG/MM/AA.

Escursioni

CRM

Strutturati

Giornaliera

Il formato delle date è MM/GG/AA

Determinare i requisiti del progetto relativi ai dati

I requisiti relativi ai dati di un progetto sono i requisiti di base che occorre soddisfare affinché il progetto riesca. Comprendere questi requisiti consente di ridurre il lavoro superfluo.

Valutare la qualità dei dati

La disponibilità di dati di alta qualità consente di creare progetti di IA affidabili ed efficaci. Per saperne di più sulla valutazione della qualità dei dati, vedi Qualità dei dati. Nel valutare la qualità dei dati occorre individuare aree in cui sono presenti delle carenze: è qui che bisogna sottoporre i dati a pulitura. La pulitura dei dati è il processo di correzione o rimozione di dati errati, danneggiati, formattati in modo errato, duplicati o incompleti da un set di dati. Rientra in questa operazione il colmare eventuali lacune nei dati. La pulitura dei dati può richiedere del tempo. Quindi, è consigliabile non sottoporre a pulitura dati che non sono necessari per il progetto.

Becca nota che, nel suo inventario dei dati, il formato delle date delle prenotazioni è DD/MM/AA, mentre nei record dei referenti e nelle escursioni il formato è MM/GG/AA. I formati delle date non sono coerenti, quindi non rispettano i criteri di qualità. Becca scrive un'utilità per convertire il formato di tutte le date delle prenotazioni in MM/GG/AA.

Mentre risolve alcuni altri problemi relativi ai dati, Becca si rende conto che la quantità di dati è troppo elevata affinché sia possibile raggiungere la perfezione. Coral Cloud è un resort di altissimo livello visitato da migliaia di ospiti ogni anno. Becca si sente avvilita, fino a quando si rende conto che aveva sovrastimato i requisiti relativi ai dati e stava quindi eseguendo la pulitura delle prenotazioni effettuate negli anni precedenti. In realtà è necessario ripulire soltanto le prenotazioni con date nel futuro, in quanto soltanto quelle utilizzeranno il processo di accettazione automatica. Quindi, Becca filtra le prenotazioni indicando che la data deve cadere nel futuro. Dopo aver compreso meglio i requisiti relativi ai dati del progetto, Becca deve lavorare su un numero di record molto più contenuto.

Eseguire la migrazione e l'integrazione dei dati

Quando i dati provengono da più origini, è necessario eseguirne la migrazione. Questo significa trasferire i dati all'interno di un'unica origine centralizzata. Se il progetto viene sviluppato in Salesforce, è necessario importare i dati in Salesforce. Dopo aver eseguito la migrazione, occorre integrarli combinando i dati provenienti dalle diverse origini in una vista unificata e completa. È necessario eseguire la migrazione e l'integrazione soltanto dei dati utili per il progetto. In questo modo il progetto sarà più gestibile e si eviterà di sovraccaricare il sistema con dati non necessari.

Poiché il suo progetto prevede che siano creati record Evento Ospite basati sui dati provenienti da Reserv-o-matic e sui record Referente di Salesforce, Becca sa che deve collegare i dati delle prenotazioni ai record Referente. Se non lo facesse, il flusso non saprebbe a quale referente corrisponde ciascuna prenotazione. Becca non vuole integrare dati che non servono, quindi esamina i record delle prenotazioni per identificare i campi che non sono necessari. Le prenotazioni hanno un campo Note in cui i clienti possono inserire richieste speciali. Questo campo non ha un formato specifico e molti clienti lo lasciano vuoto. Becca non ha bisogno del campo Note per creare un record Evento Ospite, quindi elimina questo campo prima di eseguire la migrazione delle prenotazioni in Salesforce.

Becca imposta uno stream di dati che importa i dati da Reserv-o-matic, quindi utilizza la risoluzione delle identità per abbinare la Sofia presente in Salesforce e la Sofia presente in Reserv-o-matic. Una volta eseguita questa operazione, il record di Sofia conterrà sia i dettagli di contatto archiviati in Salesforce che quelli della prenotazione provenienti da Reserv-o-matic.

Definire la governance dei dati

Minore è il numero di persone che lavorano con i dati, più questi ultimi saranno coerenti. È quindi opportuno limitare la governance dei dati alle persone appropriate. Nel caso che stiamo esaminando, queste sono Becca e il suo responsabile.

Pianificare l'analisi

È opportuno elaborare un piano per l'analisi per consentire la misurazione dei risultati. Si tratta di un passaggio importante per monitorare le prestazioni e documentare il ritorno sull'investimento (ROI) del progetto. Documentare il ROI è fondamentale per ottenere il sostegno necessario per lo sviluppo ulteriore del progetto o per progetti di IA futuri.

Il piano dell'analisi deve essere in linea con gli obiettivi del progetto che abbiamo delineato nell'unità precedente. Ricordiamo quali sono gli obiettivi del progetto di Becca:

  • Ridurre il tempo necessario per effettuare l'accettazione del 50%.
  • Mantenere la soddisfazione dei clienti su un livello uguale o superiore rispetto a prima del progetto.

Becca decide come raccogliere e analizzare i dati per verificare se il suo progetto ha raggiunto questi obiettivi. Ecco il piano di Becca:

  • Calcolare il tempo trascorso dai dipendenti davanti allo schermo dei computer della reception alla fine di ogni giornata. Confrontare il tempo medio trascorso davanti allo schermo prima e dopo l'implementazione del processo di accettazione basato sull'IA.
  • Al termine del soggiorno di ciascun ospite, proporre a un sondaggio facoltativo in cui è possibile dare una valutazione del proprio grado di soddisfazione. Confrontare il grado di soddisfazione medio prima e dopo l'implementazione del processo di accettazione basato sull'IA.

Ora Becca dispone di un metodo concreto per dimostrare l'impatto del proprio progetto.

Risolvere le problematiche associate ai dati

Dopo aver definito i requisiti del suo progetto, Becca completa la risoluzione dei problemi legati ai dati più urgenti, che solitamente riguardano la qualità, ostacoli all'integrazione, lacune e, talvolta, un'infrastruttura dei dati obsoleta. Becca sa che se non risolve questi problemi nella fase iniziale, il nuovo progetto di IA di Coral Cloud potrebbe essere basato su dati inaffidabili o inaccurati.

Becca ha fatto notevoli progressi con il suo progetto fino ad ora e ha gestito i dati in maniera eccelsa. Nella prossima unità vedremo in che modo Becca determina i rischi associati suo progetto di IA e come lo implementa in modo affidabile e responsabile.

Risorse

Condividi il tuo feedback su Trailhead dalla Guida di Salesforce.

Conoscere la tua esperienza su Trailhead è importante per noi. Ora puoi accedere al modulo per l'invio di feedback in qualsiasi momento dal sito della Guida di Salesforce.

Scopri di più Continua a condividere il tuo feedback