Introduzione alle trasformazioni di dati in batch in Data 360
Obiettivi di apprendimento
Al completamento di questa unità, sarai in grado di:
- Descrivere le trasformazioni di dati in batch e quando utilizzarle.
- Identificare i diversi tipi di nodi per la trasformazione di dati.
- Descrivere come creare una trasformazione di dati in batch.
Introduzione alle trasformazioni di dati in batch
In Data 360 l'importazione dei dati avviene attraverso uno stream di dati e questi ultimi risiedono in un oggetto data lake (DLO, Data Lake Object). Un DLO è il contenitore di archiviazione per i dati importati in Data 360. Una trasformazione di dati consente di accedere ai dati presenti in uno o più DLO e di trasformarli per creare il proprio set di dati. Una trasformazione di dati può essere utilizzata anche per trasformare dati che sono stati mappati a un oggetto modello di dati (DMO, Data Model Object). Il DMO è una rappresentazione strutturata di entità di dati e delle loro relazioni all’interno di Salesforce.
Quando utilizzare una trasformazione di dati in batch
A differenza delle trasformazioni di dati in streaming, che vengono eseguite in modo continuo, le trasformazioni di dati in batch vengono eseguite in base a una pianificazione. Inoltre, le trasformazioni di dati in batch offrono un maggior numero di funzionalità rispetto a quelle in streaming, che sono basate su istruzioni SQL. Le trasformazioni di dati in batch contengono un editor visivo completo che puoi utilizzare per combinare dati provenienti da più DLO e per la creazione di campi calcolati con funzioni; inoltre, puoi inviare i dati a più DLO.
Puoi utilizzare le trasformazioni di dati in batch quando hai bisogno di eseguire trasformazioni di dati complesse oppure quando hai bisogno di eseguire aggiornamenti programmati dei dati. In una trasformazione di dati in batch poi eseguire join, aggregazioni e aggiunte in coda di dati e puoi utilizzare formule e filtri.
Ecco alcuni scenari in cui le trasformazioni di dati in batch si rivelano utili:
-
Calcolo delle metriche per i cruscotti digitali trasforma i dati grezzi acquisiti in indicatori chiave di prestazione (KPI) utilizzabili, come dati aggregati e formule calcolate, ad esempio la percentuale di conseguimento o il valore della durata del cliente.
-
Standardizzazione dei valori: unifica i valori importati non coerenti, come “Salesforce,” “salesforce.com” o “SFDC”, in un unico valore uniforme.
-
Arricchimento con ulteriori origini dati: combina i dati provenienti da diverse origini, come CRM, sistemi di gestione delle retribuzioni, registri di utilizzo e anagrafiche clienti, per usarli nei servizi Data 360, ad esempio per la risoluzione delle identità e gli approfondimenti calcolati.
Come funziona una trasformazione di dati in batch
Per creare i dati di cui hai bisogno, puoi utilizzare l'editor visivo per trascinare i nodi. Ciascun nodo rappresenta una fase del processo. I nodi rappresentano i dati di origine e di destinazione e le diverse operazioni che è possibile eseguire su quei dati.
Quando crei una trasformazione di dati in batch, puoi usare i diversi tipi di nodi per produrre i dati specifici di cui hai bisogno. Ecco i diversi tipi di nodi che puoi scegliere e la loro funzione.
Tipo di nodo |
Che cosa fa |
|---|---|
Aggregate (Aggrega) |
Esegue il roll up dei dati su un livello di dettaglio più alto utilizzando le seguenti funzioni: Average, Count, Maximum, Minimum, Stddevp, Stddev, Sum, Unique, Varp e Var. |
Funzioni IA |
Utilizza i modelli IA di Einstein Studio per formulare le previsioni. |
Append (Aggiungi in coda) |
Combina righe da più set di dati. |
Filter (Filtro) |
Rimuove le righe non necessarie dai dati di destinazione. |
Input |
Contiene i dati di origine presenti in un DLO o un DMO. |
Join (Unisci) |
Unisce due branch di input attraverso una ricerca o un join. In ciascun branch di input deve essere presente un campo chiave. Ad esempio, il nodo di input dei dati dei clienti e il nodo delle vendite dei biglietti hanno entrambi un campo ID cliente. |
Output |
Contiene i dati trasformati in un DLO o un DMO. |
Transform (Trasforma) |
Manipola i dati attraverso l'utilizzo di funzioni. Questo nodo consente di calcolare valori, modificare valori stringa, formattare date, valori in bucket, eliminare colonne, elaborare valori JSON e così via. |
Update (Aggiorna) |
Sostituisce i valori di colonna con i dati provenienti da un'altra origine di dati quando le coppie di chiavi corrispondono. |
Sfida pratica: creare una trasformazione di dati in batch
Fase 1: creare il playground
Per completare questo modulo è necessario un playground personalizzato speciale con durata limitata in cui siano disponibili Data 360 e i nostri dati di esempio.
- Fai clic su Crea playground.
- La nuova organizzazione viene associata automaticamente al tuo account Trailhead.
- Prendi nota della data di scadenza dell'organizzazione e completa questo badge prima di quella data.
Fase 2: creare gli stream di dati
Prima di poter importare i dati relativi agli account e alle opportunità, è necessario configurarli come origini dati in Data 360.
- In Data Cloud, vai alla scheda Data Streams (Stream di dati) e fai clic su New (Nuovo).
- Sotto Connected Sources, (Fonti collegate) fai clic su Salesforce CRM e poi su Next (Avanti).
- Nota che la voce Salesforce Trial Org (Organizzazione di prova Salesforce) è preselezionata. In View Bundles (Visualizza bundle), scegli il bundle di dati Sales (Vendite) e fai clic su Next (Avanti). Il bundle contiene tutti gli stream di dati necessari per creare la trasformazione di dati in batch.
- Lascia selezionati tutti i campi standard e fai clic su Next (Avanti).
- Nella schermata successiva, fai clic su Deploy (Distribuisci). Se viene visualizzato un messaggio di errore o la creazione dello stream di dati richiede troppo tempo, annulla l’azione e riprova.
Fase 3: creare la trasformazione di dati in batch
Ora uniamo e filtriamo i dati per creare il nuovo DLO che mostri il totale delle vendite in grandi volumi per settore.
- Creare una nuova trasformazione di dati in batch utilizzando i Data Lake Objects (DLO).
- Fai clic sulla scheda Data Transforms (Trasformazioni dati).
- Fai clic su New Transform (Nuova trasformazione).
- Seleziona Batch Data Transforms (Trasformazioni dati batch) e Next (Avanti).
- Seleziona Data Lake Objects (Oggetti data lake) e Next (Avanti). Viene visualizzato il Transform Builder (Generatore trasformazioni).
- Fai clic sulla scheda Data Transforms (Trasformazioni dati).
- Aggiungi l’oggetto Opportunity (Opportunità) come dati di input.
- Fai clic su Add Input Data (Aggiungi dati di input).
- Quando viene visualizzata la tabella Add Input Data (Aggiungi dati di input), seleziona Opportunity_Home.
- Fai clic su Add Input Data (Aggiungi dati di input).
- Deseleziona la casella in corrispondenza di Name (Nome). Seleziona i seguenti campi e fai clic su Next (Avanti):
- KQ_Id
- KQ_AccountId
- KQ_OwnerId
- Account
- Titolare
- Amount (Ammontare)
- Name
- LeadSource
- KQ_Id
- Nel Transform Builder (Generatore trasformazioni) viene ora visualizzata come nodo la voce Opportunity_Home.
- Aggiungi al nodo Opportunity (Opportunità) un filtro denominato “Filter >30,000” (Filtro > 30.000).
- Seleziona il segno più accanto al nodo Opportunity (Opportunità).
- Nell’elenco di opzioni, seleziona Filter (Filtro).
- Seleziona l’icona della matita accanto al titolo Filter 0 (Filtro 0).
- Rinomina il nodo in
Filter >30,000(Filtro >30.000).
- Fai clic su Apply (Applica).
- Seleziona il segno più accanto al nodo Opportunity (Opportunità).
- Configura il filtro in modo che mostri solo le trattative superiori a $30.000.
- Nella tabella di anteprima dei dati, fai clic sul segno più rettangolare sotto Filters (Filtri).
- Nella finestra modale che viene visualizzata, seleziona Amount (Ammontare).
- In Operator (Operatore), scegli greater then (maggiore di).
- In Numeric value (Valore numerico), digita
30000. Non includere la punteggiatura o la valuta.
- Fai clic su Done (Chiudi) e poi su Apply (Applica).
- Nel Transform Builder (Generatore trasformazioni) viene ora visualizzata come nodo la voce Filter >30,000 (Filtro > 30.000.
- Nella tabella di anteprima dei dati, fai clic sul segno più rettangolare sotto Filters (Filtri).
- Unisci l’oggetto Account al nodo Filter >30,000 (Filtro > 30.000).
- Fai clic sul segno più sul nodo Filter >30,000 (Filtro > 30.000).
- Nell’elenco di opzioni, seleziona Join (Unisci).
- Nella tabella Select Input Data to Join (Seleziona i dati di input da unire), seleziona Account_Home.
- Fai clic sul segno più sul nodo Filter >30,000 (Filtro > 30.000).
- Deseleziona la casella in corrispondenza di Name (Nome). Seleziona i campi seguenti e fai clic su Next (Avanti).
- KQ_Id
- ID
- Name
- Settore
- KQ_Id
- Utilizza un nodo Join (Unisci) per il pooling dei dati di Account e Opportunity (Opportunità).
- Nel nodo Account_Home, seleziona Inner Join.
- Sotto Join Keys (Chiavi join), fai clic sul rettangolo sotto Filter >30,000 (Filtro >30.000) e Account_Home.
- Nella finestra modale Select Join Keys (Seleziona chiavi join), per Filter >30,000 (Filtro >30.000), seleziona Account.
- Per Account_Home, seleziona ID.
- Fai clic su Add (Aggiungi).
- Rinomina il nodo Join (Unisci) in
Get Accounts Info(Recupera informazioni account).
- Fai clic su Apply (Applica).
- Nel nodo Account_Home, seleziona Inner Join.
- Utilizza un nodo Aggregate (Aggrega) per raggruppare gli importi delle transazioni di grande volume appartenenti allo stesso settore.
- Fai clic sul segno più sul nodo Get Accounts Info (Recupera informazioni account).
- Seleziona Aggregate (Aggrega).
- Nella tabella di anteprima dei dati, fai clic sul segno più sotto Aggregates (Aggregati).
- Seleziona Sum (Somma) e poi Amount (Ammontare).
- Fai clic su Done (Chiudi).
- Nella tabella di anteprima dei dati, fai clic sul segno più sotto Group Rows (Raggruppa righe).
- Nella finestra modale, seleziona Industry (Settore) e fai clic su Apply (Applica).
- Rinomina il nodo Aggregate (Aggrega) in
Total Sales by Industry(Vendite totali per settore).
- Fai clic sul segno più sul nodo Get Accounts Info (Recupera informazioni account).
- Crea un nuovo DLO che utilizzi questa trasformazione di dati in batch per monitorare le vendite in grandi volumi per settore.
- Fai clic sul segno più sul nodo Total Sales by Industry (Vendite totali per settore).
- Nell’elenco di opzioni, seleziona Output (Esito).
- Lascia selezionata la modalità Create New and Replace (Crea nuovo e sostituisci).
- Sotto Object Name (Nome oggetto), digita
Large Sales by Industry(Vendite in grandi volumi per settore).
- Sotto Object Category (Categoria oggetto), seleziona Other (Altro).
- Sotto Primary Key (Chiave principale), seleziona Account_Home.Industry__c.
- Fai clic su Apply (Applica).
- Rinomina il nodo Output (Esito) in
Large Sales by Industry(Vendite in grandi volumi per settore).
- Ora, nella tabella di anteprima dei dati, puoi vedere quali settori generano gli affari di maggiore valore.
- Fai clic sul segno più sul nodo Total Sales by Industry (Vendite totali per settore).
- Nel Transform Builder (Generatore trasformazioni), fai clic su Save (Salva).
- Assegna alla trasformazione il nome
Large Sales by Industry(Vendite in grandi volumi per settore) e fai clic su Save (Salva).
- Esegui la trasformazione.
- Fai clic su Back to Data Transforms (Torna alle trasformazioni dati).
- Nella tabella, individua la trasformazione che hai appena creato, denominata “Large Sales by Industry” (Vendite in grandi volumi per settore).
- Fai clic sulla freccia giù alla fine della riga e seleziona Run Now (Esegui subito).
- Nella finestra modale che viene visualizzata, seleziona Run (Esegui).
- Attendi il completamento dell’esecuzione della trasformazione. L’operazione richiederà qualche minuto.
- Fai clic su Back to Data Transforms (Torna alle trasformazioni dati).

Visualizzare l'anteprima dei risultati
Una volta che la trasformazione è completa, vai su Data Explorer (Explorer dati) per aprire il DLO Large Sales by Industry (Vendite in grandi volumi per settore) ed esamina i dati.
Controllare la sfida
Ora per te è arrivato il momento di controllare il tuo lavoro. Accertati di aver seguito tutti i passaggi precedenti, quindi fai clic su Controlla la sfida per guadagnare 500 punti per passare all’unità successiva.
