Découverte des transformations de données par lots dans Data 360
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Expliquer ce qu’est une transformation de données par lots et quand l’utiliser
- Identifier les différents types de nœuds de transformation de données
- Décrire comment créer une transformation de données par lots
Présentation des transformations de données par lots
Dans Data 360, les données arrivent via un flux de données et sont stockées dans un objet lac de données (DLO). Un objet lac de données est le conteneur de stockage des données intégrées dans Data 360. Une transformation de données vous permet d’accéder aux données d’un ou de plusieurs objets lac de données et de les transformer pour créer votre propre jeu de données. Une transformation de données peut également être utilisée pour transformer des données qui ont été mappées avec un objet modèle de données. Un objet modèle de données est une représentation structurée des entités de données et de leurs relations dans Salesforce.
Quand utiliser une transformation de données par lots
Contrairement à une transformation de données de streaming, qui s’exécute en continu, une transformation de données par lots s’exécute à intervalles planifiés. Les transformations de données par lots offrent également davantage de fonctionnalités que les transformations de données en continu, qui sont générées par une instruction SQL. Les transformations de données par lots contiennent un éditeur avec une expérience visuelle riche. Cet éditeur vous permet de combiner des données de plusieurs objets lac de données, de créer des champs calculés avec des fonctions, et de renvoyer des données vers plusieurs objets lac de données.
Utilisez une transformation de données par lots lorsque vous devez effectuer des transformations de données complexes ou lorsque vous avez besoin de mettre à jour des données selon un calendrier précis. Une transformation de données par lots vous permet de joindre, d’agréger et d’ajouter des données. Vous pouvez également utiliser des formules et des filtres.
Voici quelques scénarios dans lesquels une transformation de données par lots peut s’avérer utile :
-
Calculer des métriques pour des tableaux de bord : transformez les données brutes ingérées en indicateurs de performance clés utilisables, tels que des agrégats et des formules calculées, comme le taux de réussite ou la valeur vie client.
-
Standardiser les valeurs : consolidez les valeurs ingérées incohérentes telles que « Salesforce », « salesforce.com » ou « SFDC » en une seule valeur uniforme.
-
Procéder à un enrichissement à partir d’autres sources de données : combinez des données provenant de sources multiples telles que le CRM, les paies, les journaux d’utilisation et les enregistrements de client pour les utiliser dans des services Data 360 tels que la résolution d’identité et les connaissances calculées.
Comment utiliser une transformation de données par lots ?
Dans l’éditeur visuel, il vous suffit de faire glisser-déposer des nœuds pour créer les données dont vous avez besoin. Un nœud correspond à une étape de votre processus. Les nœuds représentent les données sources et cibles ainsi que les différentes opérations que vous effectuez sur ces données.
Lorsque vous créez une transformation de données par lots, vous pouvez utiliser les différents types de nœuds pour produire précisément les données dont vous avez besoin. Voici les différents types de nœuds disponibles et leurs caractéristiques.
Type de nœud |
Fonction |
|---|---|
Agrégation |
Cumule des données avec une granularité plus élevée à l’aide de ces fonctions : Average, Count, Maximum, Minimum, Stddevp, Stddev, Sum, Unique, Varp et Var. |
Fonctions AI |
Utilise les modèles IA d’Einstein Studio pour établir des prédictions. |
Ajouter |
Combine les lignes de plusieurs jeux de données. |
Un filtre |
Supprime les lignes inutiles dans vos données cibles. |
Entrée |
Stocke les données sources dans un objet lac de données ou un objet modèle de données. |
Joindre |
Joint deux branches d’entrée via une référence ou une jointure. Chaque branche d’entrée doit être associé à un champ clé. Par exemple, le nœud d’entrée des données client et le nœud correspondant aux billets vendus sont tous deux associés à un champ Customer ID (ID de client). |
Sortie |
Stocke les données transformées dans un objet lac de données ou un objet modèle de données. |
Transformation |
Exploite les données grâce à des fonctions. Avec ce nœud, vous pouvez calculer des valeurs, modifier des valeurs de chaîne, mettre en forme des dates, regrouper des valeurs, retirer des colonnes, traiter des valeurs JSON, etc. |
Mettre à jour |
Remplace les valeurs de colonne par les données d’une autre source de données lorsque les paires de clés correspondent. |
Défi pratique : créer une transformation de données par lots
Étape 1 : création de votre Playground
Pour terminer ce module, vous avez besoin d’un Playground personnalisé spécial à durée limitée qui contient Data 360 et nos données échantillons.
- Cliquez sur Create Playgound (Créer un Playground).
- Votre nouvelle organisation est automatiquement rattachée à votre compte Trailhead !
- Notez la date d’expiration de votre organisation et effectuez ce badge avant cette date.
Étape 2 : création de vos flux de données
Avant de pouvoir ingérer des données de compte et d’opportunité, vous devez les configurer en tant que sources de données dans Data 360.
- Dans Data Cloud, accédez à l’onglet Data Streams (Flux de données) et cliquez sur New (Nouveau).
- Cliquez sur Salesforce CRM sous Connected Sources (Sources connectées), puis sur Next (Suivant).
- Vous remarquerez que l’organisation d’évaluation Salesforce est présélectionnée. Dans la section View Bundles (Afficher les paquets), choisissez le paquet de données Sales (Ventes) et cliquez sur Next (Suivant). Le paquet contient tous les flux de données dont vous avez besoin pour créer votre transformation de données par lots.
- Ne décochez pas les champs standard et cliquez sur Next (Suivant).
- Sur l’écran suivant, cliquez sur Deploy (Déployer). Si une erreur s’affiche ou que la création du flux de données prend trop de temps, annulez l’action et réessayez.
Étape 3 : création de votre transformation de données par lots
À présent, combinons et filtrons les données afin de créer notre objet lac de données qui nous indique le total des ventes importantes par secteur d’activité.
- Créez une transformation de données par lots à l’aide d’objets lac de données.
- Cliquez sur l’onglet Data Transforms (Transformations de données).
- Cliquez sur New Transform (Nouvelle transformation).
- Sélectionnez Batch Data Transforms (Transformations de données par lots) et Next (Suivant).
- Sélectionnez Data Lake Objects (Objets lac de données) et Next (Suivant). Le générateur de transformation apparaît.
- Cliquez sur l’onglet Data Transforms (Transformations de données).
- Ajoutez l’objet Opportunity (Opportunité) en tant que données d’entrée.
- Cliquez sur Ajouter des données d’entrée.
- Lorsque le tableau Add Input Data (Ajouter des données d’entrée) apparaît, sélectionnez Opportunity_Home.
- Cliquez sur Ajouter des données d’entrée.
- Décochez la case située à côté de Name (Nom). Sélectionnez les champs suivants, puis cliquez sur Next (Suivant) :
- KQ_Id
- KQ_AccountId
- KQ_OwnerId
- Account (Compte)
- Propriétaire
- Montant
- Nom
- LeadSource
- KQ_Id
- Opportunity_Home apparaît désormais comme un nœud dans le générateur de transformation.
- Ajoutez un filtre au nœud Opportunity (Opportunité) appelé « Filter >30,000 » (Filtre > 30 000).
- Sélectionnez le signe plus à côté du nœud Opportunity (Opportunité).
- Dans la liste des options, sélectionnez Filter (Filtre).
- Sélectionnez l’icône du crayon à côté du titre Filter 0 (Filtre 0).
- Renommez le nœud
Filter >30,000(Filtre > 30 000).
- Cliquez sur Appliquer.
- Sélectionnez le signe plus à côté du nœud Opportunity (Opportunité).
- Configurez le filtre pour qu’il n’affiche que les affaires supérieures à 30 000 $.
- Dans le tableau de prévisualisation des données, cliquez sur le signe plus rectangulaire sous Filters (Filtres).
- Sélectionnez Amount (Montant) dans la fenêtre modale qui s’affiche.
- Pour Operator (Opérateur), choisissez greater than (supérieur à).
- Pour Numeric value (Valeur numérique), saisissez
30000. N’insérez pas de ponctuation ou de devises.
- Cliquez sur Done (Terminé), puis sur Apply (Appliquer).
- Filter >30,000 (Filtre > 30 000) apparaît désormais comme un nœud dans le générateur de transformations.
- Dans le tableau de prévisualisation des données, cliquez sur le signe plus rectangulaire sous Filters (Filtres).
- Joignez l’objet Account (Compte) au nœud Filter >30,000 (Filtre > 30 000).
- Cliquez sur le signe plus du nœud Filter >30,000 (Filtre > 30 000).
- Dans la liste des options, sélectionnez Join (Joindre).
- Dans le tableau Select Input Data to Join (Sélectionner les données d’entrée à joindre), sélectionnez Account_Home.
- Cliquez sur le signe plus du nœud Filter >30,000 (Filtre > 30 000).
- Décochez la case située à côté de Name (Nom). Sélectionnez les champs suivants, puis cliquez sur Next (Suivant).
- KQ_Id
- Id
- Nom
- Le secteur d’activité
- KQ_Id
- Utilisez un nœud Join (Joindre) pour regrouper vos données de compte et d’opportunité.
- Dans le nœud Account_Home, sélectionnez Inner Join (Jointure interne).
- Sous Join Keys (Clés de jointure), cliquez sur le rectangle situé sous Filter > 30,000 (Filtre >30 000) et Account_Home.
- Dans la fenêtre modale Select Join Keys (Sélectionner des clés de jointure), pour Filter > 30,000 (Filtre >30 000), sélectionnez Account (Compte).
- Pour Account_Home, sélectionnez ID.
- Cliquez sur Ajouter.
- Renommez le nœud Join (Joindre) en
Get Accounts Info(Récupérer les informations sur les comptes)
- Cliquez sur Appliquer.
- Dans le nœud Account_Home, sélectionnez Inner Join (Jointure interne).
- Utilisez un nœud Aggregate (Agréger) pour combiner des montants d’affaires importantes provenant du même secteur d’activité.
- Cliquez sur le signe plus dans le nœud Get Accounts Info (Récupérer les informations sur les comptes).
- Sélectionnez Aggregate (Agréger).
- Dans le tableau de prévisualisation des données, cliquez sur le signe plus sous Aggregates (Agrégats).
- Sélectionnez Sum (Somme), puis Amount (Montant).
- Cliquez sur Terminé.
- Dans le tableau de prévisualisation des données, cliquez sur le signe plus sous Group Rows (Grouper les lignes).
- Sélectionnez Industry (Secteur d’activité) dans la fenêtre modale et cliquez sur Apply (Appliquer).
- Renommez le nœud Aggregate (Agréger) en
Total Sales by Industry(Ventes totales par secteur d’activité).
- Cliquez sur le signe plus dans le nœud Get Accounts Info (Récupérer les informations sur les comptes).
- Créez un objet lac de donnés qui utilise cette transformation de données par lots pour suivre vos ventes importantes par secteur d’activité.
- Cliquez sur le signe plus du nœud Total Sales by Industry (Ventes totales par secteur d’activité).
- Dans la liste des options, sélectionnez Output (Sortie).
- Gardez les modes Create New (Créer) et Replace (Remplacer) sélectionnés.
- Sous Object Name (Nom de l’objet), saisissez
Large Sales by Industry(Ventes importantes par secteur d’activité)
- Sous Object Category (Catégorie d’objet), sélectionnez Other (Autre).
- Sous Primary Key (Clé primaire), sélectionnez Account_Home.Industry__c.
- Cliquez sur Appliquer.
- Renommez votre nœud Output (Sortie) en
Large Sales by Industry(Ventes importantes par secteur d’activité).
- Dans votre tableau de prévisualisation des données, vous pouvez maintenant voir quels sont les secteurs qui génèrent les transactions les plus importantes.
- Cliquez sur le signe plus du nœud Total Sales by Industry (Ventes totales par secteur d’activité).
- Dans le générateur de transformation, cliquez sur Save (Enregistrer).
- Nommez votre transformation
Large Sales by Industry(Ventes importantes par secteur d’activité), puis cliquez sur Save (Enregistrer).
- Exécutez la transformation.
- Cliquez sur Back to Data Transforms (Revenir à Transformations de données).
- Dans le tableau, recherchez la transformation que vous venez de créer et qui s’intitule « Large Sales by Industry » (Ventes importantes par secteur d’activité).
- Cliquez sur la flèche vers le bas au bout de la ligne et sélectionnez Run Now (Exécuter maintenant).
- Cliquez sur Run (Exécuter) dans la fenêtre modale qui s’affiche.
- Attendez la fin de l’exécution de la transformation. Cette opération prendra quelques minutes.
- Cliquez sur Back to Data Transforms (Revenir à Transformations de données).

Aperçu des résultats
Une fois la transformation terminée, accédez à Data Explorer (Explorateur de données) pour ouvrir l’objet lac de données Large Sales by Industry (Ventes importantes par secteur d’activité) et vérifiez ses données.
Validation du défi
Il est temps pour vous de valider votre travail. Assurez-vous que vous avez bien suivi toutes les étapes précédentes et cliquez sur Check Challenge to Earn 500 Points (Valider le défi pour gagner 500 points) afin de passer à l’unité suivante.
