Suivez votre progression
Accueil Trailhead
Accueil Trailhead

Préparation de vos données

Objectifs de formation

Une fois cette unité terminée, vous pourrez :
  • Décrire comment vous pouvez utiliser le flux de données pour préparer les données à utiliser
  • Préparer les données à l’aide d’une recette de jeu de données

Présentation de la préparation de données

Vous avez extrait toutes les données dont vous avez besoin et vous avez obtenu deux nouveaux jeux de données. Le jeu de données Descriptions SIC contient les données que vous avez extraites du fichier CSV. Le jeu de données Opportunités associées aux comptes et aux utilisateurs contient les données issues des objets de votre organisation Salesforce. Votre tâche finale consiste à préparer ces données et à les combiner en un seul jeu de données.

Voici où nous en sommes. Nous avons presque fini.

Schéma de l’importation des données où l’étape d’ajout de données externes à la recette de jeu de données est mise en évidence

Préparation de données dans un flux de données

Vous avez utilisé le flux de données dans l’unité précédente pour extraire des données de vos objets Salesforce. Rappelez-vous, le flux de données avait également fait un peu de préparation pour vous. Il avait ajouté des champs de compte et d’utilisateur à vos données d’opportunités et créé un jeu de données.

Ainsi, le flux de données n’est pas seulement un outil d’extraction, mais également un excellent outil de préparation de données. Vous pouvez l’utiliser pour filtrer des données, ajouter et supprimer des champs, ajouter ou mettre à jour des lignes à partir d’autre jeu de données, et ajouter des calculs à vos données. Toutefois, pour préparer les données, vous devez ajouter manuellement des instructions au flux de données, soit à l’aide de l’éditeur de flux de données, soit en écrivant des lignes JSON. Tout le monde n’est pas à l’aise avec ces opérations, mais si vous voulez essayer, consultez la section Ressources et suivez les liens pour plus de détails.

Pour la mission que vous a confiée DTC Electronics, vous allez préparer vos données sans le flux de données, à l’aide d’une recette de jeu de données.

Préparation de données dans une recette de jeu de données

L’outil de préparation de données, figurant dans l’interface utilisateur, vous permet de créer des recettes de jeu de données qui extraient des données à partir de jeux de données existants, les préparent et génèrent des résultats dans un nouveau jeu de données. Utilisez une recette pour combiner les données de plusieurs jeux de données, regrouper les données, ajouter des champs de formule et nettoyer les données en transformant les valeurs des champs. Vous pouvez supprimer des champs et filtrer les lignes dont vous n’avez pas besoin avant de créer le jeu de données cible.

Lorsque vous créez une recette, vous indiquez les transformations, ou étapes, que vous souhaitez effectuer sur une source. La source peut être un ou plusieurs jeux de données ou, bien qu’ils ne soient pas abordés ici, des objets connectés. Lorsque vous exécutez la recette, elle applique ces transformations et affiche les résultats dans un nouveau jeu de données cible.

Présentation des recettes de jeu de données

Pour maintenir votre jeu de données cible à jour, vous pouvez planifier une exécution régulière de la recette.

Création d’une recette de jeu de données

Vous pouvez créer et gérer des recettes de jeux de données dans le gestionnaire de données. Commençons par l’ouvrir.

  1. Dans Analytics, cliquez sur l’icône représentant un engrenage Icône représentant un engrenage servant à ouvrir le gestionnaire de données puis sur Gestionnaire de données. Le gestionnaire de données s’ouvre dans un nouvel onglet de navigateur.
  2. Dans le gestionnaire de données, cliquez sur l’onglet Flux de données et recettes.
  3. Dans l’onglet Flux de données et recettes, cliquez sur le sous-onglet RECETTES. Le sous-onglet Recettes affiche la liste de toutes les recettes existantes. Onglet Préparer
  4. Cliquez sur Créer une recette.
  5. Fermez l’écran de bienvenue de la Préparation des données.
  6. Cliquez sur Sélectionner des données.
  7. Choisissez celui que vous souhaitez utiliser comme jeu de données de base. Pour cette recette, cliquez sur Opportunités associées aux comptes et aux utilisateurs. Vous ne savez pas quel est votre jeu de données de base ? Demandez-vous quel jeu de données contient les données que vous souhaitez préparer ou à quel jeu de données vous voulez ajouter des champs. Voilà votre jeu de données de base. Dans notre exemple, il s’agit du jeu de données Opportunités associées aux comptes et aux utilisateurs.
  8. Cliquez sur Suivant. La recette s’ouvre dans Préparation des données.
Si c’est la première fois que vous créez une recette, prenons un instant pour examiner quelques astuces qui vous aideront dans votre navigation.

Par défaut, les étapes de la recette, appelées nœuds, sont affichées en haut, tandis que les détails du nœud sélectionné et un aperçu en temps réel de vos données sont affichés en dessous. Chaque recette commence par un nœud d’entrée.  L’aperçu de la recette peut afficher jusqu’à 100 colonnes.

Aperçu de la recette de jeu de données

Si la recette contient beaucoup de colonnes, vous pouvez utiliser l’onglet Colonnes pour rechercher des colonnes ou masquer celles dont vous n’avez pas besoin. Masquons quelques colonnes pour rendre l’aperçu plus lisible.

  1. Cliquez sur l’onglet Colonnes. La liste des colonnes de la recette s’affiche. Modification de l’aperçu de la recette de jeu de données
  2. Pour masquer la colonne ID de compte, sélectionnez-la et cliquez sur le bouton Masquer (Bouton Masquer à côté du nom du nœud) au-dessus de la section Aperçu et Colonnes. Les colonnes masquées sont répertoriées en dessous des colonnes affichées.
  3. Masquez les colonnes suivantes, vous n’en avez pas besoin pour le moment.
    • AccountId.BillingCountry
    • AccountId.BillingCity
    • ID de propriétaire
    • Date de création
    • ID d’opportunité
  4. Cliquez sur l’onglet Aperçu. L’aperçu n’inclut plus les colonnes que vous avez masquées.

Bien, maintenant que vous avez rendu la recette plus lisible, revenons à l’ajout des données de Description SIC à notre jeu de données d’opportunités de base.

Ajout de données à une recette de jeu de données

Vous pouvez ajouter des colonnes d’un autre jeu de données à une recette existante. Pour cela, vous devez faire « correspondre » les données afin qu’Analytics puisse ajouter les valeurs correctes aux lignes adéquates du nouveau jeu de données. Par exemple, votre jeu de données Descriptions SIC comporte un champ Code SIC que vous faites correspondre au champ Code SIC du compte dans la recette. Ce champ « apparié » est appelé clé jointe. Examinons-le en action.
  1. Dans Préparation des données, cliquez sur le bouton plus (Bouton Plus à côté du nœud d’entrée) à côté du nœud d’entrée Opportunités associées aux comptes et aux utilisateurs.
  2. Sélectionnez Joindre.
  3. Sélectionnez le jeu de données Descriptions SIC. Il s’agit du jeu de données de « référence » qui contient les colonnes à ajouter.
  4. Cliquez sur Suivant. Vous voyez la fenêtre Joindre, qui comporte quatre sections principales. L’écran Rejoindre où le type, les colonnes et les autres paramètres sont configurés.La section Type de jointure (1) vous permet de contrôler si la jointure est une recherche ou un autre type de jointure. La section Clés jointes (2) vous permet d’indiquer comment faire correspondre les données. Si Analytics détecte une correspondance possible, il sélectionne les clés jointes pour vous. S’il ne trouve pas de correspondance, il sélectionne les premiers champs de la recette et du jeu de données de référence. Vous pouvez conserver cette sélection ou choisir d’autres clés. Vous pouvez sélectionner jusqu’à 5 paires de clés. La section Colonnes (3) vous permet de sélectionner les colonnes que vous souhaitez avoir dans la recette après l’ajout des données. Les colonnes que vous avez masquées et les colonnes du jeu de données de référence ne sont pas sélectionnées. La section Aperçu (4) affiche un aperçu des données correspondant aux colonnes que vous avez incluses.
  5. Dans la section Clés jointes, vérifiez qu’Analytics a sélectionné les clés de référence AccountId.SIC et Code SIC. Si d’autres clés sont sélectionnées, cliquez dans chaque champ de clé de référence pour sélectionner les bonnes clés.
  6. En bas de la section Colonnes, assurez-vous que la colonne Description SIC est sélectionnée. Il s’agit de la seule colonne que vous avez besoin de récupérer dans le jeu de données de référence.
  7. Cliquez sur Appliquer. Le nœud Joindre et le nœud d’entrée Descriptions SIC sont ajoutés à la recette. Nouveau champ dans la recette du jeu de données

Vous pouvez répéter l’opération pour ajouter des colonnes provenant d’autres jeux de données.

Configuration des résultats d’une recette

Ajoutons un nœud de sortie afin de pouvoir exécuter la recette exactement comme nous le souhaitons. Sélectionnez une application pour le nouveau jeu de données, puis sélectionnez les derniers champs à inclure. 

  1. Cliquez sur le bouton plus (Bouton Plus à côté du nœud d’entrée) à côté du nœud Joindre.
  2. Sélectionnez SortieConfiguration du nœud de sortie. Les paramètres sont sur la gauche, l’aperçu et les colonnes sur la droite.
  3. Configurez le nœud de sortie (1) :
    • Étiquette d’affichage du jeu de données : Opportunités avec des descriptions SIC
    • Nom d’API du jeu de données : Opportunities_with_Accounts_and_Users
    • Emplacement de l’application : Jeux de données des performances commerciales
  4. Dans la liste des colonnes (2), vous pouvez remarquer que les colonnes que vous avez masquées dans l’aperçu ne sont pas sélectionnées. Sélectionnez ces colonnes pour les inclure dans le jeu de données cible.
    • ID de compte
    • AccountId.BillingCountry
    • AccountId.BillingCity
    • ID de propriétaire
    • Date de création
    • ID d’opportunité
  5. Dans la liste des colonnes, les colonnes AccountId.SIC et Code SIC sont toutes deux sélectionnées, car ce sont les clés de référence. Comme vous n’en avez besoin que d’une, masquez Code SIC en bas de la liste.
  6. Cliquez sur Appliquer.
  7. Cliquez sur Enregistrer.
  8. Saisissez un nom de recette. Nommez celle-ci Opportunités associées aux descriptions SIC.
  9. Cliquez sur Revenir au Gestionnaire de données.

Nous avons fini de modifier cette recette. Néanmoins, la préparation de données ne s’arrête pas là et recouvre beaucoup d’autres opérations. Si vous souhaitez en essayer quelques-unes, consultez la section Ressources pour plus de détails.

Exécution d’une recette de jeu de données

Lorsque vous exécutez une recette, Analytics effectue les étapes que vous avez ajoutées et crée le jeu de données cible. Vous pouvez également maintenir le jeu de données cible à jour en planifiant l’exécution régulière de la recette. Commençons par créer le jeu de données.

  1. Dans le gestionnaire de données, cliquez sur l’onglet Flux de données et recettes.
  2. Dans l’onglet Flux de données et recettes, cliquez sur le sous-onglet RECETTES.
  3. Pour exécuter la recette, cliquez sur Bouton de menu du flux de données dans le gestionnaire de données à droite de la recette Opportunités avec des descriptions SIC, puis sélectionnez Exécuter maintenant. Vous verrez une bannière verte en haut du gestionnaire de données qui confirme la bonne exécution.
  4. Cliquez à nouveau sur Bouton de menu du flux de données dans le gestionnaire de données et sélectionnez Planifier.
  5. Vous souhaitez que la recette s’exécute chaque matin de la semaine, juste après le flux de données. Planifiez le flux de données pour qu’il s’exécute tous les jours de la semaine à 2 h 00 en sélectionnant les paramètres suivants.
    1. Planifié par : Heure
    2. Début : 2 h 00
    3. Exécuter chaque : 24 heures
    4. Sélectionner les jours : Lu, Ma, Me, Je, Ve.
  6. Cliquez sur Enregistrer. Votre recette est planifiée.

Surveillance d’une tâche de recette et inspection du nouveau jeu de données

En arrière-plan, Analytics génère une nouvelle tâche pour exécuter la recette. Vous pouvez accéder à l’onglet Surveiller du gestionnaire de données pour suivre sa progression.

Il est également utile d’ouvrir le nouveau jeu de données pour vérifier que tous les champs sont présents.

  1. À gauche du gestionnaire de données, cliquez sur l’onglet Données.
  2. À droite du jeu de données Opportunités associées aux descriptions SIC, cliquez sur Bouton de menu du flux de données dans le gestionnaire de données et sélectionnez Explorer. Si le jeu de données n’apparaît pas à l’écran, essayez d’actualiser votre navigateur.
  3. Sous Barres, cliquez sur le bouton Ajouter un groupe (+). Le champ Description SIC devrait apparaître dans la liste des dimensions.

Félicitations !

Vous l’avez fait ! Vous avez déterminé les données dont vous avez besoin ainsi que leur emplacement, et vous avez importé les données externes et Salesforce dans Analytics. Vous les avez ensuite extraites, nettoyées et regroupées au sein d’un même jeu de données contenant tous les champs dont vous avez besoin et disponible à tout moment.

Voici l’ensemble du processus que vous avez effectué.

Schéma de l’importation des données montrant que le processus est terminé. Bravo !