Préparation à l’élaboration de votre modèle de données
Objectifs d’apprentissage
Après avoir terminé cette unité, vous pourrez :
- Définir les termes clés associés à l’ingestion et à la modélisation de données
- Identifier les avantages de l’utilisation de Data Cloud
Planification à l’avance
La quantité de données qu’une seule personne peut générer est incroyable. Tout comme le nombre de sources différentes dont ces données peuvent provenir. Même une simple séance d’achat peut générer des données client associées aux messages commerciaux, au trafic Web, aux achats, aux préférences, à l’emplacement et à une multitude d’autres sources. En tant que spécialiste des données, vous devez garder toutes ces informations organisées et accessibles afin de pouvoir améliorer la compréhension de vos clients. Il est de votre responsabilité de vous assurer que les données se trouvent au bon endroit et de créer tous les liens nécessaires pour mener à bien vos tâches d’analyse commerciale.
La définition de votre modèle de données peut être complexe. Vous devez comprendre quelles données sont collectées (et comment), la structure des données existante et la manière dont ces données sont associées à d’autres sources. De plus, vous devez rassembler toutes ces données dans une vue unique et exploitable de votre client. Data Cloud vous offre tous les outils dont vous avez besoin pour créer cette vue unique, puis interagir avec vos clients.
Avant de vous plonger dans Data Cloud, prenez un morceau de papier, un cahier, un tableau blanc ou tout ce sur quoi vous voulez griffonner. Élaborez une matrice avec tous vos jeux de données dans des colonnes, puis créez des lignes pour les considérations particulières de chaque jeu de données.
Jeux de données
Lors de l’établissement des colonnes de votre matrice, tenez compte de ces facteurs.
- Faites l’inventaire de toutes les sources de données que vous souhaitez intégrer :
- Logiciels traditionnels
- Bases de données externes
- CRM
- Commerce digital
- Lacs de données
- Bases de données marketing et e-mail
- Service à la clientèle
- Données d’engagement numérique (y compris Web et mobile)
- Analyses
- Identifiez tous les jeux de données requis pour chaque source de données, tels que les données du commerce digital avec des jeux de données pour les détails des commandes client et les données d’en-tête des commandes client.
Considérations particulières
Lors de l’établissement des lignes de votre matrice, tenez compte de ces caractéristiques.
- Distinguez la clé principale (la valeur qui identifie de manière unique une ligne de données) pour chaque jeu de données.
- Identifiez toutes les clés étrangères dans le jeu de données. Ces clés connexes dans la source peuvent être liées à la clé principale d’un autre jeu de données. (Par exemple, le jeu de données des détails de la commande client contient un ID de produit qui correspond à l’article acheté. Cet ID de produit renvoie à une table entièrement distincte contenant plus de détails sur ce produit, tels que la couleur ou la taille. L’instance de l’ID de produit sur le jeu de données des détails de la commande client est la clé étrangère, et l’instance de l’ID de produit sur le jeu de données de produit est la clé principale.)
- Déterminez si les données sont immuables (non sujettes à modification une fois qu’un enregistrement est envoyé) ou si le jeu de données doit prendre en compte les mises à jour des enregistrements existants.
- Déterminez s’il existe des transformations que vous souhaitez appliquer aux données. (Par exemple, vous pouvez utiliser des formules simples pour nettoyer les noms ou effectuer des calculs à partir des lignes.)
- Passez en revue les attributs, ou les champs, provenant de chaque source de données. Si le même champ est suivi dans plusieurs sources, décidez quelle source de données est la plus fiable. Vous pourrez définir un ordre de préférence des sources ultérieurement.
- Assurez-vous d’avoir les informations d’authentification à portée de main afin d’accéder à chaque jeu de données.
- Prenez note de la fréquence à laquelle les données sont mises à jour.
De la planification de vos concepts à l’élaboration de votre modèle
Maintenant que vous avez fait les démarches nécessaires pour comprendre votre implémentation de bout en bout, le reste du travail n’est que de la mécanique. Comme vous pouvez le voir sur le diagramme, nous adoptons une approche en deux phases pour importer des données.
- Ingestion des données : importez tous les champs d’un jeu de données exactement tels qu’ils sont, sans modification. De cette façon, vous pouvez toujours revenir à la forme originale des données si vous faites une erreur ou si vous modifiez les exigences de votre entreprise lors de la configuration. Vous pouvez également étendre le jeu de données en créant des champs de formule supplémentaires dans le but de nettoyer la nomenclature ou d’effectuer des calculs à partir des lignes. Chaque jeu de données sera représenté par un flux de données dans Data Cloud.
- Modélisation des données : mappez les flux de données au modèle de données afin de créer une vue harmonisée entre les sources.
En terminant cette première étape d’ingestion de chaque jeu de données, reportez-vous à votre matrice et examinez la source du jeu de données que vous aviez déterminée. Dans Data Cloud, il existe un endroit pour saisir le nom de la source. À côté de la source, vous spécifiez le jeu de données que vous importez de cette source en remplissant l’étiquette de l’objet et le nom d’API de l’objet.
Reportez-vous à la clé principale du jeu de données dans votre matrice et désignez ce champ comme clé principale lors de la définition de l’objet source de données. Vous souhaitez améliorer le jeu de données avec des champs de formule supplémentaires ? Il s’agit de la phase où vous pouvez appliquer la logique de formule. Souvenez-vous, vous avez indiqué si les données sont immuables ou non. Les jeux de données avec des valeurs dateTime (Date/heure) d’événement conviennent à la catégorie d’engagement type dans notre système. Ces jeux de données de comportement sont organisés en conteneurs fondés sur la date. Lorsque Data Cloud lit les données ultérieurement pour vous fournir les décomptes de segmentation, il sait exactement où récupérer rapidement les informations.
En employant le modèle de données Customer 360
Imaginez maintenant que toutes vos données sont ingérées et que chaque jeu de données parle sa propre langue. Comment faire pour qu’ils se comprennent tous ? Ces jeux de données doivent tous se conformer au même langage universel pour pouvoir commencer à interagir les uns avec les autres. C’est là qu’intervient la deuxième phase, la modélisation des données. Data Cloud utilise un modèle de données connu sous le nom de modèle de données Customer 360.
Ce modèle se compose de plusieurs objets couvrant un certain nombre de domaines. Ces domaines incluent, sans toutefois s’y limiter, Party (Partie), Product (Produit), Sale Order (Commande client) et Engagement. Le modèle est extensible, ce qui signifie que vous pouvez ajouter des objets standard aux attributs personnalisés et créer des objets personnalisés en choisissant comment ils sont associés à d’autres objets existants.
Vous pouvez considérer le modèle de données Customer 360 comme un moyen d’attribuer un contexte sémantique à vos objets sources, que tout le monde peut comprendre. Par exemple, que vous appeliez votre chez-vous un appartement, une maison ou une copropriété, vous pouvez convenir qu’il s’agit d’un endroit où une personne vit. De même, vous créez une couche de données harmonisée pour toutes les sources de données, qui est séparée des objets sources sous-jacents. Prenez en considération les données de commandes hors ligne avec un champ de commande Salescheck_Number et les données de commandes en ligne avec un champ de commande Order_ID. Bien que ces champs portent des noms distincts, ils font tous deux référence à un ID de commande. Il vous suffit donc de les marquer tous les deux dans le mappage en tant qu’ID de commande de référence du modèle de données Customer 360. Ce processus supprime les informations du contexte des différentes sources et génère une nouvelle couche de données conforme à une taxonomie unique. Quelle que soit leur provenance, vos données sont standardisées et utilisables au cours de vos tâches. C’est ainsi que nous faisons en sorte que tous les jeux de données parlent la même langue.