Élaboration de votre jeu de données CRM Analytics
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Expliquer l’importance de préparer les données qui seront analysées par Einstein Discovery
- Créer un jeu de données CRM Analytics et le remplir avec des données échantillon
Préparation des données pour Einstein Discovery
Une fois que vous avez sélectionné le résultat commercial à améliorer, vous devez collecter et préparer les données qui seront analysées par Einstein Discovery. Alors, quels sont les éléments pertinents pour le résultat, et lesquels ne le sont pas ?
Pour répondre à cette question, les data scientists utilisent souvent leur vaste expertise et leurs connaissances commerciales pour rechercher des données, expérimenter avec elles et les étudier. Le temps qu’ils ont investi en amont porte ses fruits une fois qu’ils disposent d’un jeu optimisé de données de haute qualité qu’ils peuvent employer dans le cadre d’analyses approfondies et de l’entraînement du modèle.
Dans l’idéal, votre jeu de données :
- inclut tous les facteurs pertinents associés au résultat commercial que vous souhaitez étudier et améliorer ;
- ne contient pas de colonnes superflues qui ajoutent de la complexité sans apporter de valeur analytique ;
- comprend des données de haute qualité représentatives de la réalité opérationnelle du résultat auquel vous vous intéressez.
Einstein Discovery et la plate-forme de données CRM Analytics accélèrent ce processus en vous fournissant une suite d’outils automatisés fonctionnant sans code, dont vous pouvez tirer profit afin de vous faciliter la tâche. La plate-forme de données CRM Analytics vous offre une suite d’outils et de mécanismes d’ingénierie des données pour vous aider à :
-
extraire des données provenant de nombreuses sources différentes ;
-
charger les données dans les jeux de données CRM Analytics que vous concevez.
-
transformer les données pour optimiser leur qualité et leur degré de préparation à l’analyse ;
Einstein Discovery peut analyser des millions de lignes de données comportant de nombreuses colonnes. En outre, cet outil peut vous aider à sélectionner les colonnes les plus fortement associées au résultat que vous souhaitez améliorer.
Dans ce module, nous vous simplifions la tâche en vous fournissant un fichier CSV que vous pouvez télécharger. Il contient des données échantillon d’historique d’opportunité que vous pouvez ingérer pour créer un jeu de données CRM Analytics et le remplir. Ainsi, vous pouvez rapidement commencer à utiliser Einstein Discovery pour analyser ces données, déployer un modèle et obtenir des prédictions et des améliorations.
Essayez Einstein Discovery avec une organisation Developer Edition
Si vous souhaitez réaliser les étapes présentées dans ce module Trailhead, inscrivez-vous gratuitement à une organisation Developer Edition CRM Analytics. Cette organisation est un environnement sécurisé dans lequel vous pouvez exercer les compétences en cours d’acquisition.
Remarque : Il n’est pas possible d'utiliser une organisation Developer Edition existante pour ce parcours. Inscrivez-vous plutôt à cette organisation Developer Edition spéciale, car :
- elle est fournie avec la licence CRM Analytics Plus requise pour Einstein Discovery ;
- elle dispose du jeu d’autorisations CRM Analytics Plus nécessaire pour accéder aux fonctionnalités d’Einstein Discovery. Cet ensemble inclut l’autorisation Gérer les applications connectées, nécessaire pour créer une application connectée permettant l’authentification des demandes de client REST.
Même si vous disposez déjà d’une organisation Developer Edition CRM Analytics, inscrivez-vous pour bénéficier d’une nouvelle organisation. Les organisations Developer Edition CRM Analytics plus anciennes ne disposent pas des fonctionnalités récemment publiées. En vous inscrivant à une nouvelle organisation, vous aurez la garantie de bénéficier des fonctionnalités les plus récentes et efficaces.
Étapes d’inscription
Procédons à la configuration afin que vous puissiez commencer.
- Accédez à trailhead.salesforce.com/promo/orgs/analytics-de.
- Renseignez le formulaire avec une adresse e-mail active.
- Une fois le formulaire renseigné, cliquez sur Inscrivez-moi. Un message de confirmation s’affiche.
- Dans l’e-mail d’activation que vous recevez, cliquez sur le lien.
- Renseignez le formulaire d’inscription, puis définissez votre mot de passe et une question de vérification.
- Cliquez sur Enregistrer. Vous êtes connecté à votre organisation Developer Edition CRM Analytics et redirigé vers la page de configuration.
Voici la marche à suivre ! Vous disposez maintenant d’une organisation Salesforce ! Allons-y.
Remarque : vous aurez besoin de vos informations d’identification plus tard dans ce module. Assurez-vous de les conserver dans un endroit sûr afin de pouvoir les récupérer à ce moment-là.
Téléchargement des données échantillon
Nous avons préparé un fichier contenant des données échantillon d’entraînement relatives à l’historique d’opportunité. Téléchargez le fichier CSV intitulé opportunity_history.csv et enregistrez-le sur votre ordinateur.
Création et importation d’un jeu de données CRM Analytics
L’étape suivante consiste à récupérer les données du fichier CSV et à les transférer dans un jeu de données CRM Analytics.
Remarque : pour une expérience optimale, assurez-vous que votre navigateur autorise les fenêtres contextuelles.
- Si vous ne l’avez pas encore fait, connectez-vous à l’organisation Developer Edition à laquelle vous venez de vous inscrire.
- Dans le lanceur d’application (), cherchez et sélectionnez Analytics Studio.
- Dans l’onglet d’accueil d’Analytics Studio, cliquez sur Créer et sélectionnez Jeu de données, puis Fichier CSV.
- Dans la fenêtre de sélection de fichiers qui s’ouvre, recherchez le fichier CSV que vous avez téléchargé (opportunity_history.csv), sélectionnez-le, puis cliquez sur Suivant.
- Si vous le souhaitez, modifiez le nom par défaut (opportunity_history) dans le champ Nom du jeu de données. Par défaut, Analytics Studio utilise le nom du fichier comme nom du jeu de données. Le nom ne peut pas contenir plus de 80 caractères.
- Sélectionnez l’application dans laquelle vous souhaitez créer le jeu de données. Par défaut, Analytics Studio sélectionne Mon application privée.
- Cliquez sur Next (Suivant). L’écran Modifier les attributs de champ apparaît. Vous pouvez y prévisualiser les données, et afficher ou modifier les attributs de chaque champ.
- Pour le moment, acceptez les valeurs par défaut et cliquez sur Upload File (Charger un fichier). Analytics Studio charge les données, prépare et crée le jeu de données, et vous indique la progression de ces opérations.
Une fois qu’il a terminé, des détails au sujet du jeu de données que vous avez créé s’affichent. Si vous ne voyez pas les détails du jeu de données, consultez vos jeux de données ou recherchez opportunity_history dans Analytics Studio.
Sur la ligne du jeu de données, sélectionnez Edit (Modifier) dans la liste déroulante pour accéder aux détails du jeu de données.
Considérations relatives aux données échantillon
Ces données échantillon d’entraînement ont été simplifiées afin que vous puissiez vous concentrer sur l’apprentissage de l’utilisation d’Einstein Discovery. Lorsque vous utilisez ces données échantillon, n’oubliez pas les aspects suivants.
- Notre exemple de fichier CSV contient un petit nombre de colonnes. En pratique, vos cas d’utilisation peuvent impliquer davantage de colonnes de données d’entraînement.
- Notre exemple de fichier CSV contient environ 7 000 lignes de données. En général, plus il y a de lignes de données à analyser, meilleurs sont les résultats. Einstein Discovery a besoin d’au moins 400 lignes contenant des valeurs de résultat pour créer un modèle.
- Lors de l’entraînement des modèles, Einstein ignore les lignes ne comportant pas de valeurs de résultat. À ce propos, sachez qu’Einstein Discovery vous permet d’analyser jusqu’à 20 millions de lignes de données grâce à l’IA et à l’apprentissage machine !
- Les données échantillon sont modélisées d’après les opportunités. En pratique, vos cas d’utilisation sont susceptibles d’impliquer des données de plusieurs objets Salesforce, des données externes à Salesforce ou une combinaison des deux.
- Le modèle créé à partir de ces données échantillon est destiné à notre module Trailhead, en vue de présenter les concepts de base. Il est conçu pour vous permettre de vous lancer rapidement. Cependant, le modèle généré à partir de ces données échantillon n’est ni très précis ni un bon exemple de la qualité des modèles que vous déploierez en définitive en production. Les performances de votre modèle dépendent de la qualité de votre jeu de données d’entraînement. Pour en savoir plus, consultez l’article Préparation des données à analyser dans l’aide Salesforce.
Et maintenant ?
Maintenant que vous disposez d’un jeu de données CRM Analytics, utilisons-le pour créer un modèle.
Ressources
- Aide Salesforce : Préparation des données à analyser
- Aide Salesforce : Création de jeux de données à partir de fichiers CSV chargés
- Aide Salesforce : Intégration et préparation des données pour l’analyse
- Trailhead : Mise en place et administration de CRM Analytics