Skip to main content
Rejoignez-nous lors de l'Ă©vĂ©nement TDX Ă  San Francisco ou sur Salesforce+ les 5 et 6 mars pour la confĂ©rence des dĂ©veloppeurs Ă  l'ère des agents IA. Inscrivez-vous dès maintenant.

Exploration des connaissances sur vos données

Objectifs de formation

Une fois cette unitĂ© terminĂ©e, vous pourrez :

  • Expliquer ce qu’est une connaissance issue des donnĂ©es
  • DĂ©finir les types de connaissances issues des donnĂ©es gĂ©nĂ©rĂ©es par Einstein Discovery
  • Parcourir les connaissances issues des donnĂ©es et les interprĂ©ter

Que sont les connaissances issues des donnĂ©es ?

Une connaissance est une dĂ©couverte dans vos donnĂ©es. Lorsque vous crĂ©ez une version d’un modèle, Einstein Discovery analyse minutieusement vos donnĂ©es et gĂ©nère des connaissances Ă  partir de son analyse. 

Einstein Discovery produit de manière ultra-rapide des connaissances qui sont impartiales, objectives et statistiquement significatives. Il emploie des graphiques et des explications factuelles pour vous faciliter l’assimilation et l’interprĂ©tation de ces connaissances. Les connaissances vous fournissent un point de dĂ©part pour Ă©tudier les liens entre les variables explicatives de votre modèle et son objectif. Votre travail consiste simplement Ă  parcourir les connaissances pour trouver celles qui sont les plus pertinentes en ce qui concerne le rĂ©sultat que vous souhaitez amĂ©liorer.

Types de connaissances

Einstein Discovery gĂ©nère des connaissances des types suivants.

Type

Description

Descriptive

Connaissances dérivées de données historiques, obtenues par le biais d’analyses descriptives impliquant une analyse statistique. Les connaissances descriptives présentent ce qui s’est passé dans vos données.

Diagnostique

Connaissances dĂ©rivĂ©es du modèle. Les connaissances de diagnostic prĂ©sentent pourquoi le phĂ©nomène s’est produit. Les connaissances de diagnostic proposent une analyse approfondie et vous aident Ă  comprendre quelles variables ont l’impact le plus fort sur le rĂ©sultat commercial que vous analysez. 

Remarque : le terme pourquoi fait ici rĂ©fĂ©rence Ă  une tendance solide au sein des donnĂ©es, et non nĂ©cessairement Ă  une relation de cause Ă  effet.

Comparative

Connaissances dĂ©rivĂ©es du modèle. Les connaissances comparatives expliquent les diffĂ©rences dans la variable de rĂ©sultat en comparant deux sous-groupes spĂ©cifiques. Avec les connaissances comparatives, vous isolez des facteurs (catĂ©gories) et comparez leur impact sur le rĂ©sultat par rapport Ă  d’autres facteurs ou Ă  des moyennes globales. Einstein Discovery affiche des graphiques en cascade pour vous aider Ă  visualiser ces comparaisons.

Visualisation des connaissances issues des données

Dans le panneau de navigation de gauche, cliquez sur Connaissances des donnĂ©es. Einstein Discovery affiche alors l’écran Connaissances des donnĂ©es. 

Exemple d’écran Connaissances des données accompagné de légendes indiquant la barre d’outils du récit, le panneau des variables, le résumé de la version du récit et les panneaux de résumé des connaissances

  • Le rĂ©sumĂ© du modèle (1) affiche l’objectif du modèle, le nombre total de lignes analysĂ©es, le rĂ©sultat moyen et les Ă©ventuelles diffĂ©rences par rapport Ă  la version prĂ©cĂ©dente. Le bouton Explore a Variable (Explorer une variable) permet d’activer ou de dĂ©sactiver le panneau des variables.
  • Le panneau des variables (2) affiche la liste des variables explicatives de votre modèle et leur corrĂ©lation avec le rĂ©sultat du modèle, en commençant par la corrĂ©lation la plus Ă©levĂ©e. Plus la corrĂ©lation exprimĂ©e en pourcentage est Ă©levĂ©e, plus la relation statistique est forte. Dans notre modèle, la variable Type d’opportunitĂ© prĂ©sente la corrĂ©lation la plus Ă©levĂ©e avec les opportunitĂ©s gagnĂ©es, suivie des variables Origine de la piste et Secteur d’activitĂ©.
  • Les panneaux de rĂ©sumĂ© des connaissances (3) affichent les principaux impacts positifs et nĂ©gatifs sur la variable de rĂ©sultat. Dans notre modèle, le taux de gain d’opportunitĂ© est le plus Ă©levĂ© lorsque l’origine de la piste est RĂ©fĂ©rent partenaire et que le type d’opportunitĂ© est Nouvelle activitĂ©/Nouveau complĂ©ment. Le taux de gain est le plus bas lorsque le type d’opportunitĂ© est ActivitĂ© existante et que le montant est infĂ©rieur Ă  21 810. Dans ce cas, le taux de rĂ©ussite observĂ© est de 0,8 %, ce qui signifie que seulement environ 8 opportunitĂ©s sur 1 000 sont remportĂ©es.

Examinons ensuite chacun des diffĂ©rents types de connaissances qu’Einstein Discovery a gĂ©nĂ©rĂ©es. Dans cette unitĂ©, vous dĂ©couvrirez les connaissances descriptives, de diagnostic et comparatives. 

Exploration des connaissances descriptives

Les premières connaissances que vous voyez sont les connaissances descriptives. Il s’agit des connaissances principales. Elles donnent un aperçu des facteurs qui ont contribuĂ© au rĂ©sultat, sur la base d’une analyse statistique de votre jeu de donnĂ©es. Einstein Discovery utilise des histogrammes pour prĂ©senter les diffĂ©rences, les tendances et la signification des valeurs.

Faites dĂ©filer l’écran jusqu’en dessous du rĂ©sumĂ© des connaissances pour voir votre première connaissance dans la liste des connaissances descriptives. Les connaissances sont classĂ©es selon leur importance statistique. Les connaissances situĂ©es en haut ont eu le plus fort impact sur le rĂ©sultat du modèle. 

Exemple d’écran des connaissances avec des légendes indiquant le titre, le graphique et le texte explicatif

Chaque connaissance contient :

  • un titre (1) qui indique ce qui est mesurĂ© ;
  • un graphique (2) qui reprĂ©sente visuellement les rĂ©sultats ;
  • un texte explicatif (3) qui dĂ©crit les rĂ©sultats et les interactions avec d’autres variables dans le jeu de donnĂ©es.

Étant donnĂ© que vous avez donnĂ© un objectif Ă  Einstein (maximiser les opportunitĂ©s remportĂ©es), chaque connaissance indique si un Ă©lĂ©ment « Ă©tait au-dessus Â» ou « Ă©tait en dessous Â» des performances requises pour atteindre cet objectif. Un cercle vert avec une flèche indique une condition qui vous rapproche de votre objectif. Un cercle rouge avec une flèche indique une condition qui vous Ă©loigne de votre objectif.

Cette connaissance vous montre que, parmi les types d’opportunités, Nouvelle activité/Nouveau complément a le taux de réussite le plus élevé, tandis qu’Activité existante a le taux le plus bas.

Dans le graphique, survolez une barre pour afficher une fenĂªtre contextuelle qui prĂ©sente des prĂ©cisions sous-jacentes.

 FenĂªtre contextuelle qui apparaĂ®t lorsque vous survolez une barre du graphique et qui prĂ©sente des prĂ©cisions statistiques

Dans le texte explicatif, si vous survolez un lien hypertexte, la barre correspondante dans le graphique est mise en surbrillance dans une couleur diffĂ©rente. Une barre change de couleur dans le graphique lorsque vous survolez le lien hypertexte associĂ© dans le texte explicatif.

Si vous le souhaitez, faites dĂ©filer l’écran vers le bas pour examiner d’autres connaissances descriptives figurant dans la liste. 

Examen approfondi d’une seule variable (connaissances de premier ordre)

Pour filtrer la liste des connaissances, cliquez sur Type d’opportunitĂ© dans le panneau des variables. 

La liste des connaissances affiche uniquement les connaissances associĂ©es Ă  Type d’opportunitĂ©. Le sĂ©lecteur de filtre au-dessus de la connaissance affiche la variable que vous Ă©tudiez. 

SĂ©lecteur de filtre de connaissances

La première connaissance de la liste montre comment le type d’opportunité est associé au résultat. Elle représente un résumé de toutes les valeurs associées à la variable. Dans le cas des connaissances descriptives, elle est également appelée connaissance de premier ordre, car elle examine comment une variable (Type d’opportunité) est responsable de la variation de la variable de résultat (IsWon TRUE).

Exploration des sous-groupes (connaissances de second ordre)

Faites dĂ©filer la liste jusqu’à la connaissance suivante. Exemple de connaissance de second ordre

Cette connaissance prĂ©sente la manière dont une combinaison de variables (des sous-groupes) est associĂ©e Ă  la variable de rĂ©sultat. Dans cet exemple, l’origine de la piste EnquĂªte tĂ©lĂ©phonique est mise en Ă©vidence, car elle prĂ©sente de moins bons rĂ©sultats que les autres sources de pistes, en particulier lorsqu’il s’agit d’une opportunitĂ© de vente croisĂ©e. Le graphique vous prĂ©sente dans quelle mesure les performances de l’origine de piste EnquĂªte tĂ©lĂ©phonique (les colonnes bleues) sont diffĂ©rentes de celles de toutes les autres origines de piste (les colonnes grises) pour trois types d’opportunitĂ©s diffĂ©rents. Quel enseignement devez-vous en tirer ? Que le dĂ©marchage tĂ©lĂ©phonique n’est pas un moyen efficace de gĂ©nĂ©rer de nouvelles opportunitĂ©s commerciales !

Si vous le souhaitez, faites défiler la liste vers le bas pour examiner d’autres connaissances qu’elle contient. Ensuite, intéressons-nous aux connaissances de diagnostic.

Exploration des connaissances de diagnostic

Tandis que les connaissances descriptives vous indiquent ce qui s’est passĂ©, les connaissances de diagnostic vous indiquent quant Ă  elles pourquoi ce phĂ©nomène s’est produit. Les connaissances de diagnostic vous permettent de mieux comprendre les facteurs qui sont Ă  l’origine d’un rĂ©sultat. Einstein Discovery dĂ©duit des connaissances de diagnostic Ă  partir du modèle qu’il produit lors de la phase de crĂ©ation du modèle. Einstein utilise des graphiques en cascade pour reprĂ©senter visuellement les connaissances de diagnostic.

Remarque : gardez bien en tĂªte que le terme pourquoi fait ici rĂ©fĂ©rence Ă  une tendance solide au sein des donnĂ©es, et non nĂ©cessairement Ă  une relation de cause Ă  effet.

Pour afficher les connaissances de diagnostic, sĂ©lectionnez une variable (Origine de la piste) dans le panneau Variables puis, dans Choisir une valeur, sĂ©lectionnez une valeur pour la variable (RĂ©fĂ©rent partenaire). 

Sélectionnez une catégorie d’origine de la piste

Einstein vous prĂ©sente un rĂ©sumĂ© des performances de la valeur sĂ©lectionnĂ©e. RĂ©sumĂ© des performances du sous-groupe sĂ©lectionnĂ©

Einstein vous prĂ©sente ensuite les connaissances de diagnostic pour Origine de la piste est RĂ©fĂ©rent partenaire. Connaissance de diagnostic pour Origine de la piste est RĂ©fĂ©rent partenaire

Ce graphique en cascade contient de nombreuses informations. Décomposons ces différents éléments.

Commençons par les barres bleues.

  • Au sommet, on trouve la moyenne globale, c’est-Ă -dire la moyenne de toutes les variables et valeurs.
  • En bas, on trouve la moyenne de la variable et de la valeur sĂ©lectionnĂ©es. Vous pouvez constater Ă  quel point elle est diffĂ©rente de la moyenne globale (l’effet net).

Observons maintenant les barres vertes et rouges au milieu. Ces barres sont les facteurs d’influence spĂ©cifiques (ou effets individuels) qui indiquent la manière dont des facteurs individuels ou des groupes de facteurs sont associĂ©s au rĂ©sultat. Les barres vertes reprĂ©sentent une amĂ©lioration, tandis que les barres rouges reprĂ©sentent une aggravation.

  • Les termes minimes associĂ©s reprĂ©sentent l’effet agrĂ©gĂ© de tous les termes interagissant avec la sĂ©lection qui n’apparaissent pas dans les autres barres du graphique. De nombreux facteurs ont une incidence sur le rĂ©sultat de la variable sĂ©lectionnĂ©e. Le graphique ne peut pas les contenir tous ; il ne montre que ceux ayant le plus d’impact. Les impacts restants sont regroupĂ©s en termes minimes. Cela permet ainsi de les diffĂ©rencier spĂ©cifiquement des deux groupes suivants.
  • Le groupe InexpliquĂ© quantifie l’écart que ce modèle n’a pas Ă©tĂ© en mesure d’attribuer aux diffĂ©rents facteurs d’incidence. Les facteurs d’incidence des connaissances de diagnostic comblent ensemble l’écart entre le rĂ©sultat observĂ© pour Origine de la piste est RĂ©fĂ©rent partenaire et la moyenne gĂ©nĂ©rale. N’oubliez pas que ces facteurs d’incidence sont gĂ©nĂ©rĂ©s avec un modèle prĂ©dictif et qu’aucun modèle n’est parfait. Si InexpliquĂ© Ă©tait Ă©gal Ă  0, cela signifierait que le modèle a toujours parfaitement prĂ©dit le taux de rĂ©ussite pour Origine de la source est RĂ©fĂ©rent partenaire, ce qui serait irrĂ©aliste et ne pourrait que signifier que le modèle est surajustĂ© !

Nous pourrions en apprendre beaucoup plus ici (essayez de passer votre souris au-dessus des facteurs d’influence pour voir tous leurs scores), mais il est temps de passer aux connaissances comparatives.

Exploration des connaissances comparatives

Les connaissances comparatives sont une forme particulière des connaissances de diagnostic. Souvenez-vous qu’une connaissance de diagnostic dĂ©compose en facteurs contributifs la diffĂ©rence entre un sous-groupe donnĂ© et la moyenne gĂ©nĂ©rale. Une connaissance comparative fait de mĂªme, mais il s’agit cette fois de la diffĂ©rence entre deux sous-groupes diffĂ©rents. Einstein Discovery dĂ©duit des connaissances comparatives Ă  partir du modèle qu’il produit. Einstein Discovery affiche des graphiques en cascade pour vous aider Ă  visualiser ces comparaisons.

Pour consulter les connaissances comparatives, sĂ©lectionnez une variable (Origine de la piste) dans le panneau Variables. Dans Choisir une valeur, sĂ©lectionnez une catĂ©gorie de variable (RĂ©fĂ©rent partenaire), puis choisissez une deuxième catĂ©gorie (EnquĂªte tĂ©lĂ©phonique).

Sélectionnez une catégorie Origine de la piste à comparer avec une autre.

Einstein affiche la connaissance comparative. Ă‰cran affichant les composantes d’une connaissance comparative

Analysons certaines des informations de cet Ă©cran.

  • Le titre (1) indique quelle catĂ©gorie prĂ©sente les meilleures performances par rapport au rĂ©sultat.
  • Le rĂ©sumĂ© (2) prĂ©sente la corrĂ©lation entre chaque catĂ©gorie et le rĂ©sultat ainsi que les diffĂ©rences entre les catĂ©gories.
  • Le sous-titre (3) dĂ©crit exactement ce qui est comparĂ©.
  • Le graphique en cascade (4) vous prĂ©sente les principales diffĂ©rences entre les deux catĂ©gories.
    • La moyenne lorsque l’origine de la piste est EnquĂªte tĂ©lĂ©phonique (barre supĂ©rieure grise).
    • La moyenne lorsque l’origine de la piste est RĂ©fĂ©rent partenaire (barre infĂ©rieure bleue)
    • Les facteurs pour lesquels EnquĂªte tĂ©lĂ©phonique est le plus performant (barres rouges).
    • Les facteurs pour lesquels RĂ©fĂ©rent partenaire est le plus performant (barres vertes).

Possibilités supplémentaires relatives aux connaissances

En plus d’examiner et d’interprĂ©ter les connaissances issues des donnĂ©es contenues dans votre modèle, vous pouvez :

  • mettre en favori les connaissances auxquelles vous souhaitez revenir et filtrer la liste des connaissances pour n’afficher que les connaissances que vous avez ajoutĂ©es Ă  vos favoris ;
  • filtrer les connaissances associĂ©es aux variables sensibles lors de l’analyse de vos donnĂ©es pour dĂ©tecter les biais ;

Et maintenant ?

Maintenant que vous en savez plus sur les connaissances, déployons notre modèle.

Ressources

Partagez vos commentaires sur Trailhead dans l'aide Salesforce.

Nous aimerions connaître votre expérience avec Trailhead. Vous pouvez désormais accéder au nouveau formulaire de commentaires à tout moment depuis le site d'aide Salesforce.

En savoir plus Continuer Ă  partager vos commentaires