Exploration des connaissances sur vos données

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

Expliquer ce qu’est une connaissance issue des données
Définir les types de connaissances issues des données générées par Einstein Discovery
Parcourir les connaissances issues des données et les interpréter

Que sont les connaissances issues des données ?

Une connaissance est une découverte dans vos données. Lorsque vous créez une version d’un modèle, Einstein Discovery analyse minutieusement vos données et génère des connaissances à partir de son analyse.

Einstein Discovery produit de manière ultra-rapide des connaissances qui sont impartiales, objectives et statistiquement significatives. Il emploie des graphiques et des explications factuelles pour vous faciliter l’assimilation et l’interprétation de ces connaissances. Les connaissances vous fournissent un point de départ pour étudier les liens entre les variables explicatives de votre modèle et son objectif. Votre travail consiste simplement à parcourir les connaissances pour trouver celles qui sont les plus pertinentes en ce qui concerne le résultat que vous souhaitez améliorer.

Types de connaissances

Einstein Discovery génère des connaissances des types suivants.

Type

Description

Descriptive

Connaissances dérivées de données historiques, obtenues par le biais d’analyses descriptives impliquant une analyse statistique. Les connaissances descriptives présentent ce qui s’est passé dans vos données.

Diagnostique

Connaissances dérivées du modèle. Les connaissances de diagnostic présentent pourquoi le phénomène s’est produit. Les connaissances de diagnostic proposent une analyse approfondie et vous aident à comprendre quelles variables ont l’impact le plus fort sur le résultat commercial que vous analysez.

Remarque : le terme pourquoi fait ici référence à une tendance solide au sein des données, et non nécessairement à une relation de cause à effet.

Comparative

Connaissances dérivées du modèle. Les connaissances comparatives expliquent les différences dans la variable de résultat en comparant deux sous-groupes spécifiques. Avec les connaissances comparatives, vous isolez des facteurs (catégories) et comparez leur impact sur le résultat par rapport à d’autres facteurs ou à des moyennes globales. Einstein Discovery affiche des graphiques en cascade pour vous aider à visualiser ces comparaisons.

Visualisation des connaissances issues des données

Dans le panneau de navigation de gauche, cliquez sur Connaissances des données. Einstein Discovery affiche alors l’écran Connaissances des données.

Exemple d’écran Connaissances des données accompagné de légendes indiquant la barre d’outils du récit, le panneau des variables, le résumé de la version du récit et les panneaux de résumé des connaissances

Le résumé du modèle (1) affiche l’objectif du modèle, le nombre total de lignes analysées, le résultat moyen et les éventuelles différences par rapport à la version précédente. Le bouton Explore a Variable (Explorer une variable) permet d’activer ou de désactiver le panneau des variables.
Le panneau des variables (2) affiche la liste des variables explicatives de votre modèle et leur corrélation avec le résultat du modèle, en commençant par la corrélation la plus élevée. Plus la corrélation exprimée en pourcentage est élevée, plus la relation statistique est forte. Dans notre modèle, la variable Type d’opportunité présente la corrélation la plus élevée avec les opportunités gagnées, suivie des variables Origine de la piste et Secteur d’activité.
Les panneaux de résumé des connaissances (3) affichent les principaux impacts positifs et négatifs sur la variable de résultat. Dans notre modèle, le taux de gain d’opportunité est le plus élevé lorsque l’origine de la piste est Référent partenaire et que le type d’opportunité est Nouvelle activité/Nouveau complément. Le taux de gain est le plus bas lorsque le type d’opportunité est Activité existante et que le montant est inférieur à 21 810. Dans ce cas, le taux de réussite observé est de 0,8 %, ce qui signifie que seulement environ 8 opportunités sur 1 000 sont remportées.

Examinons ensuite chacun des différents types de connaissances qu’Einstein Discovery a générées. Dans cette unité, vous découvrirez les connaissances descriptives, de diagnostic et comparatives.

Exploration des connaissances descriptives

Les premières connaissances que vous voyez sont les connaissances descriptives. Il s’agit des connaissances principales. Elles donnent un aperçu des facteurs qui ont contribué au résultat, sur la base d’une analyse statistique de votre jeu de données. Einstein Discovery utilise des histogrammes pour présenter les différences, les tendances et la signification des valeurs.

Faites défiler l’écran jusqu’en dessous du résumé des connaissances pour voir votre première connaissance dans la liste des connaissances descriptives. Les connaissances sont classées selon leur importance statistique. Les connaissances situées en haut ont eu le plus fort impact sur le résultat du modèle.

Exemple d’écran des connaissances avec des légendes indiquant le titre, le graphique et le texte explicatif

Chaque connaissance contient :

un titre (1) qui indique ce qui est mesuré ;
un graphique (2) qui représente visuellement les résultats ;
un texte explicatif (3) qui décrit les résultats et les interactions avec d’autres variables dans le jeu de données.

Étant donné que vous avez donné un objectif à Einstein (maximiser les opportunités remportées), chaque connaissance indique si un élément « était au-dessus » ou « était en dessous » des performances requises pour atteindre cet objectif. Un cercle vert avec une flèche indique une condition qui vous rapproche de votre objectif. Un cercle rouge avec une flèche indique une condition qui vous éloigne de votre objectif.

Cette connaissance vous montre que, parmi les types d’opportunités, Nouvelle activité/Nouveau complément a le taux de réussite le plus élevé, tandis qu’Activité existante a le taux le plus bas.

Dans le graphique, survolez une barre pour afficher une fenêtre contextuelle qui présente des précisions sous-jacentes. Fenêtre contextuelle qui apparaît lorsque vous survolez une barre du graphique et qui présente des précisions statistiques

Dans le texte explicatif, si vous survolez un lien hypertexte, la barre correspondante dans le graphique est mise en surbrillance dans une couleur différente. Une barre change de couleur dans le graphique lorsque vous survolez le lien hypertexte associé dans le texte explicatif.

Si vous le souhaitez, faites défiler l’écran vers le bas pour examiner d’autres connaissances descriptives figurant dans la liste.

Examen approfondi d’une seule variable (connaissances de premier ordre)

Pour filtrer la liste des connaissances, cliquez sur Type d’opportunité dans le panneau des variables.

La liste des connaissances affiche uniquement les connaissances associées à Type d’opportunité. Le sélecteur de filtre au-dessus de la connaissance affiche la variable que vous étudiez. Sélecteur de filtre de connaissances

La première connaissance de la liste montre comment le type d’opportunité est associé au résultat. Elle représente un résumé de toutes les valeurs associées à la variable. Dans le cas des connaissances descriptives, elle est également appelée connaissance de premier ordre, car elle examine comment une variable (Type d’opportunité) est responsable de la variation de la variable de résultat (IsWon TRUE).

Exploration des sous-groupes (connaissances de second ordre)

Faites défiler la liste jusqu’à la connaissance suivante. Exemple de connaissance de second ordre

Cette connaissance présente la manière dont une combinaison de variables (des sous-groupes) est associée à la variable de résultat. Dans cet exemple, l’origine de la piste Enquête téléphonique est mise en évidence, car elle présente de moins bons résultats que les autres sources de pistes, en particulier lorsqu’il s’agit d’une opportunité de vente croisée. Le graphique vous présente dans quelle mesure les performances de l’origine de piste Enquête téléphonique (les colonnes bleues) sont différentes de celles de toutes les autres origines de piste (les colonnes grises) pour trois types d’opportunités différents. Quel enseignement devez-vous en tirer ? Que le démarchage téléphonique n’est pas un moyen efficace de générer de nouvelles opportunités commerciales !

Si vous le souhaitez, faites défiler la liste vers le bas pour examiner d’autres connaissances qu’elle contient. Ensuite, intéressons-nous aux connaissances de diagnostic.

Exploration des connaissances de diagnostic

Tandis que les connaissances descriptives vous indiquent ce qui s’est passé, les connaissances de diagnostic vous indiquent quant à elles pourquoi ce phénomène s’est produit. Les connaissances de diagnostic vous permettent de mieux comprendre les facteurs qui sont à l’origine d’un résultat. Einstein Discovery déduit des connaissances de diagnostic à partir du modèle qu’il produit lors de la phase de création du modèle. Einstein utilise des graphiques en cascade pour représenter visuellement les connaissances de diagnostic.

Remarque : gardez bien en tête que le terme pourquoi fait ici référence à une tendance solide au sein des données, et non nécessairement à une relation de cause à effet.

Pour afficher les connaissances de diagnostic, sélectionnez une variable (Origine de la piste) dans le panneau Variables puis, dans Choisir une valeur, sélectionnez une valeur pour la variable (Référent partenaire). Sélectionnez une catégorie d’origine de la piste

Einstein vous présente un résumé des performances de la valeur sélectionnée. Résumé des performances du sous-groupe sélectionné

Einstein vous présente ensuite les connaissances de diagnostic pour Origine de la piste est Référent partenaire. Connaissance de diagnostic pour Origine de la piste est Référent partenaire

Ce graphique en cascade contient de nombreuses informations. Décomposons ces différents éléments.

Commençons par les barres bleues.

Au sommet, on trouve la moyenne globale, c’est-à-dire la moyenne de toutes les variables et valeurs.
En bas, on trouve la moyenne de la variable et de la valeur sélectionnées. Vous pouvez constater à quel point elle est différente de la moyenne globale (l’effet net).

Observons maintenant les barres vertes et rouges au milieu. Ces barres sont les facteurs d’influence spécifiques (ou effets individuels) qui indiquent la manière dont des facteurs individuels ou des groupes de facteurs sont associés au résultat. Les barres vertes représentent une amélioration, tandis que les barres rouges représentent une aggravation.

Les termes minimes associés représentent l’effet agrégé de tous les termes interagissant avec la sélection qui n’apparaissent pas dans les autres barres du graphique. De nombreux facteurs ont une incidence sur le résultat de la variable sélectionnée. Le graphique ne peut pas les contenir tous ; il ne montre que ceux ayant le plus d’impact. Les impacts restants sont regroupés en termes minimes. Cela permet ainsi de les différencier spécifiquement des deux groupes suivants.
Le groupe Inexpliqué quantifie l’écart que ce modèle n’a pas été en mesure d’attribuer aux différents facteurs d’incidence. Les facteurs d’incidence des connaissances de diagnostic comblent ensemble l’écart entre le résultat observé pour Origine de la piste est Référent partenaire et la moyenne générale. N’oubliez pas que ces facteurs d’incidence sont générés avec un modèle prédictif et qu’aucun modèle n’est parfait. Si Inexpliqué était égal à 0, cela signifierait que le modèle a toujours parfaitement prédit le taux de réussite pour Origine de la source est Référent partenaire, ce qui serait irréaliste et ne pourrait que signifier que le modèle est surajusté !

Nous pourrions en apprendre beaucoup plus ici (essayez de passer votre souris au-dessus des facteurs d’influence pour voir tous leurs scores), mais il est temps de passer aux connaissances comparatives.

Exploration des connaissances comparatives

Les connaissances comparatives sont une forme particulière des connaissances de diagnostic. Souvenez-vous qu’une connaissance de diagnostic décompose en facteurs contributifs la différence entre un sous-groupe donné et la moyenne générale. Une connaissance comparative fait de même, mais il s’agit cette fois de la différence entre deux sous-groupes différents. Einstein Discovery déduit des connaissances comparatives à partir du modèle qu’il produit. Einstein Discovery affiche des graphiques en cascade pour vous aider à visualiser ces comparaisons.

Pour consulter les connaissances comparatives, sélectionnez une variable (Origine de la piste) dans le panneau Variables. Dans Choisir une valeur, sélectionnez une catégorie de variable (Référent partenaire), puis choisissez une deuxième catégorie (Enquête téléphonique).

Sélectionnez une catégorie Origine de la piste à comparer avec une autre.

Einstein affiche la connaissance comparative. Écran affichant les composantes d’une connaissance comparative

Analysons certaines des informations de cet écran.

Le titre (1) indique quelle catégorie présente les meilleures performances par rapport au résultat.
Le résumé (2) présente la corrélation entre chaque catégorie et le résultat ainsi que les différences entre les catégories.
Le sous-titre (3) décrit exactement ce qui est comparé.
Le graphique en cascade (4) vous présente les principales différences entre les deux catégories.

La moyenne lorsque l’origine de la piste est Enquête téléphonique (barre supérieure grise).
La moyenne lorsque l’origine de la piste est Référent partenaire (barre inférieure bleue)
Les facteurs pour lesquels Enquête téléphonique est le plus performant (barres rouges).
Les facteurs pour lesquels Référent partenaire est le plus performant (barres vertes).

Possibilités supplémentaires relatives aux connaissances

En plus d’examiner et d’interpréter les connaissances issues des données contenues dans votre modèle, vous pouvez :

mettre en favori les connaissances auxquelles vous souhaitez revenir et filtrer la liste des connaissances pour n’afficher que les connaissances que vous avez ajoutées à vos favoris ;
filtrer les connaissances associées aux variables sensibles lors de l’analyse de vos données pour détecter les biais ;

Et maintenant ?

Maintenant que vous en savez plus sur les connaissances, déployons notre modèle.

Ressources

Aide Salesforce : Exploration des connaissances issues des données

Besoin d'aide ?