Skip to main content

Exploration des types d’analyses de données

Objectifs de formation 

Une fois cette unité terminée, vous pourrez :

  • Expliquer comment les analyses de données améliorent les processus de prise de décision
  • Définir les différents types d’analyses
  • Expliquer ce qu’est l’analyse descriptive
Remarque

Ce module a été élaboré en collaboration avec Amazon Web Services (AWS), qui possède, prend en charge et gère les produits, les services et les fonctionnalités Amazon Web Services décrits ici. L’utilisation de produits, de services et de fonctionnalités Amazon Web Services est régie par les politiques de confidentialité et les contrats de service gérés par AWS.

Obtention d’informations

La collecte de points de données n’est qu’une première étape. Qu’allez donc vous faire de toutes ces données ? Vous devez extraire les informations qu’elles contiennent pour aider vos collègues à prendre des décisions. Il s’agit de l’objectif principal des analyses de données. Ce module vous présente les différents types d’analyses de données, en particulier l’analyse descriptive, et la manière dont ils sont utilisés dans les modèles économiques courants.  

Regardez la vidéo suivante où intervient Rafael Lopes, surnommé Raf, technologue Cloud senior chez AWS. Le questionnaire à la fin de cette unité contient des questions se rapportant au contenu de cette vidéo. Veillez bien à la regarder afin d’obtenir les informations nécessaires pour répondre aux questions posées à la fin de cette unité. 

Vous constaterez que Raf mentionne les termes cours et leçon plusieurs fois. Dans ce contexte, ils signifient « module ».

Afficher la transcription

[Raf] Bonjour. Si vous êtes ici, c’est que vous êtes probablement intéressé par les analyses de données, et c’est formidable. Laissez-moi commencer par vous présenter la valeur ajoutée qu’apportent les analyses de données.

La première chose à laquelle nous devons penser quand on parle d’analyses de données, c’est de savoir comment utiliser les données collectées pour générer des informations qui seront utiles pour répondre à de futurs besoins métiers. C’est ce qu’on appelle des connaissances.

Parfois, ce processus de génération de connaissances à partir de données peut s’avérer long et complexe, et impliquer l’utilisation de l’apprentissage automatique. D’autres fois, il peut être simple et rapide si l’ensemble de données est prêt et que vous souhaitez simplement effectuer une analyse descriptive des données. Cela étant dit, l’analyse de données est la science consistant à traiter des données collectées par des systèmes informatiques en vue de générer des connaissances qui éclaireront les prises de décisions grâce à des faits fondés sur des données.

De nos jours, les analyses de données sont largement employées dans les domaines du commerce digital et des réseaux sociaux. Toutefois, les savoir-faire en la matière peuvent et doivent être appliqués dans les domaines de la sécurité de l’information, de la logistique, des activités de fabrication, de l’Internet des objets, et bien d’autres encore.

Il existe quatre principaux types d’analyses de données. Par ordre de complexité, on les connaît sous les noms d’analyse descriptive, diagnostique, prédictive et prescriptive. Parlons un peu de chacune d’entre elles. Je vais consacrer un peu plus de temps à l’analyse descriptive car, dans ce cours d’introduction, c’est celle à laquelle je m’intéresserai le plus.

L’analyse descriptive est un type d’analyse de données qui est principalement utilisé pour vous donner des informations concernant un événement qui s’est déroulé. Il est destiné à vous permettre d’utiliser les données collectées par un système afin de vous aider à identifier les aspects problématiques, ceux qui pourraient être améliorés, ou la métrique qui ne présente pas les résultats attendus.

Comme ce type d’analyse de données est largement utilisé pour résumer de grands ensembles de données afin de décrire des résultats à des parties prenantes, il convient de considérer l’analyse descriptive comme un moyen de simplement rendre compte de ce qui se passe, et rien de plus. Les métriques les plus pertinentes renseignées par ces systèmes sont principalement connues sous le nom de KPI, ou indicateurs clés de performance.

Le fait d’identifier la nature d’événements peut s’avérer extrêmement important dans certains secteurs d’un marché, et cela suffit parfois à justifier le besoin d’enquêter de manière plus approfondie sur un problème. Je vais vous donner un exemple de la façon dont l’analyse descriptive des données peut s’avérer utile afin d’identifier des KPI adéquats pour permettre aux parties prenantes de prendre des décisions fondées sur les données en vue de résoudre des problèmes potentiels.

Imaginez un site Web de commerce digital où vous recueillez des métriques relatives au temps nécessaire pour traiter un paiement. Sur ce site Web, vous utilisez une passerelle de paiement externe pour finaliser les achats. Ainsi, chaque fois qu’un client achète un article sur votre site Web, il est redirigé vers cette passerelle de paiement, et vous obtenez la confirmation que le client a payé quand il l’a fait. Un ensemble pertinent de KPI permettant d’effectuer une analyse descriptive efficace dans cette situation pourrait être constitué de métriques relatives au temps nécessaire pour finaliser la transaction, au nombre de transactions réalisées et au nombre de transactions annulées.

Maintenant, si vous observez à la fois un pic au niveau du nombre de transactions annulées et du temps nécessaire pour finaliser les transactions, cela peut constituer un bon indicateur du fait que ces transactions sont annulées parce qu’elles prennent trop de temps à s’exécuter. Cela peut indiquer que ces KPI sont peut-être liés les uns aux autres, ce qui pourrait aider les administrateurs système et les dirigeants de l’entreprise à commencer à se pencher sur la résolution d’un problème potentiel qui peut avoir un impact sur les ventes.

Le même concept s’applique au temps nécessaire pour finaliser les transactions. Si vous disposez d’un processus qui analyse en profondeur cette métrique en décomposant chaque étape du traitement des transactions, vous disposerez d’informations encore plus précises pour repérer l’endroit exact où résoudre le problème. Il est tout sauf souhaitable de découvrir des dysfonctionnements de votre système par le biais de fils de réseaux sociaux ou de commentaires clients. Il est ici essentiel d’exercer une surveillance et nous utilisons un ensemble très simple de métriques pour détecter et commencer à résoudre un problème lié à l’activité commerciale.

En bref, l’analyse descriptive de données est une pratique qui vous informe de ce qui se passe. Vous pouvez aussi procéder à des analyses descriptives de données relatives à l’activité d’utilisateurs, à des fils de réseaux sociaux, à l’Internet des objets ou à des journaux de sécurité de systèmes. Comme je l’ai dit, les cas d’utilisation peuvent varier énormément, mais une chose est sûre : une fois que vous savez comment effectuer des analyses descriptives de données, vous pouvez, et devez, appliquer ces mêmes compétences pour travailler avec des ensembles de données variés.

Très bien. Nous avons maintenant des bases solides en ce qui concerne l’analyse descriptive de données. Qu’en est-il des trois autres types d’analyses ?

Rappelez-vous de notre exemple avec la matrice concernant le temps de traitement des transactions et le nombre de transactions ayant échoué. Dans cette situation précise, c’est vous qui aviez eu l’intuition et l’idée de corréler ces deux métriques afin d’identifier le problème. Ce n’est pas le système qui les a associées pour vous donner une métrique consolidée ou projetée qui aurait pu s’appeler Probabilité d’un problème avec la passerelle de paiement. Il est aujourd’hui très commun de trouver des centaines, voire des milliers, de ces métriques dans les systèmes. C’est là que l’analyse diagnostique vous aide en communiquant bien plus que des informations. Elle effectue des diagnostics en analysant davantage ces KPI et en les corrélant afin de vous présenter des suggestions sur la source potentielle du problème. J’aime parler de l’analyse diagnostique comme d’un ensemble d’actions qu’un système peut entreprendre pour aider les parties prenantes à comprendre pourquoi un événement s’est produit. Le mot à retenir ici est « pourquoi ».

Notre troisième type d’analyse de données est l’analyse prédictive. L’analyse prédictive des données implique plus de complexité, car, comme son nom l’indique, elle prédit ce qui est susceptible d’arriver dans le futur en fonction de données passées, ou d’après un croisement de données impliquant plusieurs ensembles et sources de données. En bref, elle essaie en quelque sorte de prédire l’avenir en fonction des actions du passé. L’utilisation de réseaux neuronaux, de régressions et d’arbres de décision est très fréquente dans les analyses diagnostiques, et nous nous y intéresserons dans un autre cours.

Enfin, dernier type d’analyse mais non le moindre, l’analyse prescriptive, qui constitue essentiellement une synthèse de tous les types d’analyses précédents. L’analyse prescriptive peut prendre les devants et suggérer aux parties prenantes quelles décisions fondées sur des données sont les plus nécessaires à prendre en fonction des événements et résultats passés. L’analyse prescriptive s’appuie fortement sur des stratégies d’apprentissage automatique pour identifier des tendances problématiques et les solutions correspondantes en analysant et en croisant de grands ensembles de données.

Quel que soit le type d’analyse que vous décidiez d’apprendre à maîtriser et à appliquer, l’analyse des données est une discipline mêlant l’utilisation des technologies de l’information, l’emploi de méthodes statistiques et le recours à des connaissances spécialisées, par exemple au sujet de réseaux sociaux, d’entreprises ou de segments d’activité. Dans ce cours, nous allons nous concentrer sur la manière d’utiliser les services AWS pour effectuer une analyse descriptive de la situation d’un compte AWS en utilisant des journaux de sécurité.

Maintenant que vous connaissez les différents types d’analyses de données, poursuivons notre parcours en étudiant d’autres exemples de situations concrètes où les analyses de données sont employées dans votre vie quotidienne.

Avez-vous regardé la vidéo ?

N’oubliez pas que le questionnaire comporte des questions sur la vidéo de cette unité. Si vous ne l’avez pas encore regardée, revenez en arrière et faites-le maintenant. Ensuite, vous serez prêt à répondre au questionnaire.

Formez-vous gratuitement !
Créez un compte pour continuer.
Qu’est-ce que vous y gagnez ?
  • Obtenez des recommandations personnalisées pour vos objectifs de carrière
  • Mettez en pratique vos compétences grâce à des défis pratiques et à des questionnaires
  • Suivez et partagez vos progrès avec des employeurs
  • Découvrez des opportunités de mentorat et de carrière