Skip to main content

Compréhension des cas d’utilisation courants des analyses de données

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

  • Expliquer pourquoi les analyses de données sont pertinentes pour les entreprises modernes
  • Expliquer comment les outils d’analyse de données sont utilisés dans des scénarios courants

Utilisation des analyses de données dans un monde complexe

Quel est le point commun entre les jeux vidéo, le commerce et les réseaux sociaux ? Ces segments d’activité génèrent chacun de nombreuses données que les organisations utilisent pour améliorer leurs services, ainsi que pour détecter et résoudre des problèmes. Dans la vidéo suivante, Raf explore les segments d’activité et les cas d’utilisation courants dans lesquels l’analyse des données est présente au quotidien. 

Est-il ici question de 100 lignes de données ? De 1 000 d’entre elles ? Sachez que dans certains cas, il peut y en avoir des centaines de milliers, voire des millions ! Comment faire pour travailler avec une telle quantité de données ?

Le questionnaire à la fin de cette unité contient des questions se rapportant au contenu de cette vidéo. Veillez bien à la regarder afin d’obtenir les informations nécessaires pour répondre aux questions posées à la fin de cette unité.

Afficher la transcription

[Raf] Maintenant que vous connaissez la différence entre les différents types d’analyses de données, laissez-moi vous présenter quelques situations où les analyses de données jouent très probablement actuellement un rôle dans votre quotidien, à la fois en tant que consommateur et peut-être en tant que professionnel. Les analyses de données sont largement présentes dans de nombreux domaines aujourd’hui, tels que les jeux vidéo, les fils de réseaux sociaux, le commerce digital et les boutiques en ligne, les statistiques relatives aux sites Web (aussi appelées analyses de parcours de navigation), les moteurs de recommandation, l’Internet des objets ou IoT, le traitement des journaux, et beaucoup d’autres.

Je vais vous présenter quelques exemples où les analyses de données sont très utiles dans certains de ces scénarios, afin que vous compreniez le but précis des analyses de données dans ces contextes. Disons que vous aimez jouer à des jeux vidéo, comme moi. Tout le monde aime ça, n’est-ce pas ?

Donc, si vous aimez jouer à des jeux, que ce soit sur votre téléphone, votre ordinateur, ou une console de jeu, vous connaissez peut-être la case que vous devez parfois cocher avant de commencer à jouer. Cette invite comporte souvent une mention telle qu’Envoyer des données statistiques anonymes aux développeurs du jeu afin d’améliorer l’expérience de jeu, ou autres. Cela permet essentiellement de recueillir des informations concernant la façon dont vous jouez au jeu afin de détecter des défaillances potentielles, des défauts de conception et d’autres éléments. Dans ce cas précis, il est clair que des données réelles, telles que votre façon de jouer au jeu, sont transformées en informations qui aident les développeurs à résoudre des problèmes potentiels et à améliorer l’expérience de jeu. C’est là la raison d’être des analyses de données et pourquoi elles sont si pertinentes dans le monde moderne.

Vous vous demandez pourquoi il en est ainsi de nos jours ? Je joue à des jeux depuis l’enfance, et ça ne se passait alors pas comme ça. Les jeux étaient vendus sur des cartouches. Nous nous contentions de les acheter et d’y jouer, n’est-ce pas ? Eh bien, la réponse est oui. Cependant, si vous y réfléchissez avec moi, ces jeux n’étaient pas aussi complexes que ceux que nous avons aujourd’hui. C’est sur cet aspect que je veux conclure.

Les analyses aident les professionnels à acquérir des informations, qui les aident ensuite à résoudre des problèmes complexes. Peu importe s’il s’agit de jeux, de marchés boursiers, de données immobilières, d’informations routières, de systèmes informatiques en vogue, de serveurs Web ou de journaux de sécurité, les analyses de données permettent de fournir des réponses à des problématiques complexes.

Les coûts de stockage diminuant de jour en jour, les entreprises collectent souvent des données dont elles n’ont pas forcément actuellement l’utilité. Cependant, si une question se pose demain, la réponse peut se trouver dans les données qu’elles avaient auparavant collectées.

Le monde d’aujourd’hui devient plus complexe qu’il ne l’était il y a 10 ans. Ainsi, bénéficier de l’aide de systèmes informatiques est essentiel pour deux raisons principales : l’évolutivité et la prise de décision fondée sur les données. Une autre composante importante de l’analyse de données est l’analyse de journaux. Je vais approfondir un peu plus cet aspect, car il s’agit de la thématique sur laquelle je me concentrerai principalement durant ce cours, notamment en ce qui concerne les journaux de sécurité.

Quand nous parlons d’analyse de journaux, nous faisons généralement référence aux informations produites par les systèmes informatiques d’après des événements. Ces événements peuvent être l’envoi d’une requête HTTP à une page Web, la saisie d’informations, l’exécution d’un appel d’API, ou la réalisation de tout autre type de requêtes. Le terme API désigne une interface de programmation d’applications. Il s’agit essentiellement d’une interface informatique qui définit les interactions entre plusieurs intermédiaires logiciels.

Elle définit les types d’appels ou de requêtes pouvant être effectués, la manière de les exécuter, les formats de données à utiliser, les conventions à suivre, etc. Du point de vue des analyses de données, il est très courant d’enregistrer toutes ces activités à un endroit précis.

Un exemple classique d’analyse de données consiste à exploiter les journaux d’un serveur Web pour en extraire des informations concernant les visiteurs d’un site Web. Imaginons que chaque requête envoyée à un serveur HTTP est consignée dans les fichiers d’un système de fichiers. Ceux-ci sont généralement appelés journaux d’accès. Si une nouvelle ligne est ajoutée au journal d’accès pour chaque visite sur votre site Web, vous pouvez dire que le nombre de lignes dans ce journal est équivalent au nombre de requêtes qui ont été exécutées par le serveur Web.

Si vous n’avez qu’un seul serveur et un site Web modeste n’enregistrant que quelques visites par minute, vous pouvez utiliser certains outils élémentaires, comme des éditeurs de texte, pour analyser ces fichiers et en extraire les informations que vous recherchez. Toutefois, si vous souhaitez faire quelque chose d’un peu plus utile que simplement résumer des lignes d’un fichier journal, il est essentiel d’utiliser un outil d’analyse de données.

Nous encourageons l’utilisation des outils d’analyse de données dans toutes les situations, mais il doit s’agir d’outils professionnels capables de gérer de grands volumes lorsque nous agrégeons ou visualisons des journaux. Imaginez que vous disposez de dizaines de serveurs Web enregistrant la visite de milliers d’utilisateurs par seconde. Vous pouvez estimer que chaque fichier journal de chaque serveur sera rempli assez rapidement. Vous devez donc faire en sorte que toutes ces données soient regroupées quelque part.

De plus, vous aurez peut-être besoin d’un moyen de visualiser ces données dans un graphique en courbes, ce qui pourrait facilement vous aider à identifier des pics, également appelés écarts ou valeurs aberrantes. L’analyse de données est aussi aujourd’hui très employée pour la sécurité des données. Si vous disposez de systèmes qui produisent des journaux de sécurité auxquels vous pouvez accéder rapidement afin d’en extraire des analyses, vous disposez d’un avantage évident si vous avez besoin de déterminer précisément quand une requête a été effectuée, par qui, à quel moment, depuis quel endroit, et de quelle manière le système y a répondu.

Si vous vous mettez à réaliser des analyses prédictives en vous appuyant sur ces données, vous pourriez même parvenir à bloquer automatiquement les requêtes nuisibles avant qu’elles n’atteignent vos systèmes informatiques. Vous pourriez également créer une architecture d’auto-réparation qui commence à construire un environnement de basculement lorsque l’environnement actuel présente des dégradations.

Vous pouvez mettre cela en place en ayant recours à des outils Cloud d’automatisation des infrastructures. Il existe un service AWS appelé AWS CloudTrail, qui enregistre l’activité en matière d’API concernant un compte AWS, et un autre service AWS appelé Amazon S3, qui est un service de stockage. Parlons d’eux brièvement.

Voici ce que CloudTrail stocke à chaque fois que vous ou une autre personne se connecte à votre compte AWS en utilisant AWS Management Console. Cet ensemble de données est stocké dans Amazon S3, et contient des informations telles que l’identité de l’émetteur de la requête, l’adresse IP à partir de laquelle elle a été émise, la nature de celle-ci, quelle réponse lui a été formulée, et d’autres informations de conformité utiles qui peuvent rapidement être transposées en preuves, si nécessaire. En raison de la manière dont il est conçu, CloudTrail est un service permettant la réalisation d’opérations de gouvernance des infrastructures, d’audit opérationnel et d’audit des risques pour votre compte AWS.

Toutefois, vous pourriez avoir du mal à mettre cela en œuvre si vous devez extraire systématiquement des informations des données texte de CloudTrail. La connaissance des analyses de données aide donc beaucoup à exploiter toutes les possibilités offertes par ces données relatives à la conformité. Si vous employez des outils de visualisation de données s’appuyant sur les informations produites par CloudTrail, vous pouvez disposer de tableaux de bord de sécurité présentant des graphiques et des alertes d’activités inhabituelles. Si vous commencez soudainement à voir apparaître des journaux d’activités d’échec de connexion, cela signifie peut-être qu’une personne essaie de se connecter à votre compte AWS, ou bien que vous avez modifié son mot de passe et l’avez oublié.

J’ai l’habitude de dire que l’analyse de la sécurité des données n’est pas seulement pratique pour l’établissement de rapports de conformité, mais aussi très utile pour le dépannage. Si vous appliquez ce concept aux paquets de pare-feu, à l’activité réseau, à l’équilibrage de charge, aux journaux de serveur, et à d’autres aspects liés aux infrastructures, vous pouvez facilement identifier les aberrations et devenir un spécialiste de la résolution rapide de problèmes. Cependant, n’oubliez pas les autres domaines dans lesquels vous pourriez utiliser les analyses de données et en quoi elles peuvent vous aider à obtenir des informations plus précises sur une situation particulière, peu importe qu’il s’agisse de sécurité, de l’amélioration de produits, de l’élaboration de meilleures expériences d’achat ou de tout autre aspect sur lequel peuvent porter de telles analyses.

Puisque tout est possible, dans la prochaine vidéo, je vous expliquerai pourquoi réaliser toutes ces actions dans le Cloud présente de sérieux avantages et en quoi cela contribue à permettre à chacun d’effectuer des analyses de données partout et à tout moment.

Avez-vous regardé la vidéo ?

N’oubliez pas que le questionnaire comporte des questions sur la vidéo de cette unité. Si vous ne l’avez pas encore regardée, revenez en arrière et faites-le maintenant. Ensuite, vous serez prêt à répondre au questionnaire.

Formez-vous gratuitement !
Créez un compte pour continuer.
Qu’est-ce que vous y gagnez ?
  • Obtenez des recommandations personnalisées pour vos objectifs de carrière
  • Mettez en pratique vos compétences grâce à des défis pratiques et à des questionnaires
  • Suivez et partagez vos progrès avec des employeurs
  • Découvrez des opportunités de mentorat et de carrière