Examen de variables dans des visualisations
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Décrire les différentes utilisations des variables quantitatives et qualitatives dans une visualisation
- Utiliser des variables dans une visualisation
Dans l’unité précédente, vous avez appris que les variables peuvent être qualitatives ou quantitatives et qu’elles sont organisées sous forme de champs ou de colonnes dans des jeux de données. Toutefois, comment ces variables sont-elles utilisées lors de la visualisation des données ?
Les variables quantitatives et qualitatives sont utilisées différemment dans les visualisations.
- Les variables quantitatives sont des éléments de données que vous pouvez calculer. Elles peuvent également être agrégées (la somme et la moyenne sont deux exemples d’agrégation). Par exemple, dans une visualisation qui présente le chiffre d’affaires dans une région, le chiffre d’affaires une variable quantitative.
- Les variables qualitatives définissent le niveau de détail de la visualisation. Vous pouvez les utiliser non seulement pour catégoriser et segmenter vos données, mais aussi pour en faire ressortir les détails. Par exemple, dans une visualisation qui présente les ventes dans différentes régions, la région est une variable qualitative.
Présentation des visualisations
Pour illustrer les différences entre l’utilisation d’une seule variable quantitative (champ) et l’utilisation d’une variable quantitative associée à une variable qualitative (champ), examinons des visualisations représentant la somme totale des bénéfices rapportés par divers produits d’une entreprise.
La visualisation de gauche ne comprend qu’une variable quantitative, la somme (ou le total) des bénéfices d’une entreprise. Vous pouvez voir que l’entreprise a généré un total de plus de 1,4 million de dollars de bénéfices. La visualisation de droite comprend une variable qualitative (Catégorie), de sorte que vous pouvez voir les bénéfices totaux répartis selon les trois catégories de produits : mobilier, fournitures de bureau et outils technologiques.
Exemple : utilisation de variables dans une visualisation
Maintenant que vous avez appris comment fonctionnaient les visualisations, voyons comment il est possible d’obtenir des informations plus poussées à partir de ces dernières grâce aux variables qualitatives et qualitatives. Nous utilisons un ensemble de données contenant des informations à propos d’une entreprise fictive. Nous allons explorer les variables dans les données, puis analyser plusieurs visualisations utilisant des variables quantitatives et qualitatives.
- Examen des variables
Examinons quelques-unes des variables.
Catégorie, Priorité de commande, Mode d’expédition et Sous-catégorie sont des variables qualitatives. Bénéfices, Chiffre d’affaires et Frais de port sont des variables quantitatives.
- Observation approfondie des variables qualitatives
Observez les valeurs au niveau des lignes dans les variables qualitatives.
Catégorie et Sous-catégorie contiennent des noms de valeurs qui n’impliquent aucun rang ou ordre de classement. Il s’agit là de variables nominales.
Priorité de commande et Mode d’expédition contiennent des valeurs impliquant un ordre logique ou un classement. Il s’agit de variables ordinales. Cette distinction s’avérera importante lorsque nous analyserons des visualisations.
- Examen de la visualisation avant l’ajout de variables qualitatives
Nous allons commencer avec une visualisation contenant une seule variable quantitative et présentant les frais de port moyens.
- Examen de visualisations auxquelles des variables nominales ont été ajoutées
Les variables qualitatives ajoutent des détails aux visualisations.
Commençons par nous intéresser aux variables nominales. Avec l’ajout de la dimension Catégorie, les frais de port moyens sont maintenant segmentés par catégorie de produits. Nous pouvons voir que la catégorie de produits Outils technologiques affiche les frais de port moyens les plus élevés.
La visualisation de droite va plus loin avec l’ajout de la variable nominale Sous-catégorie. Vous pouvez maintenant observer que, même si la catégorie de produits Outils technologiques affiche les frais de port moyens les plus élevés, c’est la sous-catégorie de produits Tables qui présente les frais de port moyens les plus élevés.
- Examen d’une visualisation à laquelle une variable ordinale a été ajoutée
Voyons maintenant ce qui se passe dans une autre visualisation, qui utilise une variable ordinale pour analyser les frais de port moyens d’après le critère Priorité de commande.
Que remarquez-vous ? Étonnamment, les commandes de priorité faible ont des frais de port moyens plus élevés que les commandes de priorité intermédiaire.
- Examen d’une visualisation à laquelle une deuxième variable ordinale a été ajoutée
En ajoutant une deuxième variable ordinale, nous pouvons analyser les frais de port moyens en fonction des critères Priorité de commande et Mode d’expédition.
Que remarquez-vous ? Étonnamment, pour les commandes ayant une priorité intermédiaire, les commandes expédiées en livraison prioritaire affichent des frais de port moyens plus élevés que les commandes expédiées le jour même.
Dans ce module, vous avez découvert les différents modes de classification des variables, qui peuvent être quantitatives, qualitatives, discrètes et continues. Vous avez également examiné plusieurs visualisations comportant une variable quantitative et des variables qualitatives nominales et ordinales. Vous savez maintenant comment utiliser des variables dans une visualisation.