Établissement de séries temporelles, de classements, de comparaisons nominales et du rapport entre les parties et l’ensemble
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Décrire les séries temporelles, le classement, les comparaisons nominales et le rapport entre les parties et l’ensemble
- Comprendre les meilleurs types de graphiques et les meilleures pratiques à utiliser pour effectuer ces comparaisons
Comparaisons nominales
Le terme « nominal » vient du mot latin nominalis qui signifie « nom ». Lorsque vous faites des comparaisons nominales, vous comparez des catégories. Les attributs qui fonctionnent bien avec les comparaisons nominales sont la position 2D, la teinte et la forme.
Graphiques à barres
Dans l’unité précédente, vous avez appris que la longueur des graphiques à barres permet de distinguer les valeurs quantitatives. Lorsque vous comparez des catégories à l’aide d’un graphique à barres, vous utilisez l’attribut de la position 2D et de la longueur de la barre pour comparer les catégories. L’espace distinct entre les barres individuelles et l’ordre des barres permettent de comparer les valeurs quantitatives représentées par la longueur des barres des différentes catégories. Le classement ou l’ordonnancement des variables ordinales permet de mettre en évidence des schémas importants dans les données.
Codage de catégories
Lorsque vous comparez des catégories, vous pouvez utiliser les attributs de couleur (ou de teinte) et de forme pour les distinguer.
Dans la première image ci-dessus, un graphique en courbes de séries temporelles, la couleur est utilisée pour distinguer les villes entre elles. Dans la deuxième image, le nuage de points, les formes permettent de distinguer les catégories de produits.
Séries temporelles
Les graphiques de séries temporelles comparent des valeurs quantitatives par intervalles de temps. Les graphiques en courbes permettent d’observer des schémas et des tendances dans le temps.
Graphiques en courbes
Les graphiques en courbes sont les plus couramment utilisés pour représenter une série temporelle et constituent l’un des meilleurs moyens d’observer les schémas et les tendances au fil du temps. Par exemple, ce graphique en courbes vous permet de facilement suivre les bénéfices au fil du temps.
En plus d’un graphique en courbes qui relie chaque point de données dans le graphique, vous pouvez ajouter une ligne de tendance à votre graphique de séries temporelles. La ligne de tendance peut vous aider à identifier la tendance générale et la direction de votre mesure pour orienter vos décisions. Ci-dessous, la ligne de tendance du graphique en courbes montre une tendance à l’augmentation des bénéfices au fil du temps.
Graphiques à barres verticales
Les barres verticales sont utiles pour comparer des séries temporelles lorsqu’il est important de mettre en évidence des valeurs individuelles plutôt que la tendance générale. Dans le graphique à barres verticales suivant, c’est la valeur inférieure du deuxième trimestre qui est le point central du graphique plutôt que la tendance générale.
Boîtes à moustaches
Les boîtes à moustaches affichent une distribution en montrant la médiane (ligne au milieu de la boîte), les 25e et 75e centiles (extrémités des boîtes) et les points de données individuels. Vous pouvez utiliser plusieurs boîtes à moustaches pour comparer les distributions dans le temps.
Classement
Les graphiques montrant des comparaisons de classement classent les valeurs (par ordre décroissant ou croissant) des différentes catégories. Il existe de nombreux moyens de présenter les comparaisons de classement.
Graphiques à barres
Le graphique le plus couramment utilisé pour les comparaisons de classement est le graphique à barres. Les graphiques à barres soulignent le caractère distinctif des valeurs. Le tri des barres par ordre croissant ou décroissant permet de classer les valeurs. Dans l’exemple suivant, vous pouvez voir que la sous-catégorie des chaises a la valeur la plus élevée et que la différence entre les tables et les classeurs est faible, les tables étant classées au-dessus des classeurs.
Autres graphiques permettant de comparer les classements
Pour être interprétée correctement, la valeur de référence d’un graphique à barres doit toujours être égale à zéro. Dans les cas où il n’est pas possible d’avoir une valeur de référence nulle, vous pouvez utiliser des graphiques sous forme de regroupements de points. Au lieu d’une barre, le point de terminaison est remplacé par un point. Lorsque vous présentez des valeurs associées, les points peuvent être reliés pour mettre en évidence la différence entre ces valeurs.
Dans cette publication de blog, Lisa Charlotte Muth décrit comment un graphique sous forme de regroupements de points peut montrer le classement des pays en fonction de l’âge médian. Les graphiques sous forme de regroupements de points ne nécessitent pas que l’axe commence à zéro.
Lorsque les classements évoluent dans le temps, un graphique à bosses affiche les classements en permettant aux lignes de chaque catégorie de suivre l’évolution. Dans le graphique à bosses de Matt Chambers de Tableau Public présenté ici, la catégorie « autres couleurs » commence à la troisième place en 2000 et change de classement au fil du temps jusqu’à atteindre la dixième place de 2005 à 2015.
Rapport entre une partie et l’ensemble
Dans les tableaux de comparaison entre les parties et l’ensemble, les valeurs sont représentées en tant que proportion du total, souvent sous forme de pourcentages.
Graphiques à barres empilées
Le graphique le plus courant pour représenter le rapport entre les parties et l’ensemble est le graphique à barres. Les graphiques à barres empilées divisent chaque barre en y intégrant ses éléments constitutifs. Les parties peuvent être représentées sous forme de pourcentages, de décomptes ou de mesures spécifiques. Les exemples suivants présentent trois graphiques à barres empilées montrant les ventes par mode d’expédition et comparant les segments.
L’axe y du premier graphique représente les ventes. L’axe y du deuxième graphique indique le pourcentage du total général. L’axe y du troisième graphique indique le pourcentage de chaque segment. Les étiquettes individuelles permettent au lecteur de voir les valeurs de vente représentées par les pourcentages, ce qui donne plus de contexte. Lorsque l’on présente des pourcentages, il est important de préciser les décomptes ou les mesures que les pourcentages représentent.
Graphiques à secteurs
Dès lors que vous vous penchez sur la visualisation de données, vous êtes confronté au « grand débat sur les graphiques à secteurs ». Dans la deuxième unité, vous avez appris que l’attribut de longueur permet de percevoir beaucoup plus facilement les différences de valeurs que les différences de tailles. Lors de l’utilisation de l’attribut de taille dans un graphique à secteurs, il peut être difficile de voir les petites différences de tailles. Dans l’exemple suivant, il est difficile de distinguer les petites tranches dans le graphique à secteurs, mais il est très facile de distinguer les petites différences de tailles dans le graphique à barres.
Parfois, un graphique à secteurs constitue le meilleur choix. Lorsqu’il y a très peu de tranches et qu’il n’est pas nécessaire de distinguer de petites différences, un graphique à secteurs peut être efficace. Si vous présentez une catégorie qui constitue exactement la moitié (50 %) de l’ensemble, un graphique à secteurs est plus facile à lire.
Graphique en aires
Le graphique en aires vous permet de répondre à des questions sur l’évolution dans le temps et sur le rapport entre les parties et l’ensemble. Lors de l’affichage de l’évolution du rapport entre les parties et l’ensemble dans le temps, la couleur et la taille de l’aire sont utilisées pour présenter ce rapport avec un graphique en courbes de série temporelle. Dans l’exemple suivant, vous pouvez voir que le mode d’expédition en classe standard était le plus courant pour tous les mois de l’année.
Cartes d’arborescences
Pour les grands jeux de données hiérarchiques, les cartes d’arborescences peuvent montrer des catégories imbriquées dans un seul graphique. L’exemple suivant montre la proportion des ventes par sous-catégories par rapport à l’ensemble des ventes pour chaque mode d’expédition. Étant donné que les cartes d’arborescences utilisent l’attribut de taille pour montrer les différences, il peut s’avérer difficile de faire des comparaisons. Lorsqu’il est important de comparer des sous-catégories individuelles, une alternative possible est d’employer des petits graphiques à barres multiples. Pour en savoir plus, consultez l’article de blog Utilisation de cartes d’arborescences dans la visualisation de données.
Ressources
- Blog Tableau : Boîtes à moustaches
- Blog Storytelling with Data : Qu’est-ce qu’un graphique sous forme de regroupements de points ?
- Trailhead : Lignes directrices pour reconnaître les graphiques trompeurs
- Tableau : Liste de contrôle pour repérer les graphiques trompeurs
- Tableau : Graphiques à secteurs
- Tableau : Dialogues de données : graphique à secteurs, ami ou ennemi ?
- Trailhead : Distributions des données
- Article du blog Datawrapper : Je suis entourée de personnes âgées
- Tableau Public : Popularité des couleurs pour les voitures neuves en Amérique du Nord entre 2000 et 2015
- Blog Data Plus Science : Utilisation de cartes d’arborescences pour la visualisation des données