Vérifier les axes
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Décrire comment les axes, les échelles et les intervalles sont utilisés dans les graphiques
- Identifier les axes appropriés pour des types de graphiques spécifiques
- Reconnaître les exemples courants de mauvaise utilisation des axes
Définition des axes
Les axes constituent la structure d’affichage des données dans un graphique. Ils fournissent des échelles qui associent des valeurs et des annotations aux points de données présentés dans un graphique.
De nombreux graphiques ont deux axes.
- L’axe horizontal, communément appelé axe des abscisses (x).
- L’axe vertical, communément appelé axe des ordonnées (y).
Les échelles qualitatives et quantitatives
En ce qui concerne les axes dans les graphiques, il existe deux types d’échelles.
- L’échelle qualitative, qui associe des annotations représentant des catégories : alimentation, logement, habillement, etc.
- L’échelle quantitative, qui associe des valeurs représentant des variables numériques : 0, 5, 10, etc.
Pour en savoir plus sur les variables et les échelles, consultez le module Types de variables et de champs.
Maintenant que vous savez ce que sont les axes, jetez un œil aux différents types de graphiques permettant de présenter des données de manière visuelle.
Types de graphiques pour présenter des variables qualitatives | |
---|---|
Le graphique à barres utilise la hauteur (ou la longueur) pour comparer les valeurs entre des catégories ou des sous-catégories. |
|
Le graphique à secteurs représente les données sous forme de pourcentage d’un ensemble pour comparer des catégories. |
|
Types de graphiques pour présenter des variables quantitatives | |
---|---|
Le nuage de points montre le rapport entre deux variables quantitatives. Les données sont présentées sous forme de coordonnées cartésiennes, qui combinent leur position sur l’axe des abscisses et sur celui des ordonnées. |
|
Le graphique en courbes relie une série de valeurs quantitatives et est souvent utilisé pour afficher une série chronologique (quand l’axe des abscisses correspond au temps). Plus rarement appelé graphique linéaire. |
|
L’histogramme représente une distribution de données et la fréquence des valeurs dans un ensemble de données sous forme de colonnes adjacentes. La hauteur des colonnes dépend des valeurs sur l’axe des abscisses. Les statisticiens, les scientifiques et les analystes parlent de classes pour désigner les colonnes. |
|
La boîte à moustaches montre la distribution de données à l’aide de centiles. Aussi connue sous le nom de diagramme en boîte. |
Familiarisation avec les intervalles
L’intervalle est la distance entre les valeurs (graduations) sur un axe quantitatif. Sur un axe quantitatif, il doit toujours y avoir une distance égale entre chacune des graduations, autrement dit, des intervalles égaux. Par exemple, si un graphique affiche les temps de trajet des employés, un intervalle constant de 10 minutes semble approprié. Des intervalles inégaux (tels que 15 minutes, puis 40 minutes ou 60 minutes) peuvent entraîner des interprétations erronées et des conclusions incorrectes.
Prenons un exemple : une augmentation impressionnante de la récolte de tomates de Sue ?
Dans le graphique précédent, vous pouvez voir que Sue a récolté nettement plus de livres de tomates en 2022 par rapport à 2010. Cependant, avez-vous remarqué que les années 2016 à 2018 étaient absentes de l’axe des abscisses ? Maintenant, regardez le graphique avec ces années incluses sur l’axe.
Quand les intervalles sont constants sur l’axe des abscisses, il est plus facile de voir que la récolte de tomates de Sue a augmenté progressivement au fil du temps.
En plus de s’assurer de la régularité des intervalles, il est important de prêter attention aux points de données manquants, ou nuls. Savez-vous ce qui s’est passé entre 2016 et 2018 ? Peut-être que Sue a eu une année difficile pendant cette période.
Utilisation inappropriée d’axes qualitatifs dans des graphiques de données quantitatives
Faites attention aux nuages de points, courbes et histogrammes avec des axes qualitatifs. Par exemple, consultez le graphique suivant à propos du nombre d’emprunteurs dans des secteurs particuliers.
Pour ce type de données, vous avez besoin d’un graphique à barres ! Un graphique en courbes permet d’afficher des valeurs séquentielles telles que des dates ou des heures. De plus, il doit toujours utiliser un axe des abscisses avec des intervalles égaux et des variables quantitatives. Dans l’exemple ci-dessus, il n’est pas logique de mettre les catégories de secteur dans un ordre séquentiel. Un graphique à barres serait un bien meilleur choix, tant que son axe des ordonnées respecte certains principes importants.
Valeur plancher des graphiques à barres
Il est important que les valeurs quantitatives des graphiques à barres commencent à zéro, ce qui signifie que le bas de la colonne correspond à la quantité zéro. Pour mieux illustrer ceci, examinez les graphiques suivants concernant les chiffres des ventes régionales.
Dans le graphique de droite, vous êtes amené à croire qu’il existe une différence significative entre les deux régions sur l’axe des abscisses. Le deuxième graphique est trompeur, car l’axe des ordonnées commence à 380 000 $ au lieu de zéro. Lorsque vous interprétez des graphiques à barres, vous comparez la hauteur des colonnes. Si les valeurs de l’axe commencent à 380 000 $, notre œil perçoit une différence colossale. Dans le premier graphique, la seule différence est que l’axe des ordonnées commence à zéro.
Maintenant, vous pouvez voir comment la différence (pas si grande que ça !) a été exagérée dans le deuxième graphique. Lorsque vous visualisez des graphiques à barres, vérifiez donc toujours que les valeurs quantitatives commencent à zéro.
Valeur plancher des graphiques en courbe
Pour les graphiques en courbe, cependant, cette règle de zéro comme valeur plancher ne s’applique pas. En fait, il vaut parfois mieux que l’axe des ordonnées d’un graphique en courbes ne commence pas à zéro ! Jetez un œil aux deux courbes suivantes présentant la température mondiale au fil du temps (source de données : Graphing Global Temperature Trends).
Le deuxième graphique, dont l’axe des ordonnées ne commence pas à zéro, vous donne un meilleur aperçu des tendances en matière de température mondiale au fil du temps. Dans ce graphique, vous pouvez voir plus de détails qui n’étaient pas évidents auparavant, tels que les changements d’une année à l’autre.
Débat sur les axes multiples
Il y a beaucoup de débats dans le monde de la visualisation de données sur l’utilité de deux axes des ordonnées dans un même graphique. Bien que les axes doubles soient utiles lorsqu’ils sont utilisés correctement, ils peuvent également être trompeurs et mal utilisés.
Avantages des axes multiples
Il existe des cas d’utilisation légitime de plusieurs axes des ordonnées. Par exemple, il peut être efficace d’afficher le même ensemble de points de données sur deux échelles différentes à l’aide de deux axes des ordonnées, comme c’est le cas lors de l’affichage des mêmes données avec deux unités de mesure différentes (telles que les pouces et les centimètres ou les kilogrammes et les livres). Dans le graphique suivant, la température est indiquée en degrés Fahrenheit sur un axe y et en degrés Celsius sur l’autre.
Inconvénients des axes multiples
Malheureusement, dans d’autres cas, le fait d’avoir plusieurs axes est trompeur, que cela soit intentionnel ou non. Sur son blog Datawrapper, Lisa Charlotte Muth, écrivaine et pédagogue respectée dans le domaine de la visualisation de données, partage ce graphique trompeur montrant deux séries différentes de points de données à l’aide de deux axes y.
Regardez attentivement les échelles de ce graphique. Les deux échelles des axes y sont différentes et vous amènent à croire à tort que le PIB de l’Allemagne était au même niveau que le PIB mondial en 2011. En réalité, il y avait une différence significative entre ces chiffres de plus de 66 000 milliards de dollars.
N’oubliez pas de toujours vérifier les axes lorsque vous lisez des graphiques pour vous assurer que les données sont présentées de manière sensée !
Ressources
- Trailhead : Types de variables et de champs
- Site Tableau : Tronquer l’axe des ordonnées : quels sont les risques ?
- Ouvrage : Steve Wexler (2021) : Vue d’ensemble : How to Use Data Visualization to Make Better Decisions–Faster, McGraw-Hill Companies
- Ouvrage : Alberto Cairo (2020) : How Charts Lie: Getting Smarter about Visual Information, W.W. Norton & Company
- Publication sur le blog : Pourquoi ne pas utiliser deux axes et quelles sont les alternatives ?