查看轴
学习目标
完成本单元后,您将能够:
- 介绍图表中是怎样使用轴、比例尺和间隔的
- 识别特定图表类型的相应轴。
- 辨别常见的轴滥用形式。
什么是轴?
轴(英文 Axes,单数形式 Axis)建立了图表中数据的显示结构。轴提供了比例尺,而比例尺可以分配图表中显示的数据点的值和标签。
很多图表都有两个轴。
- 水平轴,通常叫作 X 轴
- 垂直轴,通常叫作 Y 轴
了解定性和定量比例尺
图表中的轴有两种类型的比例尺。
- 定性比例尺,分配类别标签,如食品、住房和服装
- 定量比例尺,分配数字变量值,如 0、5 和 10
要进一步了解变量和比例尺,请完成变量和字段类型模块。
现在您已经了解了轴是什么,继续了解用于直观展示数据的不同图表类型吧。
展示定量变量的图表类型 | |
---|---|
线形图连接一系列定量值,通常用于显示时间序列(X 轴是时间),也叫折线图或线条图。 |
|
柱状图以连续的柱形显示数据分布以及数据集中值的频率。柱形的宽度与 X 轴上的值相关。统计学家、科学家和分析员把每个柱形的宽度叫作 bin。 |
|
箱须图用百分位数显示数据的分布。也叫箱型图。 |
熟悉间隔
间隔是定量轴上值(刻度线)之间的距离。每个刻度之间的距离应始终一致,定量轴上的间隔要均等。例如,显示员工通勤时间的图表,10 分钟这样的一致间隔比较合适。不一致的间隔(例如 15 分钟、40 分钟和 60 分钟)可能会导致曲解,产生错误的结论。
请看一下这个例子:Sue 的西红柿收获有了显著的提升。
在上一个图表中,可以看到与 2010 年刚开始时相比,2022 年 Sue 收获的西红柿多了数十磅。但是注意到了吗?X 轴没有显示 2016 到 2018 年。现在来看一下轴上显示了那几年的图表。
X 轴间隔一致的情况下,我们可以很容易地看到 Sue 的西红柿产量在逐渐增加。
查了检查一致的间隔外,注意缺少的数据点或空值也很重要。您知道 2016 到 2018 年间发生了什么吗?或许那段时间对 Sue 来说比较难。
注意图表中定性轴实为定量数据的情况
注意用定性轴显示散点图、折线图或柱状图的情况。例如,查看下列图表中特定行业借款人的数量。
对于这些数据,您需要条形图。线形图用于按顺序显示值,例如按日期或时间。同时,线形图的 X 轴应是一致的间隔,显示定量变量。在上面的示例中,按顺序排列不同行业类别是不合理的。只要基准符合某些重要的最佳实践,条形图会是个不错的选择。
条形图必须从零开始
重要的是,所有条形图都从零基准开始,这意味着条形的最下面是零。为了更好地显示重要性,请看下列关于区域销售数据的图表。
右边的图表会让人觉得 X 轴上的两个地区有着明显的差距。第二个图表如此的有欺骗性是因为 Y 轴是从 $380K 开始的,而不是从 0 开始。解读条形图时,实际是在比较条的长度。轴从 $380K 开始会误导我们的眼睛看到三倍的差异。在第一个图表中,唯一的变化是 Y 轴从 0 开始。
现在你可以快速看出,第二个图表是如何夸大这种差异的——根本不是多大的差异!因此,查看条形图时,记得检查基准是否从 0 开始,这是十分重要的。
线形图可能从零开始
查看线形图时,“必须从 0 开始”的规则不适用。实际上,最好是不要让线形图的 Y 轴从 0 开始。请看下面两个全球温度随时间变化的线形图(数据来源:Graphing Global Temperature Trends)
第二张图表可以让您更好地了解全球温度随时间变化的模式,这是因为第二张图表中的 Y 轴不是从零开始的。在这个图表中,您可以看到更多以前不明显的细节,比如每年的变化。
关于多轴的大辩论
数据可视化领域关于在单个图表中使用双轴有着很大的争议。如果正确使用,双轴是有用的;有时也可能产生误导性或滥用。
双轴的用例
已有使用多个轴的合理用例。例如,用双 Y 轴以两个不同比例尺显示同一组数据点效率会提升,就如同用两种计量单位(例如英尺和厘米或公斤和磅)显示相同的数据的情况。在下列图表中,一个 Y 轴显示华氏温度,另一个 Y 轴显示摄氏温度。
双轴的反面用例
不过也有个别情况下,多轴在有意或无意中,具有一定的欺骗性。数据可视化领域备受尊敬的作家和教育家 Lisa Charlotte Muth 在她的 Datawrapper 博客中分享了这张有误导性的图表,图中用两个 Y 轴显示了两组不同的数据点。
请仔细看一下这个图表中的比例尺。两个 Y 轴的比例尺是不同的,会让您误以为 2011 年德国 GDP 和全球 GDP 相同。实际上,这两个数据之间有着超过 66 万亿美元的巨大差距。
请记住,看图表时要看轴,确保合理显示数据。