Skip to main content
From 16:00 UTC on January 17, 2026, to 20:00 UTC on January 17, 2026, we will perform planned maintenance on the Trailhead, myTrailhead, and Trailblazer Community sites. During the maintenance, these sites will be unavailable, and users won't be able to access them. Please plan your activities around this required maintenance.

认识数据的特点

学习目标

完成本单元后,您将能够:

  • 认识有用数据的特点。
  • 辨别实例数据中有用数据的特点。

简介

人们往往通过分析数据来辅助决策。您知道如何判断您的数据何时准备好接受分析吗?在本模块中,您将学习如何辨别“好”数据,如何在需要时重组数据。 

在本单元中,您将学习如何辨别优质、有用的数据的特点。具备这些特点的数据使您可以执行高效、富有成果的分析。 

数据素养基础模块讨论的特点是被著名信息技术专家 Stephen Few 认定有助于人们高效运用数据的特点。正如高效运用数据的人具有某些特点一样,有效的数据也有一些使其有用的具体特点。据 Stephen Few 所言,采用优质的数据是能够产生重要洞察的数据分析的基本组成部分。

Stephen Few 是公认的数据可视化领域的领袖,这些特点经许可改编自他的著作 Now You See It: An Introduction to Visual Data Sensemaking

有用数据的特点

很少有人列举过有用数据呈现的特点。在浏览这些特点的同时可以反思您个人的经验。您有没有遇到过对您的个人生活或工作有用的数据?那些数据具有其中哪些特点?您有没有遇到过对您的个人生活或工作没有用的数据?那些数据缺乏其中哪些特点?

这些是优质数据的部分特点。

特点
描述

海量

大量相关、可得的数据意味着有更大的几率拥有解答您的问题所需的东西。


备注:不要为了获得数据而获得数据;相关性很重要。

历史

从历史数据中,您可以看出现状是如何因为随着时间出现的规律而产生的,比如看一下过去十年的销售趋势可以看出增长或下降。

一致 

随着事物发生变化,也应该调整数据以保持一致性。视通胀作出调整的薪资和物价数据是一个很好的例子。

多变量

数据应该包含定量(可数)和定性(特征,不可数)变量。数据中的变量越多,您可以从中发现越多东西。

细微 

数据越精细化,您就越能以不同的详细程度挖掘数据。比如,如果您想了解您所在州骑自行车的趋势,看一下这些趋势受县、城市和社区的影响会对您有帮助。

干净

数据要想有用,必须准确、完整、无误。

清晰

数据应该用简单易懂的词汇编写,而不是代码。比如,户型值独栋别墅、双拼别墅和联排别墅比 1Fam、2fmCon 和 TwnhsE 更容易理解。

多维结构 

数据结构化的一种简单方法是把它分成两类:维度(定性值)和度量(定量值)。这是解释数据时 Tableau 用到的组织结构。

丰富细分

为了更容易分析,应该根据类似特征将分组融入数据。比如,关于电影的数据可以按体裁(动作、科幻、爱情、喜剧等等)分组。

已知来源

您应该知道数据的背景才能信任它——它来自哪里,之后经过了怎样的改动。

考虑一些实例数据

试想您有一份文件名是“一月-反应堆-运行”的 Excel 文件,是从 Data.gov 下载的,这是一个您可以访问美国政府公开数据的网站。该文件包含美国核反应堆地点和发电量的信息。这张图是数据前 16 行的快照。

Excel 电子表格中的 16 行,包含核反应堆的信息

思考有用数据的特点。您知道这个数据集来自您可以访问美国政府公开数据的网站 Data.gov,并且您看到它包含 2003 到 2018 年间的数据。我们来测试您刚刚学过的内容。体现了哪两个有用数据的特点?在下面的活动中,请给每个句子填空。

现在您对有效数据的一些特点有了一定了解。下一个单元,继续学习数据的组织方式以及结构严谨和格式糟糕的数据的区别。

资源

在 Salesforce 帮助中分享 Trailhead 反馈

我们很想听听您使用 Trailhead 的经验——您现在可以随时从 Salesforce 帮助网站访问新的反馈表单。

了解更多 继续分享反馈