Skip to main content

探索数据分析类型

学习目标 

完成本单元后,您将能够:

  • 说明如何通过数据分析改进决策。
  • 定义不同的分析类型。
  • 说明描述性分析。
备注

该模块是与 Amazon Web Services (AWS) 合作制作的,其拥有、支持和维护此处描述的 Amazon Web Services 产品、服务和功能。对 Amazon Web Services 产品、服务和功能的使用受 AWS 所维护的隐私政策和服务协议的约束。

深入了解

收集数据点只是第一步。您能用这些数据做什么呢?您需要整合信息,以帮助人们做出决定。这是数据分析的核心目标。本模块将向您介绍不同类型的数据分析,特别是描述性分析,以及它们在常见业务案例中的使用方式。  

观看以下由 AWS 高级云技术专家 Rafael“Raf”Lopes 录制的视频。本单元末尾关于视频内容提出问题。请务必观看以便获得回答本单元末尾处的问题所需的信息。 

注意,Raf 多次提到了术语课程,它们指的就是模块。

查看脚本

[Raf] 大家好如果你在看这个视频,你可能对数据分析感兴趣,这很棒。让我先来分享一下什么是数据分析的价值定位。

提到数据分析,我们首先要考虑的是如何利用收集到的数据生成对未来业务需求有用的信息。这些信息就是所谓的见解。

有时,从数据中生成见解的过程会非常庞大和复杂,涉及到机器学习的使用。有时,如果数据集已准备妥当,并且你只想执行描述性数据分析,这个过程就会是快速而简单的。话虽如此,数据分析仍是一门处理计算机系统收集的数据以产生见解的科学,进而通过基于数据的事实来改善决策。

如今,数据分析广泛应用于电子商务和社交媒体。但这些知识可以而且应该应用于信息安全、物流、工厂运营、物联网等等。

数据分析有四种主要类型,按照复杂程度排序,分别为描述性、诊断性、预测性和规范性。让我来稍微介绍一下每种类型。我将重点介绍描述性分析,因为这是本次入门课程中的主要内容。

描述性分析这一数据分析类型主要用于为你提供有关所发生事件的信息。通过描述性分析,你可以通过系统收集的数据了解哪里出了问题、可以改进的内容或哪个指标未按预期报告。

由于这种类型的数据分析被广泛用于汇总大型数据集,以便向利益相关者描述结果,因此可以将描述性分析视为仅报告正在发生的情况,仅此而已。这些系统提供的最相关的指标通常称为 KPI,或关键绩效指标。

对于某些垂直市场来说,确定发生了什么极为重要,有时足以满足对问题进行进一步调查的需求。我来举例说明描述性数据分析在识别正确的 KPI,让利益相关者意识到采取数据驱动的决策来解决潜在问题方面是如何发挥作用。

假设有一个电子商务网站,你收集了该网站关于处理付款所需时间的指标。这个网站用外部支付网关完成购买。因此每次客户在网站上购买某些东西时,客户都会被重定向到支付网关,并且当客户付款时你可以确认客户已付款。一组用于进行有效的描述性分析的相关 KPI,在这种情况下,可以是有关完成交易所需的时间、已完成交易数和取消交易数的指标。

现在,如果你看到取消的交易数和完成交易所需的时间激增,这可能是一个很好的指标,表明这些交易被取消是因为它们花费的时间太长。这些 KPI 可能彼此相关,这是一个很好的指标,可以帮助系统管理员和业务所有者开始对可能影响销售的潜在问题进行故障排除。

同样的概念也适用于完成交易的时间。如果你有一些东西可以通过分离交易时间内的每个步骤来深入了解该指标,那么你将拥有更精细的信息来确定解决问题的正确位置。你最不希望的是通过社交媒体或客户输入了解系统故障。在这种情况下,监控是关键,我们使用一组非常简单的指标来开始解决与业务相关的问题。

简而言之,描述性数据分析是一个告诉你正在发生的事情的概念。如果你有关于用户活动、社交媒体、物联网或系统安全日志的数据,你还可以进行描述性数据分析。正如我所说,用例可能会有很大差异,但有一点是肯定的。一旦你掌握了如何进行描述性数据分析,你就可以而且应该用同样的方法来处理不同的数据集。

很好,现在我们对什么是描述性数据分析有了基本的了解。其他三个呢?

请记住,在我们的例子中,你有关于交易时间和失败交易数量的矩阵。在这种情况下,你负责获得见解、产生想法,将这两个指标关联在一起以识别问题。系统没有将它们连接在一起,而是为你提供了一个合并的或预测的指标,称为支付网关的问题概率。如今,系统中有数百甚至数千个这样的指标是很常见的。诊断分析不仅可以提供信息,还可以通过进一步调查和关联这些 KPI 来进行诊断,以便为你提供有关问题可能出在哪里的建议。我喜欢将诊断分析称为系统可以执行的一组操作。以帮助利益相关者了解为什么会发生某些事情。你需要记住的是为什么。

我们的第三种数据分析类型是预测分析。预测数据分析更为复杂,因为顾名思义,它根据过去的数据或基于在多个数据集和源之间进行数据交叉来预测未来可能发生的情况。简而言之,它根据过去的行为来预测未来。神经网络、回归和决策树的使用在诊断分析中非常普遍,我们将在另一门课程中进行介绍。

最后但同样重要的是,规范性分析基本上是所有先前分析的总和。规范性分析可以继续并建议利益相关者根据过去的事件和结果需要采取的最受数据驱动的决策是什么。规范性分析高度依赖机器学习策略,以通过查看和跨大型数据集找到模式及其相应的补救措施。

无论决定学习和应用哪种类型数据分析,数据分析都存在于使用信息技术、统计学和领域知识的交叉领域,例如社交媒体商业或垂直行业。在本课程中,我们将重点介绍如何使用 AWS 服务通过安全日志对 AWS 帐户的情况进行描述性分析。

现在你已经了解了不同类型的数据分析,我们来继续探索更多关于数据分析在生活中的例子。

看完视频了吗?

记住,这一测验是围绕本单元中的视频展开的。如果您还没有看,现在就回去看吧。然后您就可以参加测验了。

在 Salesforce 帮助中分享 Trailhead 反馈

我们很想听听您使用 Trailhead 的经验——您现在可以随时从 Salesforce 帮助网站访问新的反馈表单。

了解更多 继续分享反馈