Skip to main content

了解常见数据分析用例

学习目标

完成本单元后,您将能够:

  • 说明为何说数据分析在现代企业中很重要。
  • 说明数据分析工具在常见场景中的使用方法。

在复杂的世界中使用数据分析

游戏、商业和社交媒体有什么共同点?这些垂直领域中的每一个都产生大量的数据,组织机构利用这些数据来改进服务,检测并解决问题。在下面的视频中,Raf 探讨了日常生活中涉及数据分析的常见垂直领域和用例。 

我们谈论的是 100 行数据吗?1,000 行?在某些情况下,可能达到数十万甚至数百万行!您是如何处理这些数据的?

本单元末尾关于视频内容提出问题。请务必观看以便获得回答本单元末尾处的问题所需的信息。

查看脚本

[Raf] 现在你已经知道了不同类型的数据分析之间的区别,让我来展示一些例子,解释一下现如今你作为消费者或专家是怎样接触到数据分析的。数据分析广泛存在于当今许多领域,例如游戏、社交媒体;电子商务、线上商店;网站、统计,也称为点击流媒体;推荐引擎;物联网 (IoT);日志处理等等。

我来举几个例子说明数据分析在一些场景中的价值,这样你就可以了解数据分析在这些场景中存在的意义了。假设你像我一样喜欢玩电脑游戏。谁不喜欢呢?

如果你喜欢玩游戏,无论是在手机电脑还是游戏机中,那么你可能很熟悉开始游戏之前需要勾选的复选框。那个复选框通常会提示诸如向游戏开发人员发送匿名数据统计信息以改善游戏体验之类的内容。这其实是为了允许收集有关你玩游戏方式的信息,以便检测潜在的崩溃、设计故障和其他数据。在这种情况下,很明显,现实生活中的数据(例如你玩游戏时的数据)正在被转换为帮助开发人员规避潜在问题并增强游戏体验的信息。这正是数据分析存在的原因,也是数据分析与现代世界息息相关的原因。

你可能会问,为什么现在会这样?我从小就玩游戏,以前并不是这样啊。那时游戏以卡盘形式出售。我们买来就可以玩,是吧?没错。但我们想一下,那些游戏并不像我们今天的游戏那么复杂。这就是我想说的。

分析可以帮助人们获得见解,而这些见解可以帮助他们解决复杂的问题。无论是游戏、股票市场、房地产数据、交通信息、时尚计算机系统、Web 服务器还是安全日志,数据分析都有助于处理复杂场景。

随着存储成本日益降低,公司经常会收集他们目前可能没有用处的数据。但是,如果明天出现问题,答案可能就在他们之前收集的数据中。

如今的世界比 10 年前更加复杂。借助计算机系统之所以有用,原因在于两点。可扩展性和数据驱动的决策。数据分析的另一个主要部分是日志分析。让我更深入地说明一下这个部分,这是本课程中的重点内容,尤其是安全日志部分。

说到日志分析,我们通常说的是计算机系统基于事件产生的信息。事件可以是对网页发出的 HTTP 请求、用户日志记录信息、API 调用或任何其他类型的请求。API 是应用程序编程接口的首字母缩写,它基本上是一个计算接口,定义多个软件中介之间的交互。

它定义了可以发出的调用或者请求的类型、如何发出、应该使用的数据格式、要遵循的约定等。从数据分析的角度来看,在某处记录所有这些活动是很常见的。

数据分析的一个典型示例是使用 web 服务器日志来提取有关网站访问者的见解。假设向 HTTP 服务器发出的每个请求都记录在文件系统的文件中。这些大多称为访问日志。如果针对网站的每次访问都在访问日志中添加了一个新行,那么就可以说此日志中的行数相当于 web 服务器处理的请求数。

如果你只有一个服务器和一个每分钟有几次访问的小网站,你可以用一些基本工具(如文本编辑器)来解析这些文件并提取你要找的东西。但是,如果除了汇总日志行以外你还想做一些更有用的事情,那么数据分析工具的使用就是关键。

我们鼓励尽可能使用数据分析工具,但是当我们想要进行日志聚合和可视化时,我们需要可以处理更大规模的专业工具。想象一下你有数十个 web 服务器,每秒有数千名用户。你可以预料到每台服务器上的每个日志文件都会很快填满。因此你需要将所有数据集中在某个地方。

此外,你可能需要在折线图中可视化这些数据,这可以帮助你轻松识别峰值,也称为偏差或异常值。数据分析的另一个主要用途是数据安全。如果你可以快速访问你的系统生成的安全日志以提取分析,那么如果你需要查明请求是什么时候发出、由谁发出、什么时候、从哪里发出,以及系统对该请求的响应是什么,那么你就具有明显的优势。

如果能够根据这些数据进行预测分析,你甚至可以达到另一种状态,即在不良请求发生之前自动阻止它们,或者创建一个自我修复的架构,如果当前环境出现降级,该架构便开始构建故障转移环境。

这可以通过云中的基础结构自动化工具来实现。有一个名为 AWS CloudTrail 的 AWS 服务,它将 API 活动记录到 AWS 账户,还有另一种名为 Amazon S3 的 AWS 服务,这是一种存储服务。让我简单介绍一下这些服务。

这是你或别人每次使用 AWS Management Console 登录你的 AWS 账户时 CloudTrail 存储的内容。这些内容存储在 Amazon S3 中,包含谁发出的请求、来自哪个 IP 地址、请求的目的、请求的响应是什么以及其他一些有用的合规性信息等,如果需要,这些信息可以迅速转化为证据。由于这种性质,CloudTrail 是一项为你的 AWS 账户启用基础结构管理、运营审计和风险审计的服务。

但是,如果每次都需要挖掘 CloudTrail 文本数据,那就可能很难实现。因此,学习数据分析有助于利用所有这些合规性数据执行更多的操作。如果对 CloudTrail 生成的信息使用数据可视化工具,那么你就可以拥有包含异常活动图形和警报的安全仪表板。如果你突然看到登录失败活动的日志,可能是因为有人正在尝试登录你的 AWS 账户,或者因为你改了密码然后忘记了密码。

我经常说数据安全分析不仅适用于合规性报告,而且对故障排除也非常有用。如果将这一概念应用于防火墙包、网络活动负载均衡器和服务器日志以及其他类型的基础结构主题,你可以轻松识别异常值并让自己能够快速解决问题。但是,一定要想一想你还可以使用数据分析做什么,以及它如何帮助你获得对正在发生的事情的更深入的见解,无论是关于安全性、产品改进、更好的客户体验,还是数据分析范围的任何其他部分。

一切皆有可能,在下一个视频中,我将介绍为什么在云中做所有这些会给你带来一些重要的优势,以及每个人随时随地启用数据分析有什么好处。

看完视频了吗?

记住,这一测验是围绕本单元中的视频展开的。如果您还没有看,现在就回去看吧。然后您就可以参加测验了。

继续免费学习!
注册帐户以继续。
有什么适合您的内容?
  • 为您的职业目标获取个性化推荐
  • 通过实践挑战和测验练习您的技能
  • 跟踪并与雇主分享您的进度
  • 与人联系以获取指导和就业机会