了解生成式 AI 的技术生态系统

学习目标

完成本单元后，您将能够：

识别有助于生成式 AI 快速发展的关键要素。
描述构成生成式 AI 技术堆栈的技术类型。
描述企业对生成式 AI 的常见疑虑。

Trailcast

如果您想收听本模块的录音，请使用以下播放器。听完这段录音后，记得返回每个单元，查看资源，然后完成相关评估。

增强生成式 AI 训练

生成式 AI 能在短时间内掌握很多技能，这种令人难以置信的进步速度主要归因于三个重要因素。首先是大量训练数据的可获性。如前一单元所述，互联网上数十亿的网页是写作的重要来源。但只有当您找到数据的使用方法时，数据才有用。这就是第二个重要因素：更好的训练。

正如您在人工智能基础知识中所学到的，研究人员设计的神经网络使用复杂的数学函数来训练 AI 模型。神经网络架构是一个不断发展的研究领域。2017 年，谷歌研究人员发表了一篇关于训练大语言模型的颠覆性论文。他们提出了一种名为 Transformer 的新型 AI 架构。正如您所能想到的，这项研究的细节相当复杂。但为了（极大地）简化，该新架构能够识别单词之间的重要关系，无论它们在文本块中相距多远。即使在处理了大量单词之后，它也可以记住这一关系。

新型 Transformer 架构让我们意识到了生成式 AI 快速发展的第三个主要因素：计算能力。AI 模型训练时需要通过强大的处理能力来执行数学运算。从历史上看，AI 模型被设计成需要按顺序执行一系列计算。而 Transformer 架构则不同，它依赖于许多独立的并行计算。

因此，在一个计算机处理器执行第一个计算时，另一个处理器同时执行第二个计算。这被称为并行计算，并大大缩短了训练 Transformer 所需的时间。除此之外，近年来能够进行并行计算的处理器变得更加强大，种类也愈加丰富。

数据、架构和计算这三个因素已经融合在一起，为训练出能力极其强大的大语言模型创造了恰到好处的条件。最大的 LLM 之一是 GPT 语言模型。换而言之，这是一个经过训练可以用来生成文本相关内容的模型。

新兴生态系统

现在，互联网上已经有数百个网站可以让您亲身体验生成式 AI。当您访问其中一个网站时，实际上只是接触到了技术冰山的顶层。而这项技术有很多不同的来源。探索一下为大家带来令人惊叹的生成式 AI 体验所需的技术堆栈。

例如，过去几年来，这个蓬勃发展的技术公司生态系统以惊人的速度成长。一些公司将专注于一个特定领域。例如，在基础模型领域，有些公司会希望专注于训练新的、性能更佳的模型，以便脱颖而出。其他公司将创建跨越技术堆栈多层的解决方案，为其应用程序打造专有 LLM。

许多企业才刚刚开始探索 AI 对他们的意义。鉴于对 AI 技术前所未有的需求，各企业有大量机会在 AI 技术堆栈的多个层次上有所作为。

对生成式 AI 的常见疑虑

生成式 AI 将导致我们与计算机的交互方式发生很多变化。对于任何颠覆性技术来说，理解其局限性和令人担忧之处非常重要。以下是对生成式 AI 的几个主要疑虑。

幻觉

记住，生成式 AI 实际上是预测的另一种形式，预测有时会出错。生成式 AI 的预测结果与基于事实的预期反应不同，被称为幻觉。幻觉出现的原因有几个，比如训练数据不完整或有偏差，或者模型设计得不好。因此，对于任何由 AI 生成的文本，都要花时间验证下内容的真实性。

数据安全性

企业可以在生成式 AI 生命周期的两个时间点共享专有数据。首先，在微调基础模型时。其次，当实际使用该模型处理带有敏感数据的请求时。提供 AI 服务的公司必须表明信任至关重要，并且数据将始终受到保护。

剽窃

用于图像生成的 LLM 和 AI 模型通常是利用可公开获取的数据进行训练的。模型有可能学习一种风格并复制该风格。开发基础模型的企业必须采取措施，在生成的内容中增加些变化。此外，他们可能需要根据内容创作者的要求整理训练数据以删除样本。

用户欺骗

创建一个可信的在线个人档案比以往任何时候都更容易，甚至可以使用 AI 生成的照片。这样的虚假用户可以与真实用户（以及其他虚假用户）进行非常逼真的互动。这使得企业很难识别推广机器人程序内容的僵尸网络。

可持续发展

训练和运行 AI 模型所需的计算能力是巨大的，并且可能转化为碳排放、水资源消耗和其他环境影响。随着模型变得越来越庞大，它们的碳足迹也会增加。这就是为什么我们通过开发高效的 AI 模型、以透明的方式引领行业，以及通过可再生能源和现代化电网基础设施实现电力行业脱碳，以此努力确保 AI 的可持续性。

总结

生成式 AI 能够帮助企业和个人完成各种基于语言的任务。大量数据的融合、更智能的 AI 架构和巨大的计算能力推动着生成式 AI 和 AI 生态系统不断发展。

时间估计

主题

需要帮助？