Skip to main content
欢迎参加 3 月 5 日至 6 日在旧金山举行的 TDX AI 代理时代开发者大会,或通过 Salesforce+ 参与。立即注册

了解生成式 AI 的技术生态系统

学习目标

完成本单元后,您将能够:

  • 识别有助于生成式 AI 快速发展的关键要素。
  • 描述构成生成式 AI 技术堆栈的技术类型。
  • 描述企业对生成式 AI 的常见疑虑。

增强生成式 AI 训练

生成式 AI 能在短时间内掌握很多技能,这种令人难以置信的进步速度主要归因于三个重要因素。首先是大量训练数据的可获性。如前一单元所述,互联网上10亿多的网页是写作的重要来源。但只有当您找到数据的使用方法时,数据才有用。这就是第二个重要因素:更好的训练。

正如您在人工智能基础知识中所学到的,研究人员设计的神经网络使用复杂的数学函数来训练 AI 模型。神经网络架构是一个不断发展的研究领域。2017 年,谷歌研究人员发表了一篇关于训练大语言模型的颠覆性论文。他们提出了一种名为 Transformer 的新型 AI 架构。正如您所能想到的,这项研究的细节相当复杂。但为了(极大地)简化,该新架构能够识别单词之间的重要关系,无论它们在文本块中相距多远。即使在处理了大量单词之后,它也可以记住这一关系。

新型 Transformer 架构让我们意识到了生成式 AI 快速发展的第三个主要因素:计算能力。AI 模型训练时需要通过强大的处理能力来执行数学运算。从历史上看,AI 模型被设计成需要按顺序执行一系列计算。而 Transformer 架构则不同,它依赖于许多独立的并行计算。

因此,在一个计算机处理器执行第一个计算时,另一个处理器同时执行第二个计算。这被称为并行计算,并大大缩短了训练 Transformer 所需的时间。除此之外,近年来能够进行并行计算的处理器变得更加强大,种类也愈加丰富。

数据、架构和计算这三个因素已经融合在一起,为训练出能力极其强大的大语言模型创造了恰到好处的条件。其中最大的语言模型之一是 GPT 语言模型,它代表创成式预训练 Transformer。换而言之,这是一个经过训练可以用来生成文本相关内容的模型。

新兴生态系统

现在,互联网上已经有数百个网站可以让您亲身体验生成式 AI。当您访问其中一个网站时,实际上只是接触到了技术冰山的顶层。而这项技术有很多不同的来源。探索一下为大家带来令人惊叹的生成式 AI 体验所需的技术堆栈。

例如,过去几年来,这个蓬勃发展的技术公司生态系统以惊人的速度成长。一些公司将专注于一个特定领域。例如,在基础模型领域,有些公司会希望专注于训练新的、性能更佳的模型,以便脱颖而出。其他公司将创建跨越技术堆栈多层的解决方案,为其应用程序打造专有 LLM。

许多企业才刚刚开始探索 AI 对他们的意义。鉴于对 AI 技术前所未有的需求,各企业有大量机会在 AI 技术堆栈的多个层次上有所作为。

对生成式 AI 的常见疑虑

生成式 AI 将导致我们与计算机的交互方式发生很多变化。对于任何颠覆性技术来说,理解其局限性和令人担忧之处非常重要。以下是对生成式 AI 的几个主要疑虑。

幻觉

记住,生成式 AI 实际上是预测的另一种形式,预测有时会出错。生成式 AI 的预测结果与基于事实的预期反应不同,被称为幻觉。幻觉出现的原因有几个,比如训练数据不完整或有偏差,或者模型设计得不好。因此,对于任何由 AI 生成的文本,都要花时间验证下内容的真实性。

数据安全性

企业可以在生成式 AI 生命周期的两个时间点共享专有数据。首先,在微调基础模型时。其次,当实际使用该模型处理带有敏感数据的请求时。提供 AI 服务的公司必须表明信任至关重要,并且数据将始终受到保护。

剽窃

用于图像生成的 LLM 和 AI 模型通常是利用可公开获取的数据进行训练的。模型有可能学习一种风格并复制该风格。开发基础模型的企业必须采取措施,在生成的内容中增加些变化。此外,他们可能需要根据内容创作者的要求整理训练数据以删除样本。

用户欺骗

创建一个可信的在线个人档案比以往任何时候都更容易,甚至可以使用 AI 生成的照片。这样的虚假用户可以与真实用户(以及其他虚假用户)进行非常逼真的互动。这使得企业很难识别推广机器人程序内容的僵尸网络。

可持续发展

训练和运行 AI 模型所需的计算能力是巨大的,并且可能转化为碳排放、水资源消耗和其他环境影响。随着模型变得越来越庞大,它们的碳足迹也会增加。这就是为什么我们通过开发高效的 AI 模型、以透明的方式引领行业,以及通过可再生能源和现代化电网基础设施实现电力行业脱碳,以此努力确保 AI 的可持续性

总结

生成式 AI 能够帮助企业和个人完成各种基于语言的任务。大量数据的融合、更智能的 AI 架构和巨大的计算能力推动着生成式 AI 和 AI 生态系统不断发展。

资源

在 Salesforce 帮助中分享 Trailhead 反馈

我们很想听听您使用 Trailhead 的经验——您现在可以随时从 Salesforce 帮助网站访问新的反馈表单。

了解更多 继续分享反馈