探索生成式 AI 的能力
学习目标
完成本单元后,您将能够:
- 描述生成式 AI 模型相比于其他模型的质量。
- 定义 AI 语言模型的重点词汇。
- 描述使用语言模型的生成式 AI 具备的能力。
聚光灯下的人工智能
您可能已经发现最近关于人工智能 (AI) 的讨论很多,几乎是铺天盖地。但为什么人们的兴趣会激增?AI 并不是新鲜事物;许多企业和机构多年来一直适当使用着 AI。AI 突然备受关注是由 ChatGPT 引起的。这是一种由 AI 驱动的聊天机器人,具备超群拔类的能力。
ChatGPT 可以回答用简明语言提出的问题或请求,而这些回答看起来像是由人写的。因为它是对外公布的,人们可以亲身体验与电脑对话是何种感觉。它太让人惊讶了。它太神秘了。它太令人回味了。所以它自然引起了人们的关注!
[在 stability.ai 上使用 DreamStudio 通过 AI 生成的图像,并配有提示:“一个快乐的机器人坐在桌子旁的椅子上。桌子上放着一台笔记本电脑。采用 2D 矢量艺术风格绘制。”]
一个能够自然地进行类人对话的 AI 显然与我们过去看到的那些都不同。正如您在人工智能基础知识徽章中所学到的,AI 模型经过训练可执行许多特定任务。例如,经过训练的 AI 模型可以根据市场数据来预测三居室住宅的最佳售价。这一能力令人印象深刻,但该模型“只”产生了一个数字。相比之下,一些 AI 模型能够产生令人难以置信的各种文本、图像和声音,这些都是我们从未读过、看过或听过的。这类 AI 被称为生成式 AI,蕴含着巨大的变革潜力,无论是在工作场所内外都能带来重大影响。
在本徽章中,您将了解生成式 AI 经过训练可完成什么类型的任务,以及采用的训练技术。本徽章还探讨了企业如何在生成式 AI 生态系统中进行专业整合。最后,我们讨论了企业对生成式 AI 的一些担忧。
语言模型的可能性
生成式 AI 看起来是一个新出现的热门事物,但事实上,研究人员几十年来一直在训练生成式 AI 模型。过去几年中,有些模型就引起了公众的关注。也许您还记得 2018 年的一篇文章,当时一家名为 Nvidia 的公司推出了一种 AI 模型,可以随机生成颇具真实感的人脸图像。这些图片出人意料地让人信服。尽管它们并不完美,但它们绝对开启了一个新话题。生成式 AI 正慢慢渗入公众意识。
一些研究人员花费时间来打造可制作特定类型图像的 AI,而另一些人则专门研究语言相关的 AI。他们训练 AI 模型来执行涉及文本解释的各种任务。例如,您可能希望将某个产品的评价按正面、负面或中性划分。这项任务需要了解单词在日常使用中是如何组合在一起的,这是专家们所称的自然语言处理 (NLP) 的一个绝佳例子。“处理”语言的方法太多了,NLP 描述的是一个宽泛的 AI 类别。(有关 NLP 的更多信息,请参阅自然语言处理基础知识。)
一些执行 NLP 的 AI 采用大量数据进行训练,在这种情况下,这意味着要用到真人编写的文本样本。包含十亿个网页的互联网是样本数据的重要来源。因为这些 AI 模型采用如此大量的数据进行训练,所以它们被称为大语言模型 (LLM)。LLM 非常详细地捕捉到了人类需要数年才能学会的语言规则。这些大语言模型能够帮助我们完成一些极其复杂的高级语言相关任务。
归纳:如果您看到一个句子,并且明白所有单词是如何组合在一起来表述一个观点的,则您大概可以重写这个句子以表达同样的想法。AI 模型学会了语法规则,并且它们知道哪些单词可以替换成其他单词,所以它们也具备重新整合句子的能力。把一整段话浓缩成一两句话也是一种重新整合。这种在 AI 帮助下进行归纳的能力在现实世界中会非常有用。它可以根据长达一小时的录音创建会议笔记,或者写一篇科学论文的摘要。这是终极的电梯演讲生成器
翻译:LLM 就像是一套规则的集合,体现了语言如何将单词组织成思想。每种语言都有不同的规则。在英语中,我们一般把形容词放在名词之前,但在法语中,情况通常相反。AI 译者这两套规则都要学习。因此,当需要重新整合句子时,AI 可以应用第二套规则来表达相同的想法。瞧,您翻译得很棒。并且编程语言也是语言。它们有自己的一套规则,因此 AI 能够将一组松散的指令翻译成实际代码。一个口袋式个人编程器可以为很多人打开很多扇门。
纠错:哪怕是经验再丰富的撰写人偶尔也会犯语法或拼写错误。现在,AI 将能检测出(有时还会自动纠正)任何错误。此外,只是在听别人说话时,纠正错误也很重要。在嘈杂的环境下,您可能会漏听一两个单词,但您会根据上下文来填补空白。AI 也可以做到这一点,从而更加准确地将语音转换成文本(如隐藏字幕)。
回答问题:这是让生成式 AI 成为公众关注焦点的任务。像 ChatGPT 这样的 AI 能够弄清问题或请求背后的意图。然后,它会根据具体的请求内容生成大量文本。例如,您可以要求它分别用一句话来总结威廉·莎士比亚最受欢迎的三部作品,您会得到以下回答:
《罗密欧与朱丽叶》- 讲述了两个在家族仇恨中相爱的年轻人的悲剧故事,爱情最终导致他们英年早逝。
《哈姆雷特》- 讲述了一位王子见到了父亲的鬼魂,努力复仇并在生死攸关时刻奋力斗争的故事。
《麦克白》- 这是一部令人不寒而栗的戏剧,以野心和道德堕落为主题,讲述了一个贵族在妻子的怂恿下,为夺取王位而走上了血腥谋杀之路。
然后,您可以将对话继续下去,询问关于《哈姆雷特》的更多信息,就如同正在和语言艺术老师交谈一样。这种交互是通过一个简单的请求获得及时信息的绝佳例子。
引导图像生成:LLM 可以与图像生成模型协同使用,在您描述了想要的图像后,AI 会尝试画出这么一幅图来。这里是一个要求画一幅“朱丽叶站在一座古老城堡的窗户旁的 2D 线条艺术画”的例子。因为互联网上有太多关于《罗密欧与朱丽叶》的文字描述和图像,AI 生成器无需更多信息就可以猜测出一个合适的图像。
[在 stability.ai 上使用 DreamStudio 通过 AI 生成的图像,并配有提示:“一副 2D 线条艺术画,画中朱丽叶站在一座古老城堡的窗户旁。”]
结合引导图像生成功能,一些 AI 模型可以在现有图像中添加新内容。例如,您可以扩大图片的边界,使 AI 能够根据原始图片的背景信息绘制有可能出现的内容。
将文本转换为语音:与 AI 将一串单词转换为图片类似,还有的 AI 模型可以将文本转换为语音。一些模型可以分析一个人说话的音频样本,学习那个人独有的话语模式,并可以在将文本转换为新音频时重现这些模式。对于无心的听众而言,两者之间的区别很难分辨。
这些只是用 LLM 创建新文本、图像和声音的几个例子。几乎任何依赖于理解语言如何工作的任务都可以通过 AI 实现改进。这是一款非常强大的工具,工作或娱乐时都可以使用。
令人印象深刻的预测
既然您已经知道了生成式 AI 具备的能力,那么务必要弄清楚一些事情。生成式 AI 生成的文本实际上只是另一种形式的预测。但是它不是预测一个房屋的价值,而是预测可能对读者有意义并存在相关性的单词序列。
这些预测确实令人印象深刻,但它们并不能表明计算机“正在思考”。计算机对您所询问的话题并没有形成任何观点,也没有自己的意图或欲望。如果听起来它似乎有自己的观点,那是因为它正在做出最佳预测,给出的答复符合您的期望。例如,询问某人“你更喜欢咖啡还是茶?”会引发一种特定类型的预期回答。经过良好训练的模型可以预测出一种回答,而实际上对于计算机而言任何一种饮料都是无意义的。
在下一个单元中,您将了解一些使生成式 AI 成为可能的技术。
资源