学习落地训练基础知识
学习目标
完成本单元后,您将能够:
- 理解智能体落地训练的概念及其作用。
- 说明落地训练与检索增强生成 (RAG) 之间的关系。
- 描述可作为 Agentforce 数据源的数据类型。
开始之前
我们知道,随着我们推出全新生成式人工智能 (AI) 工具,您渴望了解智能体以及如何使用数据对其进行落地训练。在开始之前,请考虑完成下列推荐内容。
Einstein 生成式 AI 术语还涵盖了本徽章中使用的许多术语,如大语言模型 (LLM)、提示、落地训练、幻觉、有毒语言等。在大语言模型 Trailhead 模块中了解有关 LLM 的更多信息。
什么是落地训练?
通常来说,落地训练的核心是将您希望 LLM 在处理请求时需要考虑的信息融入到 LLM 提示中。落地训练数据源可包括结构化数据(如 Excel 电子表格、CRM 数据)和非结构化数据(如 PDF、聊天日志、电子邮件消息、博客帖子等)。
落地训练旨在提升 LLM 响应的准确性和相关性。LLM 常与智能体一同使用,是基于一般而非特定于上下文的 Knowledge 或专有信息进行训练的。通过从可靠数据源添加相关特定于域的 Knowledge 和上下文信息,可以优化 LLM 结果,并提高对 AI 解决方案的信任度。
用可验证的数据源对智能体进行落地训练,有助于其做出更明智的决策并执行更有效的操作。当智能体获得最新、最准确和最相关的信息时,其表现会显著提升。尽管并非每个智能体都绝对需要落地训练,但建议对利用 LLM 来辅助完成工作的智能体进行落地训练。
结构化与非结构化数据
用于为智能体和 LLM 提供落地训练的信息可来源于结构化数据和非结构化数据。
结构化数据以预定义格式进行组织,具有已知元数据。结构化数据便于搜索、分析,并能轻松集成到智能体。例如来自 Salesforce 对象(如客户、联系人以及个案)或数据模型对象 (DMO) 的数据。
非结构化数据缺少预定义格式,且元数据未知。例如电子邮件、聊天日志、社交媒体帖子或文档。虽然处理起来更具挑战性,但非结构化数据能提供有价值的见解。非结构化数据需经过预处理,以准备和优化用于检索的 Knowledge。要将这些数据连接到 Agentforce,您可以使用自然语言处理 (NLP) 工具或数据提取服务,将其转换为结构化格式。
使用检索增强生成 (RAG) 的落地训练
RAG 是一种从非结构化数据源检索 Knowledge 的落地训练形式。这种方法通过从可信来源(如文档集合)检索相关的最新信息,丰富 LLM 提示。例如,当客户询问产品功能时,RAG 会从您的知识库中获取最新功能详细信息,并将其添加到 LLM 生成响应的提示中。
要让基于数据的落地训练真正实用且高效,您需要了解其在 Agentforce 中的一些使用方法。接下来我们将探讨这两个想法。