Data 360 中的非结构化数据入门
学习目标
完成此步骤后,您将能够:
- 在 Data 360 中定义非结构化数据。
- 解释非结构化数据如何增强您的 AI 与自动化策略。
- 描述如何连接来自外部 blob 存储(如 Amazon S3)中的数据。
什么是非结构化数据?
您的组织收集的数据通常有三种形式:结构化、半结构化和非结构化。尽管组织收集的非结构化数据占比日益增大,但目前仅有极少部分能得到有效利用。大量数据可能难以有效集成到工作流中,尤其在搜索和检索方面。借助 Data 360 对非结构化数据的支持,这一现状将得以改变。
非结构化数据是指没有特定、一致格式且难以在典型关系数据库中存储的数据。因其缺乏结构,进行搜索或分析尤为困难。然而,大语言模型 (LLM) 等 AI 技术能有效地处理非结构化数据。此功能使许多企业能够将日益庞大的非结构化数据纳入其数据驱动策略。
非结构化数据的常见形式包括聊天脚本、音频和视频文件、电子邮件、法律文档及其他大文本(如书籍)。在 Salesforce 中,非结构化数据示例包括来源于 Knowledge 文章或销售通话脚本的数据。
利用非结构化数据增强 AI 与自动化策略
在 Data 360 中连接非结构化数据后,您可以在生成式 AI(提示生成器与 Agentforce)、自动化 (Flow Builder) 和分析(Tableau 与 CRM Analytics)应用程序中创建以客户为中心的结果。例如,您可以通过 Knowledge 文章数据生成对客户的回复来优化服务回复建议,或创建利用历史电子邮件生成个性化消息的提示模板。或者,您也可以利用 Flow Builder 和 Agentforce,在服务智能体解决个案或记录新个案时向其显示类似的个案数据。
连接来自外部 blob 存储的非结构化数据
Data 360 支持引用 HTML、TXT 和 PDF 格式的非结构化数据。有关详细信息,请参阅非结构化数据文件格式和连接器。由于 Data 360 已支持来自 Amazon S3、Azure Blob 存储和 Google Cloud 存储的连接,若您已设置这些连接,只需单击几下配置即可导入非结构化数据。
在外部 blob 存储与 Data 360 之间创建连接后,您可以通过创建一个非结构化数据湖对象 (UDLO) 并将其映射到非结构化数据模型对象 (UDMO),在 Data 360 中引用非结构化数据。
因为 UDLO 和 UDMO 的架构相同,Data 360 会自动在这两个对象之间创建字段级映射。您可以在 Salesforce 帮助中阅读关于架构的更多信息。
UDLO 与 UDMO 之间的关系可为 1:1 或 N:1。这意味着每个 UDLO 最多只能映射到一个 UDMO,而多个 UDLO 可以映射到一个 UDMO。让我们来看一个示例。
假设您正在引用来自多个外部 blob 存储的个案记录数据。三个不同的 UDLO 引用来自以下三个数据源的数据:CaseRecordingsFromAWSBucket1、CaseRecordingsFromAWSBucket2 和 CaseRecordingsfromGCS。由于这些数据源在逻辑上属于同一对象,因此各个 UDLO 均映射到一个 UDMO:CaseRecordings。
通过将外部 blob 存储的非结构化数据连接到 Data 360,您可以为管理员和用户提供更多相关内容,帮助他们解决问题、管理个案,并为 Einstein 生成式 AI 应用程序构建有效的提示。
注册包含 Data 360 的自定义 Playground
要完成这个项目,您需要一个包含 Data 360 和示例数据的自定义 Playground。
- 单击 Create Playground(创建 Playground)。
- 您的新组织自动附加到您的 Trailhead 帐户!
- 记住组织的到期日期,并在此日期之前完成这个徽章。
启动自定义 Playground 后,您即可将 Knowledge 文章内容作为非结构化数据导入。单击 Challenge(挑战)部分的 Verify step to earn 100 points(验证步骤,可获得 100 分)并前往项目的下一步。
