查看测试结果

学习目标

完成本单元后，您将能够：

描述 Agentforce Studio 测试结果。
在 Agentforce 生成器中对测试进行故障排除。

处理测试结果

测试完成后，您可以查看测试结果，了解哪些部分运行良好，哪些部分未达到预期效果。查看您在上一单元中运行的测试的结果。

在 App Launcher（应用程序启动器） 中，搜索并选择 Agentforce Studio。
单击 Tests（测试）。
Test Suite（测试套件）选择 Generated Test Agentforce v1（生成的测试 Agentforce v1）。
单击 Run history（运行历史）。
Run history（运行历史）显示测试套件每次运行的 Status（状态）、Results（结果）和 Run By（运行者）。
选择您刚运行的测试套件的 Start Time（开始时间）。

顶部会显示以下信息：Subagent Evaluation Pass %（子智能体评估通过率 (%)）、Action Evaluation Pass %（操作评估通过率 (%)）和 Response Evaluation Pass %（响应评估通过率 (%)）。这些内容为您提供测试各部完成状态的快速概览。 “Agentforce Studio 以及 Generated Test Agentforce v1（生成的测试 Agentforce v1）测试状态和 Details（详细信息）和 Download Results（下载结果）按钮。”

在“测试结果”部分，您会看到多列信息。让我们更详细地查看第一行信息。您的结果可能有所不同。

Utterance（表达）	Please update the email address for Ilsa Galgey to new_email@example.com.（请将 Ilsa Galgey 的电子邮件地址更新为 new_email@example.com。）
Expected Subagent（预期子智能体）	MigrationDefaultTopic
Expected Actions（预期操作）	['IdentifyRecordByName', 'ExtractFieldsAndValuesFromUserInput', 'UpdateRecordFields']
Expected Response（预期响应）	The email address for Ilsa Galgey has been updated to new_email@example.com.（Ilsa Galgey 的电子邮件地址已更新为 new_email@example.com。）
Agent Response（智能体响应）	Can I proceed with updating Ilsa Galgey's email address to new_email@example.com?（我可以将 Ilsa Galgey 的电子邮件地址更新为 new_email@example.com 吗？）
Response Evaluation（响应评估）	Pass（通过）
Subagent Evaluation（子智能体评估）	Pass（通过）
Actual Subagent（实际子智能体）	MigrationDefaultTopic
Action Evaluation（操作评估）	Fail（失败）
Actual Actions（实际操作）	['IdentifyRecordByName', 'ExtractFieldsAndValuesFromUserInput']

您可能已经从测试文件中识别出了 Utterance（表达）、Expected Subagent（预期子智能体）、Expected Actions（预期操作）和 Expected Response（预期响应）。新增的信息是测试运行后产生的实际响应和测试结果。

Agent Response（智能体响应）：显示智能体的实际响应。
Response Evaluation（响应评估）：显示 Pass（通过）或 Fail（失败），取决于实际输出是否符合预期响应。
Subagent Evaluation（子智能体评估）：显示 Pass（通过）或 Fail（失败），取决于实际子智能体是否符合预期子智能体。
Actual Subagent（实际子智能体）：显示为该表达选择的子智能体。
Action Evaluation（操作评估）：显示 Pass（通过）或 Fail（失败），取决于实际操作是否符合预期操作。
Actual Actions（实际操作）：显示智能体基于该子智能体运行了哪些操作。

似乎上述示例测试的 Actual Actions（实际操作）失败了。Expected Actions（预期操作）包含 IdentifyRecordByName 以及 QueryRecords，而 Actual Actions（实际操作）只包含 QueryRecords。您可使用 Agentforce（默认）智能体的 Agentforce 生成器，对该测试的话语进行故障排除，从而更清楚地了解智能体的实际操作。

使用 Agentforce 生成器进行故障排除

切换到 Agentforce 生成器，在 Conversation Preview（对话预览）中手动测试该表达。以这种方式使用 Agentforce 生成器属于手动测试，可以让您深入分析该话语，查看智能体选择的子智能体、操作和响应。然后尝试更改话语，测试是否能获得不同的结果。

在 Setup（设置）中的 Quick Find（快速查找）框内搜索并选择 Agentforce Agents（Agentforce 智能体）。
在下拉菜单中选择要打开的 Agent Name（智能体名称），并选择 Open in Builder（在生成器中打开）。我们将继续查看 Einstein Copilot 或 Agentforce（默认）智能体。

在 Conversation Preview（对话预览）中，输入表达 Please update the email address for Ilsa Galgey to new_email@example.com.（请将 Ilsa Galgey 的电子邮件地址更新为 new_email@example.com。），然后单击 Enter 键。智能体可能需要您确认，单击 Confirm（确认）或输入 Yes（是）。

Agentforce 生成器中心屏幕显示测试结果，包括 Session Started（会话开始）、User Prompt（用户提示）、Subagent Selected（已选子智能体）等。

您也可以看到 Action Launched（启动的操作），显示已调用了 Identify Record by Name（按名称识别记录）(IdentifyRecordByName) 操作。

“预期操作”的测试标准原本是三项操作。而失败的原因在于预期设置有误。

此时，您有几种处理方案可选。

第一种方案是将测试的“预期操作”更改为仅包含 IdentifyRecordByName 和 ExtractFieldsAndValuesFromUserInput。但另一种选择是，如果该测试的“话语”本应触发两项操作，则可以更改测试的“话语”。
通过更改话语并检查测试结果中的“实际操作”，您可以对测试进行迭代、修改，并验证智能体的行为是否符合预期。测试越多，测试标准越多样，对智能体的信心和信任度也就越高。
或者，也可以将此视为一个反向测试，只需添加一个符合正向测试标准的测试，即可覆盖该标准。

Agentforce 测试的优势

测试是构建 Agentforce 智能体的重要环节。通过创建和维护详细的正向与反向测试标准，您实际正在建立并维护用户和客户对 Agentforce 智能体所赋予的信心与信任。

Agentforce 测试支持重复运行测试，使您能够快速判断对智能体所做的更改是否会对结果产生负面影响。您也可以先创建测试标准，运行测试，然后再将新功能构建到智能体中，使这些测试通过。这在编码社区中被称为测试驱动开发 (TDD)，是构建智能体新功能的一种好方法。

现在，您对 Agentforce 测试的功能，以及如何运用各种测试标准来确保新智能体能够可靠地与用户和客户互动，有了更深入的了解。现在，开始创建一些测试吧！

资源

Salesforce 帮助：使用 Agentforce 测试中心进行批量测试

时间估计

主题

需要帮助？

Agentforce 资源

查看测试结果

学习目标

处理测试结果

使用 Agentforce 生成器进行故障排除

Agentforce 测试的优势

资源