查看测试结果
学习目标
完成本单元后,您将能够:
- 描述 Agentforce 测试中心的测试结果。
- 在 Agentforce 生成器中对失败的测试进行故障排除。
处理测试结果
测试完成后,您可以查看测试结果,了解哪些部分运行良好,哪些部分未达到预期效果。查看您在上一单元中运行的测试的结果。
- 在 Setup(设置)中的 Quick Find(快速查找)框内搜索并选择 Testing Center(测试中心)。
- Test Name(测试名称)选择 Generated Test Agentforce v1(生成的测试 Agentforce v1)。
页面顶部会显示以下信息:状态、持续时间、子智能体通过率 (%)、操作通过率 (%) 以及响应通过率 (%)。
这一部分为您快速概览测试各部分的完成状态。您可以选择下载或重新运行测试。当您修改智能体后,重新运行测试有助于判断修改是否会导致现有测试失败。然后,您可以向 CSV 测试文件中添加新的测试,以覆盖对智能体所做的更新。最后,您可以使用更新后的测试文件创建并运行新测试。
页面接下来的部分是“测试结果”。您可以点击下拉菜单,在三个选项中选择任何一个:“全部结果”(默认)、“通过的结果”和“失败的结果”。

在“测试结果”部分,您会看到多列信息。让我们更详细地查看第一行信息。
话语 |
请将 Ilsa Galgey 的电子邮件地址更新为 new_email@example.com。 |
运行状态 |
已完成 |
预期子智能体 |
MigrationDefaultTopic |
实际子智能体 |
MigrationDefaultTopic |
子智能体测试结果 |
通过 |
预期操作 |
['IdentifyRecordByName', 'ExtractFieldsAndValuesFromUserInput', 'UpdateRecordFields'] |
实际操作 |
['IdentifyRecordByName', 'ExtractFieldsAndValuesFromUserInput'] |
操作测试结果 |
失败 |
预期响应 |
Ilsa Galgey 的电子邮件地址已更新为 new_email@example.com。 |
实际结果 |
我可以将 Ilsa Galgey 的电子邮件地址更新为 new_email@example.com 吗? |
结果测试结果 |
通过 |
您可能已经从测试文件中识别出了“话语”、“预期子智能体”、“预期操作”和“预期响应”。新增的信息是测试运行后产生的实际响应和测试结果。
-
Actual Subagent(实际子智能体):显示为该话语选择的子智能体。
-
Subagent Test Result(子智能体测试结果):显示“通过”或“失败”,取决于实际子智能体是否符合预期子智能体。
-
Actual Actions(实际操作):显示智能体基于该子智能体运行了哪些操作。
-
Action Test Result(操作测试结果):显示“通过”或“失败”,取决于实际操作是否符合预期操作。
-
Actual Outcome(实际结果):显示智能体的实际响应。
-
Outcome Test Result(结果测试结果):显示“通过”或“失败”,取决于实际输出是否符合预期响应。
似乎第一个测试的“实际操作”失败了。“预期操作”包含 IdentifyRecordByName 以及 QueryRecords,而“实际操作”只包含 QueryRecords。您可使用 Agentforce(默认)智能体的 Agentforce 生成器,对该测试的话语进行故障排除,从而更清楚地了解智能体的实际操作。
使用 Agentforce 生成器进行故障排除
切换到 Agentforce 生成器,在“对话预览”中手动测试该话语。以这种方式使用 Agentforce 生成器属于手动测试,可以让您深入分析该话语,查看智能体选择的子智能体、操作和响应。然后尝试更改话语,测试是否能获得不同的结果。
- 在 Setup(设置)中的 Quick Find(快速查找)框内搜索并选择 Agentforce Agents(Agentforce 智能体)。
- 在下拉菜单中选择要打开的 Agent Name(智能体名称),并选择 Open in Builder(在生成器中打开)。我们将继续查看 Einstein Copilot 或 Agentforce(默认)智能体。

- 在 Conversation Preview(对话预览)中,输入话语
Please update the email address for Ilsa Galgey to new_email@example.com.(请将 Ilsa Galgey 的电子邮件地址更新为 new_email@example.com。),然后单击 Enter 键。
Agentforce 生成器中心屏幕显示测试结果,包括“会话开始”、“用户提示”、“选择子智能体”等。

您也可以查看“选择操作”,显示已调用了“按名称识别记录 (IdentifyRecordByName)”操作。

“预期操作”的测试标准原本是三项操作。而失败的原因在于预期设置有误。
此时,您有几种处理方案可选。
- 第一种方案是将测试的“预期操作”更改为仅包含 IdentifyRecordByName 和 ExtractFieldsAndValuesFromUserInput。但另一种选择是,如果该测试的“话语”本应触发两项操作,则可以更改测试的“话语”。
- 通过更改话语并检查测试结果中的“实际操作”,您可以对测试进行迭代、修改,并验证智能体的行为是否符合预期。测试越多,测试标准越多样,对智能体的信心和信任度也就越高。
- 或者,也可以将此视为一个反向测试, 只需添加一个符合正向测试标准的测试,即可覆盖该标准。
Agentforce 测试中心的优势
测试是构建 Agentforce 智能体的重要环节。通过创建和维护详细的正向与反向测试标准,您实际正在建立并维护用户和客户对 Agentforce 智能体所赋予的信心与信任。
Agentforce 测试中心支持重复运行测试,使您能够快速判断对智能体所做的更改是否会对结果产生负面影响。您也可以先创建测试标准,运行测试,然后再将新功能构建到智能体中,使这些测试通过。这在编码社区中被称为测试驱动开发 (TDD),是构建智能体新功能的一种好方法。
现在,您对 Agentforce 测试中心的功能,以及如何运用各种测试标准来确保新智能体能够可靠地与用户和客户互动,有了更深入的了解。现在,开始创建一些测试吧!