Explorar las herramientas y consideraciones de prueba de agentes
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Explicar la importancia de realizar pruebas a los agentes.
- Describir las herramientas que puede utilizar para probar su agente.
- Hablar sobre las consideraciones de las pruebas de agentes y de las maneras de mitigarlas.
Antes de empezar
Antes de empezar este módulo, considere completar este contenido recomendado. Estos módulos proporcionan conocimientos fundamentales necesarios para realizar este módulo.
-
Trailhead: Agentforce: Planificación de agentes
-
Trailhead: Fundamentos de Agentforce Builder
-
Trailhead: Capa de confianza de Einstein
Introducción
La inteligencia artificial (IA) y el auge de los agentes de IA están reformando la manera en la que pensamos sobre el desarrollo de software. En muchas organizaciones, los mismos administradores y desarrolladores de Salesforce que han pasado años administrando y personalizando soluciones de Salesforce están ahora a cargo de la creación de agentes de Agentforce. Esto requiere un cambio en sus habilidades, las herramientas que utilizan y en la conciencia. Mientras que las etapas tradicionales y conocidas de generación de ideas, configuración, realización de pruebas, implementación y observación de gestión del ciclo de vida de aplicaciones (ALM) también se aplican al proceso del ciclo de vida del desarrollo de agentes (ADL), añadir a la mezcla algo de IA generativa puede hacer que aparezcan algunos imprevistos, sobre todo en el ámbito de las pruebas de agentes.

En este módulo, aprenderá sobre las herramientas disponibles para probar agentes y resolver problemas, consideraciones que le ayudarán a realizar pruebas y las estrategias de realización de pruebas que puede utilizar para que las respuestas de sus agentes sean más precisas y previsibles.
Los motivos por los que se deben hacer pruebas
Si ha obtenido la insignia Agentforce: planificación de agentes, significa que ha seguido a Nora Alami de Coral Cloud Resorts en su planificación de un agente que pueda crear y gestionar reservas de clientes. Ha aprendido sobre la definición de criterios, como la audiencia, el ámbito, los casos de uso, las protecciones y las tareas que se llevarán a cabo. Estas especificaciones son las mismas que se deberían validar durante el proceso de realización de pruebas para asegurarse de que el rendimiento del agente se alinea con el trabajo para el que se ha diseñado.
Herramientas para probar agentes y resolver problemas
Garantizar que su agente responda de forma precisa y como es de esperar a las preguntas del usuario puede parecer una tarea abrumadora, especialmente cuando se tienen en cuenta todas las solicitudes del usuario que deben poder gestionar sus temas, acciones y protecciones. Con tantas variables en juego, la causa de una respuesta errónea, un mensaje de error o una alucinación debe residir en una instrucción, una acción, datos o un conjunto de permiso. Por ello, Agentforce Studio le proporciona dos niveles de prueba a fin de que pueda sentir con seguridad que su agente está listo para proporcionar respuestas fiables y previsibles: realización de pruebas manual en Agentforce Builder y realización de pruebas a escala en el centro de pruebas.
Herramientas de pruebas y resolución de problemas de Agentforce Builder
Después de crear su agente en Agentforce Creator, puede comenzar a probarlo en Agentforce Builder. Puede probar conversaciones en el panel Conversation Preview (Vista previa de la conversación) para ver cómo funciona su agente. Puede revisar los pasos que se han llevado a cabo para devolver la respuesta que se ha recibido mediante los detalles que aparecen en el lienzo del plan. Además, puede revisar los registros de eventos del agente para ver detalles específicos de la sesión y la conversación.
Conversation Preview (Vista previa de la conversación) (1): resulta emocionante llegar al paso en Agentforce Builder en el que puede comenzar a conversar con su agente en el panel Conversation Preview (Vista previa de la conversación). Aquí, puede simular conversaciones que los usuarios podrían tener con su agente, de manera que pueda ver si responde de la manera que se esperaba. Las respuestas que genera le permiten ver si su agente proporciona respuestas útiles y pertinentes, realiza las llamadas a la acción adecuadas, hace referencia a sus procesos de negocio de forma correcta y respeta las protecciones que se han establecido.
Lienzo del plan (2): cada vez que introduce datos en la ventana de chat de la vista previa de la conversación, el panel que aparece en el centro (llamado lienzo del plan) se actualiza y muestra la manera en la que el agente ha generado su respuesta. El lienzo del plan muestra los datos iniciales que se han proporcionado, el tema seleccionado, las acciones que se han activado y las instrucciones que se han utilizado. También puede ver el razonamiento que ha utilizado el agente para generar la respuesta y cualquiera de sus datos pertinentes que tenía permitido usar a fin de proporcionar una respuesta más personal y precisa.
La respuesta y los detalles que usted recibe le ayudan a identificar cómo puede mejorar su agente a fin de que proporcione respuestas que se ajusten a su plan. Puede probar a introducir datos, revisar su agente y volverlo a probar. Actualice la ventana de Conversation Preview (Vista previa de la conversación) cuando vaya a introducir nuevos datos para que se apliquen las actualizaciones.

Registros de evento mejorados
Mientras que los detalles de sus interacciones en el panel Conversation Preview (Vista previa de la conversación) desaparecen cada vez que actualiza su agente, los registros de eventos mejorados capturan y almacenan las interacciones en una sesión de agente para que pueda visualizar el flujo de una conversación a fin de mejorar las respuestas de su agente. Para utilizar los registros de eventos mejorados, active la configuración en Agentforce Creator en la pantalla Customize your agent (Personalizar su agente) marcando la casilla Keep a record of conversations with Enhanced Event Logs to review agent behavior (Mantener un registro de las conversaciones con registros de eventos mejorados a fin de revisar el comportamiento del agente). También puede activar los registros de eventos mejorados más adelante en la ficha Details (Detalles) en la configuración de su agente.

Tener acceso a los registros de eventos mejorados resulta útil después de iniciar su agente porque puede revisar los tipos de intercambio de conversación entre los usuarios y los agentes, entre los que se incluyen los datos que se proporcionan al agente y la manera en la que este responde. Esto puede ayudarle a detectar y resolver un problema o a ajustar su agente para gestionar los datos de entrada que no ha anticipado. Los registros de eventos le permiten saber si necesita establecer protecciones adicionales o ajustar las instrucciones o acciones para que las respuestas estén más dirigidas. Agentforce Builder almacena registros de eventos durante 7 días para que pueda revisar los datos de la conversación y la actividad de la sesión de forma retroactiva.

Centro de pruebas
Tras haber ajustado el rendimiento de su agente en Agentforce Builder, está listo para realizar pruebas en lote en el centro de pruebas. Para acceder al centro de pruebas, en Setup (Configuración), busque y seleccione Testing Center (Centro de pruebas) en el cuadro Quick Find (Búsqueda rápida). Si lo prefiere, en Agentforce Builder, haga clic en el botón Batch Test (Pruebas en lote) que aparece sobre el panel Conversation Preview (Vista previa de la conversación).

Es posible que se esté preguntando por que tiene que realizar una prueba en lote en el centro de pruebas si ya ha probado su agente en Agentforce Builder. Tardaríamos mucho en pensar cada una de las maneras en las que un usuario podría formular una pregunta o interactuar con su agente y, después, probarlas una por una en la ventana Conversation Preview (Vista previa de la conversación). El centro de pruebas simplifica el proceso de realización de pruebas al probar docenas e incluso cientos de situaciones a la vez. Por ejemplo, puede cargar un archivo .csv de situaciones de prueba que haya escrito en lenguaje natural o puede pedirle al centro de pruebas que utilice IA para generar datos de prueba que sean pertinentes para las tareas que debe realizar su agente.
Cuando se ejecuta una prueba en lote, los resultados muestran los datos que se han probado junto con los temas y acciones esperados y reales que se han activado, la respuesta esperada y el resultado positivo o negativo de cada entrada. Si necesita más información sobre el motivo por el que una prueba ha fallado, puede copiar y pegar los datos en el panel Conversation Preview (Vista previa de la conversación) de Agentforce Builder y revisar la ruta que ha seguido el agente para llegar a la respuesta en el lienzo del plan. Esto ayuda a ajustar más las instrucciones, lo cual puede hacer que la experiencia de usuario mejore. Para obtener más información sobre el centro de pruebas y la escritura o generación de escenarios de prueba, consulte Agentforce: Prueba de agentes.
Consideraciones sobre la prueba de agentes
En las pruebas con aplicaciones tradicionales, debe planificar cada detalle de la aplicación antes de comenzar a crearla. El éxito se mide al producir los resultados previstos y que se repitan, es determinista. Su solución puede funcionar tal y como estaba previsto o no. Por otra parte, el proceso de desarrollo de un agente también requiere planificar por adelantado: se ajusta, se prueba y se revisa el agente a la vez que se crea. Las pruebas de agentes son probabilísticas, es decir, los resultados pueden ser menos predecibles, únicos y, a veces, sorprendentes, debido a la falta de lógica basadas en reglas de la IA generativa. Los mismos datos pueden generar respuestas diferentes pero igual de válidas, respuestas incorrectas o incluso alucinaciones. También resulta difícil anticipar todas las maneras en las que un usuario podría interactuar con su agente, por lo que debe tener en cuenta y probar una gran variedad de situaciones a la hora de crearlo. De esta manera, se minimizan las respuestas que no coincidan con los datos que se le proporcionan al agente o que no sean precisos.
Determinar si su agente está listo para la producción
La naturaleza probabilística del comportamiento del agente hace que determinar si su agente está listo para la producción no resulte sencillo. Las empresas deben determinar sus propios datos de referencia para los índices de superación o error en distintos escenarios. No existe una única respuesta correcta y el nivel de precisión deseado puede cambiar según el sector. Un buen punto para comenzar sería considerar con cuánta precisión realizaría una persona la misma tarea, por ejemplo, gestionar preguntas sobre reservas, y utilizar eso como base. A continuación, puede esforzarse por asegurar que su agente cumpla o exceda ese nivel de precisión.
Realice pruebas en un sandbox
Al probar sus agentes se pueden modificar los datos de CRM, por lo que debe utilizar siempre el centro de pruebas en un entorno de sandbox, y no hacerlo en su entorno de producción.
Utilizar muchos criterios para evaluar su respuesta
Para conseguir las respuestas que desea a partir de los datos que introduce en el panel Conversation Preview (Vista previa de la conversación), tendrá que realizar el método de prueba y error varias veces. La creación de agentes es un proceso repetitivo. Para tener en cuenta varios tipos de datos de entrada, debe llevar a cabo un proceso de revisión, en el que se incluya el refinamiento del texto, la comprobación de permisos, la validación de datos o la adición de más detalles o protecciones a sus instrucciones. Los comentarios que reciba en el lienzo del plan, registros de eventos o el centro de pruebas le ayudarán a hacerse una idea y a identificar en qué medida debe ajustar los temas, las acciones o las instrucciones del agente a fin de conseguir respuestas que se acerquen a su nivel de precisión deseado.
Estas son algunas cosas que debe tener en cuenta a medida que realiza pruebas en su agente y algunas maneras de abordarlas.
Consideraciones de la realización de pruebas |
Cómo puede ajustar su agente |
|---|---|
¿El agente ha seguido mis instrucciones? |
|
¿La respuesta es precisa, está completa y resulta sencilla de leer? |
|
¿La respuesta se basa en mis datos? |
|
¿La respuesta se ajusta al estilo de mi marca? |
|
¿Cuándo tiempo se ha tardado en proporcionar la respuesta? |
|
¿Hay sesgos o toxicidad en la respuesta? |
|
¿Es la respuesta siempre fiable? |
|
Costes de las pruebas
Una última consideración sobre las pruebas es el coste para ejecutarlas. Probar su agente en el centro de pruebas puede consumir créditos flexibles, créditos de comunicación o solicitudes de Einstein y también puede consumir créditos de Data 360. Estas solicitudes y créditos son mediciones de uso facturables para la IA generativa que generan costes para su organización. Para obtener más información, revise la documentación de ayuda Tipos de uso facturable de la IA generativa o hable con un ejecutivo de cuentas.
Conclusión
La prueba de agentes requiere una manera diferente de pensar y trabajar en cuanto a las pruebas de aplicaciones tradicionales. Si se tienen en cuenta todas las variables que pueden afectar a las respuestas de su agente, no es de extrañar que las pruebas de agente que se lleven a cabo con éxito son más subjetivas que una prueba de software tradicional. El dominio de herramientas de prueba de Agentforce y la comprensión de cómo se deben mitigar los factores que afectan al rendimiento del agente puede ayudarle a conseguir el nivel de precisión deseado rápidamente. En la siguiente unidad, aprenderá la importancia de crear una estrategia de prueba de agentes para guiarle en el proceso de pruebas.
