Ajustar los agentes con una estrategia de realización de pruebas de cinco pasos
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Explicar por qué es importante tener una estrategia de realización de pruebas antes de empezar a probar su agente.
- Describir la estrategia de cinco pasos para probar sus agentes.
¿Por qué es necesario seguir una estrategia de realización de pruebas?
La realización de pruebas a agentes es la base para que los agentes sean fiables. Las herramientas de Agentforce Studio proporcionan varias maneras de asegurarse de que su agente gestiona las tareas que usted tiene pensado que haga. Tal y como ha aprendido en la unidad anterior, probar cuidadosamente las maneras en las que un usuario puede interactuar con un agente puede presentar un reto. Con tantas variables en juego, contar con una estrategia de realización de pruebas antes de comenzar es una decisión inteligente. En esta unidad, aprenderá a probar su agente tras haberlo ajustado en Agentforce Builder.
Estrategia de cinco pasos para probar sus agentes
El bucle de pruebas de agentes de IA es una estrategia paso a paso que le guía por el proceso de ajuste de sus agentes para que estén listos para los usuarios. Cree situaciones de prueba, seleccione mediciones de evaluación y ejecute pruebas automatizadas. A continuación, valide los resultados y utilice los comentarios para ajustar más las partes de su agente a fin de que mejore la precisión y el rendimiento.

Paso 1: Identificar escenarios de prueba y crear datos de prueba.
Después de haber probado una gran variedad de datos de entrada del usuario de forma manual en el panel Conversation Preview (Vista previa de la conversación) y de haber revisado el agente según esas respuestas, estará listo para realizar pruebas en lote de su agente en el centro de pruebas. El primero paso en la realización de pruebas en lote es identificar los tipos de datos de entrada que desea probar. Puede crear y cargar sus propios escenarios de prueba escribiéndolos en lenguaje natural; si lo prefiere, puede pedirle al centro de pruebas que utilice IA para generar casos de prueba con los metadatos y datos a los que el agente tiene permiso para acceder. Independientemente de si escribe los escenarios usted mismo o le pide a la IA que los genere, resulta útil conocer qué características tiene un buen escenario, así que vamos a verlas.
Cuando planificó su agente, también definió el ámbito y sus capacidades. Por ejemplo, nuestro agente de reservas incluye estos temas y acciones que definen algunos de los trabajos y tareas que el agente gestionará sobre las reservas.
- El tema Reservation Management (Gestión de reservas) gestiona las tareas, como la confirmación de reservas e itinerarios, y realiza nuevas reservas o modifica las existentes.
- La acción Create or Update Reservation (Crear o actualizar reserva) crea una nueva reserva si no existe. Si se realiza algún cambio en una reserva existente, actualiza el registro del huésped.
Para ayudar a que se le ocurran buenos escenarios, en Agentforce Builder, revise los temas de su agente, incluidos los campos Classification Description (Descripción de la clasificación) y Scope (Ámbito), que describen las capacidades y parámetros con los que su agente debería trabajar. Además, revise las instrucciones que dirigen la manera en la que funciona su agente. A continuación, escriba datos de entrada (o genérelos en el centro de pruebas) que vuelvan a probar los detalles que ayudan a garantizar que su agente actúa de manera fiable en cada situación. Por ejemplo, para el tema Reservation Management (Gestión de reservas), debería incluir lo siguiente en sus escenarios de prueba.
- Me gustaría hacer una reserva.
- ¿Tiene disponibilidad en julio?
- Necesito cambiar mi reserva.
- Me gustaría confirmar mi reserva.
Necesita un número de situaciones que aborden todos los tipos de datos de entrada para probar su agente de forma exhaustiva. Un buen conjunto de datos de entrada contiene estos atributos.
-
Volumen: número suficiente de casos de prueba para garantizar que se abordan diferentes situaciones y casos complejos.
-
Diversidad: una gran variedad de datos de entrada, contextos y variaciones que prueban la capacidad de adaptación del agente a casos de uso reales, entre los que se incluyen datos de entrada que no están en el ámbito del agente o que pueden presentar un reto para las protecciones del agente.
-
Calidad: casos de uso bien definidos, precisos y pertinentes alineados con los objetivos del agente.
El centro de pruebas utiliza archivos .csv para contener los escenarios de prueba. Si escribe sus propios datos de entrada de prueba, creará su propio archivo .csv; si le pide a la IA que genere datos de entrada de prueba, puede descargar esos pasos en un archivo .csv y modificarlos. El vídeo Test an AI Agent in Agentforce Testing Center (Probar un agente de IA en el centro de pruebas de Agentforce) muestra cómo funciona el centro de pruebas de Agentforce.
Paso 2: Establecer los parámetros de evaluación.
Los casos de prueba generados por el centro de pruebas incluyen la configuración que usted ha seleccionado y le guía por cuatro pantallas en el flujo de trabajo New Test (Nueva prueba). Tras proporcionar información básica sobre su prueba, como el nombre y el agente que está probando, puede elegir incluir variables de contexto que simulen información sobre el usuario o el contexto de la conversación. También seleccionará la manera en la que el centro de pruebas evalúa el rendimiento y la calidad del agente. Probar todas las opciones de criterios de evaluación del agente para garantizar que el agente es fiable y que funciona correctamente es una buena idea.
Haga clic en Next (Siguiente) o en Previous (Anterior) debajo del cuadro azul para visualizar los cuatros pasos para generar casos de prueba de agentes.
Cuando complete el flujo de trabajo New Test (Nueva prueba) y haga clic en Generate Test Cases (Generar casos de prueba), verá una lista de las pruebas que coinciden con los criterios que ha seleccionado. Si carga un archivo .csv de datos de entrada de prueba que haya escrito, aparecerán en la lista. Un caso de prueba valida la manera en la que el agente procesa los datos de entrada, que a los que se les conoce como declaraciones. Cada caso de prueba incluye lo siguiente:
-
Declaraciones: la solicitud de entrada para el agente
-
Tema esperado: el tema pertinente que el agente debe evaluar
-
Acciones esperadas: las acciones relacionadas que debería realizar el agente
-
Respuesta esperada: el resultado deseado descrito en lenguaje sencillo

Paso 3: Ejecutar las pruebas y evaluar los resultados.
Una vez completado el flujo de trabajo New Test (Nueva prueba), haga clic en Run Test Suite (Ejecutar conjunto de pruebas) para ejecutar pruebas y ver cómo se llevan a cabo. Revise los resultados de la prueba en los campos The Actual Topic (Tema actual), Topic Test Result (Resultado de la prueba del tema), Actual Actions (Acciones reales), Action Test Result (Resultado de la prueba de la acción), y Actual Response (Respuesta real).
Paso 4: Valide su resultados.
Aunque las pruebas generadas gestionan muchas situaciones, es importante que una persona revise las respuestas para asegurarse de que se alinean con la manera en la que el agente debería responder y de que no se produce ningún resultado tóxico o no deseado. Al revisar los datos de entrada y las respuestas en este paso, también se pueden detectar sutilezas que se hayan podido perder, por ejemplo, que el tono no sea el esperado o que haya imprecisiones específicas del contexto.

Paso 5: Revisar los resultados y repetirlos.
Recuerde que la realización de pruebas es un proceso repetitivo. Utilice los resultados de la prueba para ajustar sus temas, acciones e instrucciones hasta que consiga el nivel de precisión esperado. La realización de pruebas también puede ayudar a revelar datos obsoletos a los que su agente tiene acceso o permisos que deben ajustarse.
Volver a probar los agentes
Los agentes, al igual que las empresas, evolucionan, por lo que es importante realizar de pruebas para buscar precisión y confianza continuamente. Hay muchos factores que pueden afectar al rendimiento de sus agentes, entre los que se incluyen cambios en los datos que utiliza su agente, permisos o actualizaciones de los temas, acciones o solicitudes, o cambios en funciones de productos relacionados o procesos de negocio. La realización de pruebas continua ayudará a que su agente evolucione para que siga siendo pertinente a medida que los objetivos empresariales cambian.
Conclusión
La realización de pruebas es la base de la creación de agentes de IA fiables, eficaces y de confianza. Al seguir una estrategia de realización de pruebas, garantizará que sus agentes de Agentforce sean fiables y útiles para los usuarios.
Escenario para la prueba
Maria es administradora de Agentforce en una gran cadena de hoteles, Global Stay Resorts. Le han pedido que ajuste un agente de IA diseñado para gestionar las reservas de los clientes. El agente se ha probado de forma manual en Agentforce Builder y Maria ya está lista para implementar una estrategia de realización de pruebas más completa a fin de garantizar fiabilidad y precisión antes de lanzarlo. Está particularmente centrada en la anticipación de varios datos de entrada por parte del usuario y en garantizar que las respuestas del agente se alineen con el estilo de la marca y los procesos de negocio.
