Actualizar la IA con datos del mundo real

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

Describir los beneficios de usar la biblioteca de datos de Agentforce.
Definir los cuatro conceptos clave relacionados con la transformación y organización de datos de IA.
Explicar cómo funciona la configuración y los procesos de tiempo de ejecución de la Biblioteca de datos de Agentforce.

Antes de empezar

Antes de comenzar este módulo, considere completar el contenido recomendado.

Fundamentación de base de conocimientos para la IA: Vistazo rápido

¿Por qué fundamentar la IA con datos?

Sus datos desempeñan una función esencial para garantizar que los sistemas de IA operen de forma precisa y eficaz. Es posible que un cliente al que se le proporcionó una respuesta incorrecta no realice futuras compras. Si los representantes de servicio cuentan con información incorrecta, pueden frustrar a los clientes en lugar de ayudarlos. Si los representantes de ventas cuentan con recomendaciones desactualizadas, pueden perder sus objetivos de ganancias y, en definitiva, oportunidades de negocio valiosas.

Si bien los datos son la base de cualquier sistema de IA exitoso, los modelos de IA son generales por naturaleza: se entrenan con conjuntos de datos masivos que proporcionan una base amplia de conocimiento. Esta base de conocimientos amplia significa que no tienen la información especializada necesaria para realizar tareas específicas o responder preguntas técnicas para casos de uso exclusivos.

La fundamentación de datos en la vida real hace que los modelos de IA superen sus conjuntos de entrenamiento estáticos. Cuando fundamenta su modelo de IA con fuentes verificadas de información, como su base de conocimientos de Salesforce, sus archivos cargados o sitios web, el LLM puede responder con mayor precisión a las consultas de los clientes, sugerir mejores respuestas a los agentes, proporcionar resúmenes de búsquedas sofisticados y más.

Un diagrama con símbolos para representar conocimiento, archivos y búsqueda web que apuntan a otra burbuja etiquetada como AI grounding (Fundamentación de IA), a la que le sigue una ventana de chat con un símbolo de Agentforce.

El desafío de los datos empresariales

La mayoría de las compañías almacenan sus bases de conocimiento en formatos no estructurados, como recopilaciones de videos, imágenes, documentos, emails, datos de sensores, publicaciones en redes sociales, archivos de audio y más, que no encajan a la perfección en hojas de cálculo o bases de datos. Sobre la base de que representan casi el 90 % de los datos empresariales, estos datos son difíciles de buscar, pero contienen información valiosa, como comentarios de clientes, percepciones, opiniones, tono y sensaciones. ¿Cómo puede aprovechar al máximo el potencial de estos datos?

Ingrese a la Biblioteca de datos de Agentforce, una poderosa herramienta que lo ayuda a fundamentar la IA con datos de la vida real. Con la Biblioteca de datos de Agentforce, puede conectar su base de conocimientos con las funciones de IA de Salesforce fácilmente para asegurarse de obtener contenido generado por IA actualizado y diseñado para su organización y sus casos de uso. Cuando configura una Biblioteca de datos de Agentforce, obtiene las herramientas necesarias para transformar grandes conjuntos de datos no estructurados o semiestructurados en contenido más útil y fácil de buscar. Veamos cómo puede hacerlo.

Transformar los datos para un uso eficiente con los modelos de lenguaje grandes

Con las bibliotecas de datos de Agentforce, es más fácil vincular los agentes y modelos de lenguaje grandes (LLM) con sus datos no estructurados, ya que automatiza varios pasos de configuración en Data 360 y el Generador de solicitudes. Esto incluye enviar transmisiones de datos a Data 360, asignar objetos de datos y crear un índice y recuperador de búsqueda. Como resultado final, sus herramientas de IA siempre están trabajando con la información más actualizada y pertinente.

Antes de aprender los pasos sencillos para configurar una biblioteca de datos, revisemos algunos conceptos clave: fundamentación, fragmentación, indexación y recuperadores.

Fundamentación

La fundamentación es cuando agrega conocimiento específico del dominio o información del cliente a una solicitud para ofrecerle al LLM el contexto necesario para responder con más precisión a una pregunta o tarea. Como ya se mencionó, las fuentes de fundamentación pueden ser artículos de Knowledge, archivos cargados, sitios web, transcripciones de pláticas y más. Sin embargo, cuando los documentos son extensos y complejos, las búsquedas pueden consumir bastante tiempo y recursos, y los LLM tienen un máximo de tokens o límite de palabras para la cantidad de texto que pueden procesar a la vez.

Fragmentación e indexación

Para abordar estos límites, las fuentes de datos se desglosan en partes más pequeñas, denominadas fragmentos. Los fragmentos son porciones de datos pequeñas y fáciles de manejar, como párrafos o secciones, que tienen sentido por sí mismas. Desglosar los datos en fragmentos permite que el sistema muestre pasajes específicos y pertinentes, en lugar de documentos enteros. Se buscan los fragmentos y solo se muestran las porciones de información más relevantes para que considere el LLM.

Un diagrama del proceso de fragmentación e indexación

Una vez que se fragmentan los datos, se organizan y categorizan en un índice de búsqueda. Es más fácil y rápido recuperar datos específicos cuando lo necesite si almacena la información en un índice de búsqueda organizado. Cuando fragmenta y organiza los datos de esta manera, las búsquedas son más eficientes, la relevancia de los resultados es mejor y se habilita el control de conjuntos de datos muy grandes.

Piense en una tienda en línea grande que ofrece millones de productos. Con un catálogo de tienda bien organizado o una taxonomía de sitios web, es más fácil para los clientes encontrar los productos que están buscando a través de categorías, como nombre, tipo, marca e incluso funciones específicas. Desglosar los datos en partes más pequeñas (en las que cada parte captura una sola idea o función) y organizarlas en un índice de búsqueda es como crear un catálogo de su contenido. Entonces, los LLM pueden usar este catálogo o índice para buscar la información correcta y responder a las consultas de los usuarios.

Recuperadores

Los recuperadores actúan como indicadores entre datos y funciones. Están diseñados para extraer y ofrecer datos relevantes de forma automática de las distintas bases de datos, sistemas o plataformas. Cuando un usuario hace una pregunta, el recuperador asignado a cada biblioteca de datos determina cuáles son los conjuntos de datos en Data 360 a los que pueden acceder esas herramientas de IA de Salesforce en particular. Por este motivo, los recuperadores son especialmente importantes en aplicaciones, como motores de búsqueda, sistemas de respuesta a preguntas y de recomendación.

Acaba de aprender algunos aspectos básicos sobre la organización de datos en la IA. A continuación, veremos cómo esos procesos se ejecutan durante la configuración y el tiempo de ejecución de la biblioteca de datos.

¿Qué sucede en la configuración?

Cuando crea una biblioteca de datos, se accionan los procesos que conectan sus datos con los agentes de IA y las funciones al instante. Primero, se crea una transmisión de datos y, luego, el lago de datos y los objetos del modelo de datos. Luego, estos objetos se asignan juntos y empieza la fragmentación de datos. El tiempo necesario para fragmentar datos depende de varios factores, como la cantidad, el tamaño y la complejidad de los artículos de Knowledge o los archivos cargados, y de la cantidad de campos de conocimientos seleccionados para la fragmentación. Una vez que se completa la fragmentación y está listo el índice de búsqueda, se crea un recuperador. Cada biblioteca de datos de Agentforce tiene su propio recuperador exclusivo, que puede indicar el mismo índice de búsqueda, pero opera de forma independiente.

Un diagrama del proceso de la Biblioteca de datos de Agentforce

¿Qué sucede en el tiempo de ejecución?

Una vez que se configura el recuperador y está listo el índice de búsqueda, el sistema está preparado para manejar las consultas de los usuarios en el tiempo de ejecución.

En el tiempo de ejecución, la consulta del usuario se agrega a la plantilla de solicitud, que referencia al recuperador encargado de conectarse a los datos relevantes. Luego, el sistema busca en el índice de búsqueda para encontrar la información más pertinente y la incorpora de vuelta a la solicitud. El LLM recibe esta solicitud enriquecida, que incluye la consulta del usuario, la información agregada y las instrucciones de la solicitud, y luego, genera una respuesta. El planificador de servicio revisa esta respuesta para asegurarse de que esté alineada con las instrucciones de la solicitud. Por último, el usuario final recibe un resultado que responde con precisión la consulta y está contextualizado con información relevante y específica del dominio adaptada a la tarea específica.

Un gráfico de flujo que muestra el proceso del tiempo de ejecución

Recapitulemos

¡Excelente trabajo! En esta unidad, descubrió la importancia de fundamentar la IA con sus datos y exploró algunos términos especializados y procesos técnicos. Ahora es el momento de la configuración, verá que es muy sencilla.

Estimación de tiempo

Temas

¿Necesita ayuda?

Recursos de Agentforce