Mejorar la IA con datos reales
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir las ventajas de utilizar la biblioteca de datos de Agentforce.
- Definir los conceptos clave implicados en la transformación y organización de datos de IA.
- Explicar cómo funcionan la configuración y los procesos de ejecución de la biblioteca de datos de Agentforce.
Antes de empezar
Antes de empezar este módulo, considere completar este contenido recomendado.
¿Por qué debería proporcionar datos a la IA?
Los datos juegan un papel fundamental a la hora de garantizar que los sistemas de IA funcionen de manera precisa y eficaz. Dele una respuesta incorrecta a un cliente y no volverá a comprar nunca más. Si proporciona a los representantes de servicio información incorrecta, es posible que terminen frustrando a los clientes en lugar de ayudarlos. Si proporciona recomendaciones obsoletas a los representantes de ventas, podrían perder las ganancias objetivo y oportunidades empresariales de gran valor.
Mientras que los datos son el elemento principal de cualquier sistema de IA competente, los modelos de IA son generalistas: se entrenan con enormes conjuntos de datos que les proporcionan una base de conocimientos general. Esta base de conocimientos general implica que no cuentan con la información especializada que necesitan para realizar tareas específicas o responder preguntas técnicas para sus casos de uso únicos.
Al incorporar datos del mundo real, los modelos de IA van más allá de los conjuntos de formación estática. Cuando proporciona al modelo de IA fuentes de información verificadas, como la base de conocimientos de Salesforce, archivos cargados o sitios web, el LLM puede devolver respuestas más precisas a las solicitudes de los clientes, sugerir mejores respuestas a los agentes, proporcionar resúmenes de búsqueda, etc.

El reto de los datos empresariales
La mayoría de las empresas almacenan sus bases de conocimientos en formatos sin estructurar, como colecciones de vídeos, imágenes, documentos, correos electrónicos, datos de sensores, publicaciones en redes sociales, archivos de audio, etc.; estos formatos no se adaptan de forma eficaz a las hojas de cálculo o bases de datos. Estos datos, que representan casi el 90 % de los datos empresariales, son difíciles de buscar, pero contienen información de gran valor, como comentarios, percepciones, opiniones y el tono de los clientes. ¿Cómo puede desbloquear el potencial de estos datos?
Con la biblioteca de datos de Agentforce, una herramienta potente que puede ayudarle a aportar datos reales a la IA. Con la biblioteca de datos de Agentforce, puede conectar su base de conocimientos a las funciones de IA de Salesforce fácilmente, garantizando así que conseguirá contenido generado por IA actualizado y que se ajuste a su organización y casos de uso. Al configurar la biblioteca de datos de Agentforce, conseguirá las herramientas que necesita para transformar grandes conjuntos de datos sin estructurar o semiestructurados en contenido más útil y que resulte más fácil buscar. Veamos cómo puede hacerlo.
Transformar datos para que su uso sea eficaz con modelos de lenguaje grande
Las bibliotecas de datos de Agentforce hacen que resulte sencillo vincular agentes y modelos de lenguaje grandes (LLM) a los datos sin estructurar mediante la automatización de algunos pasos de configuración en Data 360 y Prompt Builder. Esto incluye enviar transmisiones de datos a Data 360, asignar objetos de datos y crear un índice de búsqueda y un recuperador. El resultado final es que sus herramientas de IA siempre trabajarán con la información más actualizada y pertinente.
Antes de aprender los sencillos pasos para configurar una biblioteca de datos, vamos a revisar algunos conceptos clave: aprovisionamiento de datos, fragmentación, indexación y recuperadores.
Aprovisionamiento de datos
El aprovisionamiento de datos es el proceso de agregar conocimientos o información del cliente específicos de un dominio, proporcionando al LLM el contexto que necesita para responder a una pregunta o tarea de una forma más precisa. Tal y como hemos mencionado, entre las fuentes para proporcionar datos puede haber artículos de conocimiento, archivos cargados, sitios web, transcripciones de conversaciones, etc. Sin embargo, la búsqueda en documentos extensos y complejos puede consumir mucho tiempo y necesitar muchos recursos; además, los LLM tienen un límite de palabras o tokens para la cantidad de texto que pueden procesar de una vez.
Fragmentación e indexación
Para abordar estos procesos, las fuentes de datos se desglosan en partes más pequeñas denominadas fragmentos. Después, se realiza una búsqueda en los fragmentos y solo se devuelve la información más relevante para que el LLM la considere.

Una vez fragmentados los datos, se organizan y clasifican en un índice de búsqueda. Almacenar la información en un índice de búsqueda organizado hace resulte más sencillo y rápido recuperar datos específicos cuando sean necesarios. Cuando los datos se fragmentan y organizan de esta manera, la búsqueda será más eficaz, la importancia de los resultados mejorará y se habilita la gestión de grandes conjuntos de datos.
Piense en un gran almacenamiento en línea con millones de productos. Una clasificación de un catálogo de almacenamiento o sitio web bien organizada permite que los clientes encuentren los productos que buscan rápidamente por categorías, como nombre, tipo, marca o incluso funciones específicas. El desglose de los datos en fragmentos más pequeños y la organización de los mismos en un índice de búsqueda es como crear un catálogo para su contenido. Los LLM pueden utilizar dicho catálogo o índice para buscar la información adecuada a fin de responder a las consultas de los usuarios.
Recuperadores
Los recuperadores actúan como indicadores entre datos y funciones. Están diseñados para extraer y proporcionar datos pertinentes automáticamente de diferentes bases de datos, sistemas o plataformas. Cuando un usuario hace una pregunta, el recuperador asignado a cada biblioteca de datos determina los conjuntos de datos de Data 360 a los que las herramientas de IA de Salesforce pueden acceder. Esto hace que los recuperadores sean particularmente importantes en aplicaciones como motores de búsqueda, sistemas para proporcionar respuestas a preguntas y sistemas de recomendación.
Ha aprendido algunos aspectos básicos sobre la organización de datos en la IA. A continuación, vamos a ver cómo se llevan a cabo estos procesos durante la configuración y ejecución de una biblioteca de datos.
¿Qué ocurre durante la configuración?
Al crear una biblioteca de datos, los procesos que conectan sus datos con sus agentes de IA y funciones comienzan inmediatamente. Primero, se crean una transmisión de datos, un lago de datos y objetos de modelo de datos. Estos objetos se asignan en conjunto y comienza el proceso de fragmentación de los datos. El tiempo necesario para realizar la fragmentación varía según factores como el número, el tamaño y la complejidad de los artículos de conocimiento o archivos cargados, y el número de campos de conocimiento seleccionados para realizar la fragmentación. Una vez finalizado este proceso y listo el índice de búsqueda, se crea un recuperador. Cada biblioteca de datos de Agentforce cuenta con su propio recuperador exclusivo, que puede hacer referencia al mismo índice de búsqueda, pero funciona de manera independiente.

¿Qué ocurre durante los tiempos de ejecución?
Una vez configurado el recuperador y preparado el índice de búsqueda, el sistema estará listo para gestionar las consultas de los usuarios en tiempo de ejecución.
En el tiempo de ejecución, la consulta del usuario se agrega a la plantilla de solicitud, que hace referencia al recuperador conectado a los datos pertinentes. El sistema realiza una búsqueda en el índice de búsqueda para encontrar la información pertinente y la incorpora a la solicitud. El LLM recibe la solicitud enriquecida, que incluye la consulta del usuario, la información agregada y las instrucciones de la solicitud, y genera una respuesta. El servicio de planificación revisa la respuesta para garantizar que se ajusta a las instrucciones de la solicitud. Por último, el usuario final recibe una respuesta que responde de forma precisa a la consulta y está contextualizada con información específica del dominio ajustada para la tarea específica.

Recapitulación
¡Excelente trabajo! En esta unidad, ha aprendido el motivo de la importancia de proporcionar datos a la IA y ha explorado alguna terminología especializada y procesos técnicos. Ahora, es el momento de pasar a la configuración, la cual verá que puede ser muy sencilla.
