Skip to main content
Register now for TDX! Join the must-attend event to experience what’s next and learn how to build it.

Aspectos básicos sobre el aprovisionamiento de datos

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

  • Comprender el concepto de nutrir un agente y el motivo por el que es útil.
  • Aclarar la manera en la que el aprovisionamiento de datos y la generación aumentada por recuperación (RAG) están relacionados.
  • Describir los tipos de datos que pueden utilizarse como fuentes de datos para Agentforce.

Antes de comenzar

Sabemos que está deseando aprender sobre los agentes y el aprovisionamiento de datos a medida que implementamos nuevas herramientas de inteligencia artificial (IA) generativa. Antes de empezar, considere completar este contenido recomendado.

En el Glosario de términos de IA generativa de Einstein también se incluyen muchos de los términos que se utilizan en esta insignia, como modelos de lenguaje grandes (LLM) solicitudes, aprovisionamiento de datos, alucinaciones, lenguaje tóxico y muchos más. Obtenga más información sobre los LLM en el módulo de Trailhead Modelos de lenguaje grandes.

¿Qué es el aprovisionamiento de datos?

En general, el aprovisionamiento de datos es la idea de incorporar información a una solicitud de LLM que quiera que este tenga en cuenta a la hora de procesar una solicitud. Entre los datos con los que se nutren las fuentes de datos se incluyen datos estructurados, como hojas de cálculo de Excel y datos de CRM, y datos sin estructurar, como archivos PDF, registros de chat, mensajes de correo electrónico y publicaciones de blog.

El objetivo del aprovisionamiento de datos es mejorar la precisión y la relevancia de las respuestas del LLM. Los LLM, que suelen utilizarlos los agentes, se entrenan con información general en lugar de utilizar información específica del contexto o personal. Al agregar conocimientos pertinentes específicos del dominio e información contextual que provenga de fuentes de datos fiables, se mejoran los resultados del LLM y se aumenta la confianza en las soluciones de IA.

Nutrir agentes con fuentes de datos que se puedan comprobar tendrá como resultado una mejor toma de decisiones y acciones más eficaces. Los agentes suelen triunfar más cuando se les proporciona información actualizada, precisa y pertinente. Aunque el aprovisionamiento de datos no sea absolutamente necesario para todos los agentes, se recomienda para todos aquellos agentes que utilicen LLM a fin de ayudar a que se realice el trabajo.

Datos estructurados y no estructurados

La información que se utiliza para nutrir agentes y LLM puede provenir de datos estructurados o sin estructurar.

Los datos estructurados están organizados en un formato predefinido con metadatos conocidos. Resulta sencillo buscar, analizar e integrar datos estructurados con agentes. Algunos ejemplos son los datos de objetos de Salesforce, como Accounts (Cuentas), Contacts (Contactos) y Cases (Casos), u objetos de modelo de datos (DMO).

Los datos sin estructurar no tienen un formato predefinido y los metadatos son desconocidos. Algunos ejemplos son correos electrónicos, registros de chat, publicaciones en redes sociales o documentos. Aunque presentan más retos a la hora de procesarlos, los datos sin estructurar pueden proporcionar información de gran valor. Los datos sin estructurar requieren un procesamiento para poder preparar y optimizar el conocimiento para su recuperación. Para conectar estos datos a Agentforce, puede utilizar herramientas de procesamiento de lenguaje natural (NLP) o servicios de extracción de datos a fin de convertirlos para que tengan un formato estructurado.

Nutrir con generación aumentada por recuperación (RAG)

La generación aumentada por recuperación es una forma de aprovisionar datos que recupera conocimientos de fuentes de datos sin estructurar. En este enfoque, la solicitud del LLM se enriquece con información pertinente y actual de una fuente fiable, como una recopilación de documentos. Por ejemplo, si un cliente pregunta sobre las funciones de un producto, la generación aumentada por recuperación obtiene los detalles de las últimas funciones de su base de conocimientos y los agrega a la solicitud a partir de la cual el LLM genera una respuesta.

Para que el aprovisionamiento de datos sea práctico y eficaz, debe conocer algunas maneras de utilizarlo en Agentforce. Veremos estas dos ideas a continuación.

Recursos

Comparta sus comentarios sobre Trailhead en la Ayuda de Salesforce.

Nos encantaría conocer su experiencia con Trailhead. Ahora puede acceder al nuevo formulario de comentarios cuando quiera desde el sitio de la Ayuda de Salesforce.

Más información Continuar para compartir comentarios