Crear una configuración de índice de búsqueda

Objetivos de aprendizaje

Después de esta unidad, podrá:

Explicar cómo funcionan las configuraciones de índice de búsqueda y la integración de datos en Data 360.
Crear una configuración de índice de búsqueda vectorial.

Nota

¿Su idioma de aprendizaje es español? Comience el reto en un Trailhead Playground en español y utilice las traducciones proporcionadas entre paréntesis para navegar. Copie y pegue solo los valores en inglés, ya que las validaciones del reto se basan en los datos en inglés. Si no aprueba el reto en su organización en español, le recomendamos que (1) cambie la configuración regional a Estados Unidos, (2) cambie el idioma a inglés, siga las instrucciones descritas aquí y, a continuación, (3) vuelva a hacer clic en el botón Check Challenge (Comprobar el reto).

Consulte la insignia Trailhead en su idioma para obtener más información sobre cómo aprovechar la experiencia de Trailhead en otros idiomas.

Nutrir la búsqueda de datos sin estructurar mediante configuraciones de índices de búsqueda

Nutrir la búsqueda de datos sin estructurar y estructurados mejora el uso de la IA generativa, los análisis y las herramientas de automatización en Salesforce Platform. Contar con una búsqueda bien nutrida permite integrar datos específicos de clientes en aplicaciones como Agentforce, Tableau y Flow Builder para garantizar que los resultados estén bien ajustados a las intenciones y los contextos de los usuarios. Esta alineación permite obtener contenido más preciso y relevante generado por IA, información más detallada a partir de análisis y flujos de trabajo de automatización más eficientes para sus equipos y clientes.

Para nutrir una búsqueda, debe desglosar los datos sin estructurar en fragmentos correctos desde el punto de vista semántico y, a partir de esos fragmentos, crear incrustaciones de vectores, es decir, representaciones numéricas de los datos fragmentados. El contenido fragmentado y almacenado en el índice de búsqueda de Data 360 permite búsquedas y se puede usar en aplicaciones con IA generativa (como Prompt Builder y Agentforce), así como en aplicaciones de automatización (Flow Builder) y análisis (Tableau).

Datos sin estructurar en fragmentos

En la unidad anterior, hemos visto cómo Data 360 hace referencia a datos sin estructurar mediante objetos de modelos de datos sin estructurar (UDMO). También puede fragmentar los UDMO o cualquier objeto de modelo de datos (DMO) con campos de texto, como artículos de Knowledge de Salesforce. Esto es lo que haremos en esta unidad.

Al fragmentar UDMO o DMO, se desglosan en fragmentos procesables con significado semántico. Estas unidades de texto se almacenan en Data 360 en objetos de modelos de datos fragmentados (CDMO), que se crean a partir de objetos de modelos de datos u objetos de modelos de datos sin estructurar.

Funcionamiento de la fragmentación

Data 360 admite distintas estrategias de segmentación.

La extracción de pasajes semánticos utiliza el significado semántico inherente a las etiquetas HTML para fragmentar un documento en pasajes. Los elementos HTML como encabezados (<h1>, <h2>), listas (<ul>, <ol>) o texto en negrita (<strong>) que actúa a modo de encabezado se consideran los límites lógicos de los pasajes.

La estrategia de extracción de pasajes basada en ventanas emplea elementos de nivel de texto como etiquetas <div> y <p>, o texto sin formato separado por saltos de línea, para fragmentar documentos en pasajes. Si un párrafo no contiene HTML, la extracción se realiza a nivel de oración.

Hay más información sobre las estrategias de fragmentación en la Ayuda de Salesforce.

Por ahora, veamos lo que ocurre después de fragmentar los datos.

Crear incrustaciones de vectores a partir de contenido fragmentado

Después de que Data 360 fragmente el contenido, se crea una incrustación de vector, es decir, una representación numérica de contenido fragmentado que se puede recuperar o utilizar en aplicaciones de IA generativa, automatización o análisis de Salesforce.

Las incrustaciones de vectores son representaciones numéricas de texto que almacenan relaciones entre palabras o frases. La incrustación captura el significado semántico del contenido, por lo que los fragmentos de contenido similares desde el punto de vista semántico tienen incrustaciones de vectores similares. Estas representaciones ayudan a que las máquinas procesen y comprendan el lenguaje de forma eficaz.

En Data 360, se hace referencia a las incrustaciones de vectores en los objetos de modelos de datos de índice (IDMO), que veremos con más detalle luego en esta unidad.

Hay más información sobre las incrustaciones de vectores y el contenido fragmentado en la Ayuda de Salesforce.

Crear configuraciones de índice de búsqueda vectorial

A fin de preparar los datos sin estructurar para la búsqueda, debe fragmentarlos y vectorizarlos. Para ello, debe crear una configuración de índice de búsqueda. La configuración de índice de búsqueda se crea para cualquier tipo de objeto de datos con campos de texto que contienen los conceptos informativos, narrativos o descripciones detalladas que buscan sus usuarios a fin de encontrar resultados relevantes. Un ejemplo de estos datos son los artículos de Salesforce Knowledge u otros documentos de texto (por ejemplo, transcripciones de chat) que se guardan en un almacén de "blobs", como Amazon S3.

Crear una configuración de índice de búsqueda vectorial a partir de artículos de Knowledge

En la unidad anterior, ha creado una transmisión de datos y un objeto de lago de datos a partir del paquete de Knowledge en el conector de CRM de Salesforce, que proporciona varios artículos de Knowledge.

El objeto Knowledge Article Version (Versión del artículos de Knowledge) resulta útil para indexar, ya que puede utilizar este objeto para consultar, recuperar o buscar información en todos los tipos de artículos según su versión. El objeto Knowledge Article Version (Versión del artículos de Knowledge) incluye estos campos que se deberían indexar para realizar búsquedas.

Name (Nombre): el nombre o el título del artículo de Knowledge
Description (Descripción): la descripción o el resumen del artículo de Knowledge, asignada a partir de Summary (Resumen)
Campos de texto personalizado: cualquier campo de texto enriquecido (límite de 131 K) que contenga datos sin estructurar

Al crear un índice de búsqueda en el generador avanzado, puede optimizar su índice de búsqueda a fin de proporcionar resultados más precisos si presta atención a la selección de campos y estrategias de fragmentación que ha utilizado. Para obtener más información, consulte Optimización de índices de búsqueda: Selección de campos y fragmentación.

Crear una configuración para el índice de búsqueda vectorial para el DMO Knowledge Article Version

Completará estos pasos en su organización de Data 360 a fin de superar el reto al final de esta unidad.

La configuración avanzada le proporciona más control sobre las elecciones de fragmentación y vectorización; sin embargo, para este reto, utilizará principalmente la configuración predeterminada.

Si aún no lo ha hecho, inicie su Playground de Data Cloud.
En App Launcher, seleccione Data Cloud.
Haga clic en Search Indexes (Índices de búsqueda) y haga clic en New (Nuevo).
Si no ve la opción Search Index (Índice de búsqueda) en la navegación Data Cloud, haga clic en el menú desplegable More (Más) y seleccione Search Indexes (Buscar índices).
Haga clic en Advanced Setup (Configuración avanzada) y luego en Next (Siguiente).
En la página Select Source Object (Seleccionar objeto de origen), seleccione Vector Search (Búsqueda vectorial), el DMO Knowledge Article Version (Versión del artículo de Knowledge) y haga clic en Next (Siguiente). Si ve un mensaje de error, ignórelo.
En la página Select Fields to Chunk (Seleccionar campos para fragmentar), haga clic en Manage Fields (Gestionar campos).
Seleccione todos los campos y haga clic en Save (Guardar).
Deje la estrategia de fragmentación predeterminada y haga clic en Next (Siguiente).
En la página Select a Vectorization Strategy (Seleccionar una estrategia de vectorización), deje la estrategia de vectorización predeterminada tal y haga clic en Next (Siguiente).
En la página Select Related Fields for Search Filtering (Seleccionar campos relacionados para filtrar la búsqueda), no agregue ningún campo y haga clic en Next (Siguiente).
En la página Search Index Configuration Details (Detalles de la configuración del índice de búsqueda), reemplace el nombre de la configuración del índice de búsqueda generado automáticamente por My_kav. (El nombre de API de la configuración del índice de búsqueda se completa automáticamente).
Haga clic en Save (Guardar).

¡Eso es todo! Su nueva configuración de índice de búsqueda, My_kav, aparece debajo de la ficha Search Index (Buscar índice).

Ver los CDMO e IDMO Knowledge Article Version

Tras crear una configuración de índice de búsqueda, el estado cambia a Submitted (Enviado) y después a In-progress (En curso) a medida que se procesan los datos del objeto de modelo de datos (DMO) o el objeto de modelo de datos sin estructurar (UDMO) de origen. Si no se produce ningún error, el estado cambia de Submitted (Enviado) a In progress (En curso) y, posteriormente, a Ready (Listo). No verá ningún registro en Data Explorer hasta que el estado del índice de búsqueda sea Ready (Listo).

Data 360 puede tardar unos minutos en procesar los datos en el índice de búsqueda; sin embargo, el tiempo puede variar, así que puede tomarse algo o ir a estirar las piernas tranquilamente. Cuando vuelva, haga clic en Refresh (Actualizar) y compruebe si el estado de la última ejecución del índice de búsqueda es Ready (Listo).

El contenido más útil de un artículo de Knowledge se encuentra en el campo Description (Descripción). Normalmente, los artículos de muestra son muy pequeños y solo hay un fragmento. Esto significa que para cada registro del CDMO y el IDMO Knowledge Article Version (Versión del artículos de Knowledge) hay un fragmento y un vector respectivamente, pero el contenido más extenso podría tener más registros en cada DMO.

Vamos a echar un vistazo rápido al CDMO y al IDMO que hemos creado para el DMO Knowledge Article Version (Versión del artículos de Knowledge).

Confirme que el estado del índice de búsqueda sea Ready (Listo).
En Data Cloud, haga clic en Data Explorer.
En el menú desplegable Object (Objeto), seleccione Data Model Object (Objeto de modelo de datos).
En el campo Select an Object (Seleccionar un objeto), seleccione My_kav chunk (Fragmento My_kav).
Ahora, debería poder ver una lista de todos los fragmentos que ha creado Data 360 a partir de los artículos de Knowledge de muestra.
En el campo Select an Object (Seleccionar un objeto), seleccione My_kav index (Índice My_kav)
Ahora, debería poder ver una lista de todos los registros de vector que ha creado Data 360 a partir de los artículos de Knowledge de muestra.

Puede utilizar los CDMO e IDMO del índice de búsqueda en Salesforce en aplicaciones como Flow Builder, Agentforce, Prompt Builder e incluso Tableau. Si lo prefiere, consulte los documentos de búsqueda vectorial para obtener más información sobre la ejecución de consultas de búsqueda vectorial.

Al conectar datos sin estructurar a Data 360, podrá nutrir los resultados de la búsqueda con una gran cantidad de datos para una gran variedad de casos de uso centrados en los clientes. Al fragmentar y vectorizar los datos, podrá utilizar la búsqueda vectorial en aplicaciones de IA generativa de Einstein, Flow Builder e incluso Tableau a fin de mejorar las capacidades, los análisis y la automatización de la IA.

Estimación de tiempo

Temas

¿Necesita ayuda?

Recursos de Data 360