Conocer los tipos de índices de búsqueda en Data 360
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir los índices de búsqueda admitidos en Data 360.
- Identificar qué índice de búsqueda crear para su caso de uso.
Utilizar la búsqueda en Data 360 para fundamentar la IA
Fundamentar la IA mediante datos específicos del cliente aumenta el valor de la IA generativa en aplicaciones, análisis de datos y herramientas de automatización en Salesforce Platform. La fundamentación de la IA se puede lograr mediante datos no estructurados, semiestructurados o estructurados. Al utilizar la consulta del usuario para recuperar los datos relevantes de CRM para la fundamentación del modelo de IA, las aplicaciones como Agentforce, Tableau y Flow Builder garantizan que los resultados se ajusten a la intención de los usuarios. Utilice la búsqueda en Data 360 para garantizar contenido preciso y relevante generado por la IA, perspectivas más detalladas del análisis de datos y flujos de trabajo de automatización más eficientes para los equipos y clientes.
En Data 360, puede crear índices de búsqueda de cualquiera de los datos, incluidos los datos no estructurados en las bases de conocimientos. Data 360 admite los siguientes tipos de índices de búsqueda.
- Búsqueda de vectores
- Búsqueda híbrida
Para crear índices de búsqueda en Data 360, ingrese sus datos en Data 360. Data 360 introduce datos no estructurados, los asigna a objetos de modelo de datos (DMO, por sus siglas en inglés) estándares o a objetos de modelo de datos (DMO) no estructurados, y crea fragmentos de contenido significativos a partir de los datos. Luego, Data 360 crea integraciones de vectores para crear un índice de búsqueda que ayude a las aplicaciones a comprender las similitudes semánticas y léxicas con los datos.
Seleccionar un tipo de búsqueda
Antes de decidir qué tipo de búsqueda se adapta mejor a su caso de uso y conjunto de datos específicos, primero analicemos de forma detallada las diferencias entre cada uno de estos tipos de búsqueda y qué tipo de consultas de búsqueda obtienen como resultado la respuesta más relevante.
Búsqueda de vectores
La búsqueda de vectores, también conocida como búsqueda semántica, implicar recuperar datos (o fragmentos de datos) semánticamente similares para una consulta de búsqueda específica. Estos datos también pueden incluir videos, audio y transcripciones de llamadas. La recuperación de la búsqueda de vectores se realiza mediante la fragmentación de los datos, la creación de integraciones de vectores y la búsqueda de integraciones que sean muy similares en términos semánticos a la consulta de búsqueda.

La búsqueda de vectores funciona bien para las consultas de búsquedas de formato extenso en las que los usuarios buscan información general. Mediante la consulta de búsqueda, se recuperan datos que tienen un puntuaje alto de búsqueda de vectores que se correlaciona con las coincidencias de mayor similitud semántica.
Por ejemplo, la siguiente es una consulta que busca información sobre cómo funciona el navegador Google Chrome. Mediante la consulta de búsqueda, se recuperan fragmentos con el mayor puntuaje de búsqueda de vectores que relaciona la coincidencia de mayor similitud semántica con la consulta de búsqueda.
Consulta:
select c.Chunk_c, v.score_c from vector_search(table(WikiArticle_c_vector_search_2_index__dlm), 'how does Google Chrome internet browser work', '', 100) as v join WikiArticle_c_vector_search_2_ chunk_dlm as c on v.SourceRecordId_c=c.RecordId_c ORDER by v.score_c desc limit 3;
Resultado:

Búsqueda híbrida
La búsqueda híbrida combina los beneficios de la búsqueda de vectores adaptada a la semántica con la capacidad de buscar palabras clave para gestionar el vocabulario del dominio. La búsqueda híbrida combina la información recuperada de ambos tipos de búsquedas y, luego, clasifica los resultados mediante una función de clasificador de fusión para mostrar la información más relevante.
La función de clasificador de fusión de la búsqueda híbrida predeterminada se encuentra optimizada en función de comparaciones referenciales internas para una variedad de tareas basadas en la búsqueda. Los datos de capacitación y evaluación se basan en consultas capturadas reales de la Búsqueda de Einstein y aplicaciones de IA generativa como las Respuestas de búsquedas de Einstein.

La búsqueda híbrida es una opción ideal para las consultas de búsquedas de formato extenso en las que también se incluyen términos de búsqueda específicos. La consulta de búsqueda recupera datos con un puntuaje alto de búsqueda de palabras clave que se correlacionan con coincidencias exactas de palabras clave y con un puntuaje alto de búsqueda de vectores que se correlacionan con las coincidencias semánticas más cercanas. Esto genera la recuperación de datos con un puntuaje alto de búsqueda híbrida que se correlacionan con los resultados de búsqueda más relevantes.
Para el mismo ejemplo de consulta que utilizamos para la búsqueda de vectores, la búsqueda de palabras clave promueve posiciones más altas en la clasificación para contenido más relevante, por lo que ofrece una mejor fundamentación al LLM.
Consulta:
select c.Chunk__c, h.hybrid_score__c, h.keyword_score__c, h.vector_score__c from hybrid_search(table(WikiArticle_c_hybrid_search_2_index__dlm), 'how does Google Chrome internet browser work ?', '', 100) as h join WikiArticle_c_hybrid_search_2_chunk__dlm as c on h.SourceRecordId__c=c.RecordId__c ORDER by h.hybrid_score__c desc limit 2;
Resultado:

En resumen
Cree índices de búsqueda en Data 360 para fundamentar la IA en función de los datos no estructurados, semiestructurados o estructurados de su organización.
Seleccione un tipo de búsqueda que funcione mejor para las consultas de búsqueda de sus aplicaciones y usuarios finales. Si las consultas de sus usuarios se tratan principalmente de información general o si son extensas (más de cinco palabras), una búsqueda de vectores será suficiente para este escenario. La búsqueda de vectores ofrece resultados relevantes cuando una consulta de usuario tiene contenido contextual, que por lo general se trata de consultas más extensas.
Para obtener los resultados más relevantes y precisos que combinen las coincidencias de la búsqueda semántica y la búsqueda de palabras clave de una consulta, cree un índice de búsqueda híbrida.
Recursos
- Ayuda de Salesforce: Datos no estructurados en Data 360
- Ayuda de Salesforce: Búsqueda de vectores
- Ayuda de Salesforce: Búsqueda híbrida
- Publicación de blog de ingeniería de Salesforce: Cómo la búsqueda híbrida de Data Cloud combina la recuperación de palabras clave y vectores para elevar la experiencia de búsqueda
