Conheça os tipos de índices de pesquisa no Data Cloud
Objetivos de aprendizagem
Após concluir esta unidade, você estará apto a:
- Descrever os índices de pesquisa compatíveis no Data Cloud.
- Identificar qual índice de pesquisa criar para o seu caso de uso.
Usar a pesquisa no Data Cloud para fundamentar a IA
Fundamentar a IA em dados específicos do cliente valoriza a IA generativa em aplicativos, análises e ferramentas de automação em toda a Salesforce Platform. É possível fundamentar a IA com dados não estruturados, semiestruturados ou estruturados. Ao usar a consulta do usuário para recuperar os dados relevantes do CRM para fundamentar o modelo de IA, aplicativos como Agentforce, Tableau e Flow Builder garantem que os resultados sejam otimizados de acordo com a intenção dos usuários. Use a pesquisa no Data Cloud para garantir conteúdos precisos e relevantes gerados por IA, insights aprofundados a partir de análise e fluxos de trabalho de automação mais eficientes para suas equipes e clientes.
No Data Cloud, você pode criar índices de pesquisa com base em qualquer tipo de dados, incluindo dados não estruturados em bases de conhecimento. O Data Cloud é compatível com os seguintes tipos de índice de pesquisa.
- Pesquisa de vetores
- Pesquisa híbrida
Para criar índices de pesquisa no Data Cloud, importe seus dados para o Data Cloud. O Data Cloud ingere dados não estruturados, mapeia-os para objetos de modelo de dados (DMO) padrão ou objetos de modelo de dados não estruturados (UDMO) e cria blocos de conteúdo relevantes a partir dos dados. Em seguida, o Data Cloud cria integrações de vetor que permitam criar um índice de pesquisa que ajude os aplicativos a compreender as semelhanças semânticas e lexicais com os dados.
Selecionar um tipo de pesquisa
Antes de decidir qual tipo de pesquisa é mais adequado para seu caso de uso e conjunto de dados específicos, vamos primeiro analisar como esses tipos de pesquisa diferem entre si e que tipo de consultas de pesquisa produzem as respostas mais relevantes.
Pesquisa de vetores
A pesquisa de vetores, também conhecida como pesquisa semântica, envolve a recuperação de dados (ou blocos de dados) semanticamente semelhantes para uma determinada consulta de pesquisa. Esses dados também podem incluir vídeos, áudio e transcrições de chamadas. A recuperação da pesquisa de vetores é feita formando blocos de dados, criando integrações de vetor e pesquisando integrações de vetor com semelhanças semânticas próximas à consulta de pesquisa.
A pesquisa de vetores funciona bem para consultas de pesquisa longas, em que os usuários procuram informações gerais. A consulta de pesquisa recupera dados com uma pontuação de pesquisa de vetores elevada que se correlaciona com as correspondências semânticas mais próximas.
Por exemplo, aqui está uma consulta que procura informações sobre como funciona o navegador Google Chrome. A consulta de pesquisa recupera os blocos com a pontuação de pesquisa de vetores mais alta, que se relaciona com a correspondência semântica mais próxima da consulta de pesquisa.
Consulta:
select c.Chunk_c, v.score_c from vector_search(table(WikiArticle_c_vector_search_2_index__dlm), 'how does Google Chrome internet browser work', '', 100) as v join WikiArticle_c_vector_search_2_ chunk_dlm as c on v.SourceRecordId_c=c.RecordId_c ORDER by v.score_c desc limit 3;
Resultado:
Pesquisa híbrida
A pesquisa híbrida combina os pontos fortes da pesquisa de vetores semanticamente consciente com a capacidade de pesquisa por palavra-chave para lidar com o vocabulário do domínio. A pesquisa híbrida combina as informações recuperadas de ambos os tipos de pesquisa e, em seguida, classifica os resultados usando uma função de classificação por fusão para mostrar as informações mais relevantes.
A função padrão de classificação por fusão da pesquisa híbrida é otimizada em parâmetros internos para várias tarefas baseadas em pesquisa. Os dados de treinamento e avaliação são baseados em consultas reais capturadas do Einstein Search e de aplicativos de IA generativa, como o Einstein Search Answers.
A pesquisa híbrida é uma ótima opção para consultas de pesquisa longas, em que também são incluídos termos de pesquisa específicos. A consulta de pesquisa recupera dados com uma pontuação de pesquisa por palavra-chave elevada, que se correlaciona com correspondências exatas de palavras-chave, e com uma pontuação de pesquisa de vetores elevada, que se correlaciona com as correspondências semânticas mais próximas. Isso resulta na recuperação de dados com uma pontuação de pesquisa híbrida elevada, que se correlaciona com os resultados de pesquisa mais relevantes.
Para o mesmo exemplo de consulta que usamos para a pesquisa de vetores, a pesquisa por palavra-chave promove posições de classificação mais altas para conteúdos mais relevantes, proporcionando assim ao LLM uma fundamentação melhor.
Consulta:
select c.Chunk__c, h.hybrid_score__c, h.keyword_score__c, h.vector_score__c from hybrid_search(table(WikiArticle_c_hybrid_search_2_index__dlm), 'how does Google Chrome internet browser work ?', '', 100) as h join WikiArticle_c_hybrid_search_2_chunk__dlm as c on h.SourceRecordId__c=c.RecordId__c ORDER by h.hybrid_score__c desc limit 2;
Resultado:
Em resumo
Crie índices de pesquisa no Data Cloud para fundamentar a IA nos dados não estruturados, semiestruturados ou estruturados da sua organização.
Selecione um tipo de pesquisa que seja mais adequado para as consultas de pesquisa dos seus usuários finais e aplicativos. Se as consultas dos seus usuários forem principalmente sobre informações gerais ou forem longas (tiverem mais de cinco palavras), então uma pesquisa de vetores é suficiente para esse cenário. A pesquisa de vetores produz resultados relevantes quando a consulta do usuário tem conteúdo contextual, o que geralmente ocorre em consultas mais longas.
Para obter os resultados mais precisos e relevantes que combinam correspondências de pesquisa semântica e correspondências de pesquisa por palavra-chave para uma consulta, crie um índice de pesquisa híbrido.
Recursos
- Ajuda do Salesforce: Dados não estruturados no Data Cloud
- Ajuda do Salesforce: Pesquisa de vetores
- Ajuda do Salesforce: Pesquisa híbrida
- Publicação do blog Engenharia da Salesforce : Como a pesquisa híbrida no Data Cloud combina recuperação por palavra-chave e por vetores para melhorar a experiência de pesquisa