Skip to main content

Conheça os tipos de índices de pesquisa no Data Cloud

Objetivos de aprendizagem

Após concluir esta unidade, você estará apto a:

  • Descrever os índices de pesquisa compatíveis no Data Cloud.
  • Identificar qual índice de pesquisa criar para o seu caso de uso.

Usar a pesquisa no Data Cloud para fundamentar a IA

Fundamentar a IA em dados específicos do cliente valoriza a IA generativa em aplicativos, análises e ferramentas de automação em toda a Salesforce Platform. É possível fundamentar a IA com dados não estruturados, semiestruturados ou estruturados. Ao usar a consulta do usuário para recuperar os dados relevantes do CRM para fundamentar o modelo de IA, aplicativos como Agentforce, Tableau e Flow Builder garantem que os resultados sejam otimizados de acordo com a intenção dos usuários. Use a pesquisa no Data Cloud para garantir conteúdos precisos e relevantes gerados por IA, insights aprofundados a partir de análise e fluxos de trabalho de automação mais eficientes para suas equipes e clientes.

No Data Cloud, você pode criar índices de pesquisa com base em qualquer tipo de dados, incluindo dados não estruturados em bases de conhecimento. O Data Cloud é compatível com os seguintes tipos de índice de pesquisa.

  • Pesquisa de vetores
  • Pesquisa híbrida

Para criar índices de pesquisa no Data Cloud, importe seus dados para o Data Cloud. O Data Cloud ingere dados não estruturados, mapeia-os para objetos de modelo de dados (DMO) padrão ou objetos de modelo de dados não estruturados (UDMO) e cria blocos de conteúdo relevantes a partir dos dados. Em seguida, o Data Cloud cria integrações de vetor que permitam criar um índice de pesquisa que ajude os aplicativos a compreender as semelhanças semânticas e lexicais com os dados.

Nota

Para saber as definições de integrações de vetor e de outros termos do Data Cloud, consulte Glossário de termos do Data Cloud.

Selecionar um tipo de pesquisa

Antes de decidir qual tipo de pesquisa é mais adequado para seu caso de uso e conjunto de dados específicos, vamos primeiro analisar como esses tipos de pesquisa diferem entre si e que tipo de consultas de pesquisa produzem as respostas mais relevantes.

Pesquisa de vetores

A pesquisa de vetores, também conhecida como pesquisa semântica, envolve a recuperação de dados (ou blocos de dados) semanticamente semelhantes para uma determinada consulta de pesquisa. Esses dados também podem incluir vídeos, áudio e transcrições de chamadas. A recuperação da pesquisa de vetores é feita formando blocos de dados, criando integrações de vetor e pesquisando integrações de vetor com semelhanças semânticas próximas à consulta de pesquisa.

Dados de várias fontes ingeridos no Data Cloud. O Data Cloud forma blocos de dados e cria integrações de vetor para criar um índice de vetor. Aplicativos C360 como Tableau, Agentforce, entre outros, consultam esse índice de vetor e obtêm resultados relevantes.

A pesquisa de vetores funciona bem para consultas de pesquisa longas, em que os usuários procuram informações gerais. A consulta de pesquisa recupera dados com uma pontuação de pesquisa de vetores elevada que se correlaciona com as correspondências semânticas mais próximas.

Por exemplo, aqui está uma consulta que procura informações sobre como funciona o navegador Google Chrome. A consulta de pesquisa recupera os blocos com a pontuação de pesquisa de vetores mais alta, que se relaciona com a correspondência semântica mais próxima da consulta de pesquisa.

Consulta:

select c.Chunk_c, v.score_c from vector_search(table(WikiArticle_c_vector_search_2_index__dlm),
 'how does Google Chrome internet browser work', '', 100) as v join WikiArticle_c_vector_search_2_
chunk_dlm as c on v.SourceRecordId_c=c.RecordId_c ORDER by v.score_c desc limit 3;

Resultado:

A imagem mostra os resultados da consulta para uma pesquisa de vetores, por ordem decrescente da pontuação da pesquisa de vetores. Os blocos de dados que têm a correspondência semântica mais próxima da consulta de pesquisa aparecem no topo dos resultados.

Pesquisa híbrida

A pesquisa híbrida combina os pontos fortes da pesquisa de vetores semanticamente consciente com a capacidade de pesquisa por palavra-chave para lidar com o vocabulário do domínio. A pesquisa híbrida combina as informações recuperadas de ambos os tipos de pesquisa e, em seguida, classifica os resultados usando uma função de classificação por fusão para mostrar as informações mais relevantes.

A função padrão de classificação por fusão da pesquisa híbrida é otimizada em parâmetros internos para várias tarefas baseadas em pesquisa. Os dados de treinamento e avaliação são baseados em consultas reais capturadas do Einstein Search e de aplicativos de IA generativa, como o Einstein Search Answers.

Dados de várias fontes ingeridos no Data Cloud. O Data Cloud forma blocos de dados e cria integrações de vetor. A partir dos dados em blocos e vetorizados, o Data Cloud cria um índice de pesquisa de vetores e um índice de pesquisa por palavra-chave. A função de classificação por fusão da pesquisa híbrida classifica então o resultado recuperado e fornece a resposta mais relevante para os aplicativos C360 que consultam os dados.

A pesquisa híbrida é uma ótima opção para consultas de pesquisa longas, em que também são incluídos termos de pesquisa específicos. A consulta de pesquisa recupera dados com uma pontuação de pesquisa por palavra-chave elevada, que se correlaciona com correspondências exatas de palavras-chave, e com uma pontuação de pesquisa de vetores elevada, que se correlaciona com as correspondências semânticas mais próximas. Isso resulta na recuperação de dados com uma pontuação de pesquisa híbrida elevada, que se correlaciona com os resultados de pesquisa mais relevantes.

Para o mesmo exemplo de consulta que usamos para a pesquisa de vetores, a pesquisa por palavra-chave promove posições de classificação mais altas para conteúdos mais relevantes, proporcionando assim ao LLM uma fundamentação melhor.

Consulta:

select c.Chunk__c, h.hybrid_score__c, h.keyword_score__c, h.vector_score__c from
hybrid_search(table(WikiArticle_c_hybrid_search_2_index__dlm), 'how does Google Chrome
internet browser work ?', '', 100) as h join WikiArticle_c_hybrid_search_2_chunk__dlm
as c on h.SourceRecordId__c=c.RecordId__c ORDER by h.hybrid_score__c desc limit 2;

Resultado:

A imagem mostra os resultados da consulta para uma pesquisa híbrida, por ordem decrescente da pontuação da pesquisa híbrida. Os blocos de dados que têm a correspondência semântica e por palavra-chave mais próximas da consulta de pesquisa aparecem no topo dos resultados.

Nota

Para a mesma consulta no exemplo do Google Chrome usado, a pesquisa híbrida é muito mais eficaz do que uma pesquisa de vetores pura, pois retorna blocos que incluem informações sobre como os navegadores funcionam e detalhes específicos sobre o navegador Google Chrome.

Em resumo

Crie índices de pesquisa no Data Cloud para fundamentar a IA nos dados não estruturados, semiestruturados ou estruturados da sua organização.

Selecione um tipo de pesquisa que seja mais adequado para as consultas de pesquisa dos seus usuários finais e aplicativos. Se as consultas dos seus usuários forem principalmente sobre informações gerais ou forem longas (tiverem mais de cinco palavras), então uma pesquisa de vetores é suficiente para esse cenário. A pesquisa de vetores produz resultados relevantes quando a consulta do usuário tem conteúdo contextual, o que geralmente ocorre em consultas mais longas.

Para obter os resultados mais precisos e relevantes que combinam correspondências de pesquisa semântica e correspondências de pesquisa por palavra-chave para uma consulta, crie um índice de pesquisa híbrido.

Recursos

Compartilhe seu feedback do Trailhead usando a Ajuda do Salesforce.

Queremos saber sobre sua experiência com o Trailhead. Agora você pode acessar o novo formulário de feedback, a qualquer momento, no site Ajuda do Salesforce.

Saiba mais Continue compartilhando feedback