Skip to main content

Criar uma configuração do índice de pesquisa

Objetivos de aprendizagem

Após esta unidade, você estará apto a:

  • Descrever como a fundamentação e as configurações do índice de pesquisa funcionam no Data Cloud.
  • Criar uma configuração do índice de pesquisa de vetores.
Nota

Nota

Deseja aprender em português (Brasil)? Comece o desafio em um Trailhead Playground de português (Brasil) e use as traduções fornecidas entre parênteses para navegar. Copie e cole somente os valores em inglês porque as validações dos desafios dependem de dados em inglês. Se você não passar no desafio em sua organização de português (Brasil), recomendamos que (1) mude o local para os Estados Unidos, (2) mude o idioma para inglês, seguindo as instruções aqui, e (3) clique novamente no botão “Validar o desafio”.

Consulte o emblema Trailhead no seu idioma para saber mais sobre como aproveitar a experiência de Trailhead em outros idiomas.

Fundamentar a pesquisa sobre dados não estruturados com configurações do índice de pesquisa

Fundamentar a pesquisa em dados estruturados e não estruturados melhora o uso de ferramentas de IA generativa, análise e automação em toda a Salesforce Platform. A pesquisa fundamentada traz dados específicos do cliente para aplicativos como o Agentforce, Tableau e Flow Builder, garantindo que os resultados sejam ajustados com precisão às intenções e contextos dos usuários. Este alinhamento tem como resultado conteúdos mais precisos e relevantes gerados por IA, insights aprofundados a partir da análise e fluxos de trabalho de automação mais eficientes para suas equipes e clientes.

Para fundamentar a pesquisa, é necessário dividir os dados não estruturados em blocos semanticamente apropriados e, a partir desses blocos, criar integrações de vetor, que são representações numéricas de seus dados em blocos. O conteúdo em blocos, armazenado no índice de pesquisa do Data Cloud, é pesquisável e pode ser usado em aplicativos de IA generativa do Einstein (Criador de prompts e Agentforce) e aplicativos de automação (Flow Builder) e análise (Tableau).

Um diagrama gráfico mostra o fluxo para criar e usar um índice de vetor.

Formar blocos de dados não estruturados

Na unidade anterior, falamos sobre como o Data Cloud faz referência a dados não estruturados por meio de objetos do modelo de dados não estruturados (UDMOs). Além disso, você pode formar blocos de UDMOs ou DMOs com campos de texto, como artigos do Salesforce Knowledge. É isso que você vai fazer nesta unidade.

Quando você forma blocos de UDMOs ou DMOs, você divide-os em partes gerenciáveis e semanticamente relevantes. Essas unidades de texto são armazenadas no Data Cloud em objetos do modelo de dados do bloco (CDMOs), que são criados a partir de objetos do modelo de dados ou objetos do modelo de dados não estruturados.

Entender como a formação de blocos funciona

O Data Cloud é compatível com várias estratégias de formação de blocos.

A extração de passagens com base na semântica usa o significado semântico inerente às tags de HTML para agrupar blocos de um documento em passagens. Elementos HTML como cabeçalhos (<h1>, <h2>), listas (<ul>, <ol>) ou texto em negrito (<strong>) que funcionam como subcabeçalhos são considerados limites lógicos para as passagens.

A estratégia de extração de passagens baseada em janelas usa elementos a nível de blocos, como tags <div> e <p> ou texto bruto separado por quebras de linha para agrupar blocos de documentos em passagens. Se um parágrafo não tiver código HTML, a extração será feita no nível da frase.

Saiba mais sobre estratégias de formação de blocos na Ajuda do Salesforce.

Por enquanto, vamos ver o que acontece depois que seus dados são agrupados em blocos.

Criar integrações de vetor a partir de conteúdo em blocos

Após formar blocos de conteúdo, o Data Cloud cria uma integração de vetor, ou seja, uma representação numérica do conteúdo em blocos que pode ser recuperada ou usada nos aplicativos de análise, automação ou IA generativa do Salesforce.

As integrações de vetor são representações numéricas de texto que armazenam relacionamentos entre palavras ou frases. A integração registra o significado semântico do conteúdo para que os blocos de conteúdo, que são semanticamente semelhantes, tenham integrações de vetor semelhantes. Estas representações ajudam as máquinas a processar e a compreender a linguagem de forma eficaz.

No Data Cloud, as integrações de vetor são referenciadas por objetos do modelo de dados de índice (IDMOs), de que falaremos detalhadamente mais adiante nesta unidade.

Nota

Leia mais sobre as integrações de vetor e o conteúdo em blocos na Ajuda do Salesforce.

Criar configurações do índice de pesquisa de vetores

Para preparar os dados não estruturados para a pesquisa, é necessário formar blocos e vetorizá-los. Para isso, crie uma configuração do índice de pesquisa. Convém criar uma configuração do índice de pesquisa para todos os objetos de dados com campos de texto que contenham conceitos informativos, narrativas ou descrições detalhadas que seus usuários pesquisam para encontrar resultados relevantes. Um exemplo desses dados são os artigos do Salesforce Knowledge ou outros documentos de texto (como transcrições de chat) guardados em um armazenamento de blob externo como o Amazon S3.

Criar uma configuração do índice de pesquisa de vetores a partir de artigos do Knowledge

Na unidade anterior, você criou um fluxo de dados e um objeto de data lake no pacote do Knowledge, no conetor do Salesforce CRM, que oferece vários exemplos de artigos do Knowledge.

O objeto Knowledge Article Version (Versão do artigo do Knowledge) é útil para indexar já que pode ser usado para consultar, recuperar ou pesquisar todos os tipos de artigos, dependendo da versão. O objeto Knowledge Article Version (Versão do artigo do Knowledge) inclui estes campos que devem ser indexados para pesquisa.

  • Name (Nome): o nome ou o título do artigo do Knowledge
  • Description (Descrição): a descrição ou resumo do artigo do Knowledge, mapeado em Summary (Resumo)
  • Custom text fields (Campos de texto personalizados): todos os campos de rich text (limite de 131 mil) que contenham dados não estruturados

Criar uma configuração do índice de pesquisa de vetores para o DMO Knowledge Article Version (Versão do artigo do Knowledge)

Você concluirá essas etapas na sua organização do Data Cloud para passar o desafio no final desta unidade.

Nota

Advanced Setup (Configuração avançada) dá a você mais controle sobre as escolhas de formação de blocos e vetorização mas, para este desafio, você usará principalmente os padrões.

  1. Se ainda não o fez, inicie o Playground do Data Cloud.
  2. No App Launcher (Iniciador de aplicativos), selecione Data Cloud.
  3. Clique em Search Index (Índice de pesquisa) | New (Novo).
    Se você não vir a opção Search Index (Índice de pesquisa) na navegação do Data Cloud, clique no menu suspenso More (Mais) e selecione Search Index (Índice de pesquisa).
  4. Clique em Advanced Setup (Configuração avançada) | Next (Avançar).
  5. Na página Select Source Object (Selecionar objeto de origem), selecione Vector Search (Pesquisa de vetor), o DMO Knowledge Article Version (Versão do artigo do Knowledge) e clique em Next (Avançar).
  6. Na página Select Fields to Chunk (Selecionar campos para formar blocos), clique em Manage Fields (Gerenciar campos).
  7. Clique em Select All Fields (Selecionar todos os campos) e em Save (Salvar).
  8. Deixe as estratégias de formação de blocos e clique em Next (Avançar).
  9. Na página Select a Vectorization Strategy (Selecionar uma estratégia de vetorização), deixe a estratégia de vetorização padrão e clique em Next (Avançar).
  10. Na página Select Related Fields for Search Filtering (Selecionar campos relacionados para filtragem de pesquisa), não adicione nenhum campo e clique em Next (Avançar).
  11. Na página Search Index Configuration Details (Detalhes da configuração do índice de pesquisa), substitua Search Index Configuration Name (Nome da configuração do índice de pesquisa) gerado automaticamente por My_kav. (O nome da API da configuração do índice de pesquisa será preenchido automaticamente).
  12. Clique em Save (Salvar).

Pronto! A nova configuração do índice de pesquisa, My_kav, está listada na guia do índice de pesquisa.

Exibir CDMO e IDMOs Knowledge Article Version (Versão do artigo do Knowledge)

Após criar uma configuração do índice de pesquisa, o status é alterado para Submitted (Enviado) e, em seguida, para In Progress (Em andamento) à medida que os dados são processados a partir do DMO/UDMO de origem. Se não houver falhas, o status muda de Submitted (Enviado) para In Progress (Em andamento) e para Ready (Pronto). Você não verá registros no Explorador de dados enquanto o status do índice de pesquisa não for Ready (Pronto).

Nota

O Data Cloud pode demorar vários minutos a processar os dados no índice de pesquisa, mas o tempo pode variar, portanto, pegue algo para beber ou estique as pernas. Quando voltar, clique em Refresh (Atualizar) e verifique se o status do índice de pesquisa é Ready (Pronto).

O conteúdo mais útil de um artigo do Knowledge está no campo Description (Descrição). Normalmente, os artigos de exemplo são tão pequenos que têm apenas um bloco. Isso significa que, para cada registro no CDMO e IDMO Knowledge Article Version (Versão do artigo do Knowledge), há um bloco e um vetor, respectivamente. No entanto, um conteúdo mais extenso pode ter mais registros em cada DMO.

Vamos dar uma olhada rápida no CDMO e IDMO que criamos para o DMO Knowledge Article Version (Versão do artigo do Knowledge).

  1. Confirme se o status do índice de pesquisa é Ready (Pronto).
  2. No Data Cloud, clique em Data Explorer (Explorador de dados).
  3. No menu suspenso Object (Objeto), selecione Data Model Object (Objeto do modelo de dados).
  4. No campo Select an Object (Selecionar um objeto), selecione o bloco My_kav.
    Agora, você já deve conseguir visualizar uma lista com todos os blocos que o Data Cloud criou a partir de exemplos de artigos do Knowledge.
  5. No campo Select an Object (Selecionar um objeto), selecione o índiceMy_kav.
    Agora, você já deve conseguir visualizar uma lista com todos os registros de vetor que o Data Cloud criou a partir de exemplos de artigos do Knowledge.

Você pode usar o CDMO e IDMOs contidos no índice de pesquisa em todo o Salesforce, em aplicativos como o Flow Builder, Agentforce, Criador de prompts e até o Tableau. Ou consultar os documentos de pesquisa de vetores para saber mais sobre como executar consultas de pesquisa de vetores.

Conectar dados não estruturados ao Data Cloud permite fundamentar resultados da pesquisa em uma grande quantidade de dados para uma variedade de casos de uso voltados para o cliente. Ao formar blocos e vetorizar esses dados, você pode usar a pesquisa de vetores nos aplicativos de IA generativa do Einstein, no Flow Builder e até mesmo no Tableau para aprimorar seus recursos de IA, análise e automação.

Recursos

Compartilhe seu feedback do Trailhead usando a Ajuda do Salesforce.

Queremos saber sobre sua experiência com o Trailhead. Agora você pode acessar o novo formulário de feedback, a qualquer momento, no site Ajuda do Salesforce.

Saiba mais Continue compartilhando feedback