Criar uma configuração do índice de pesquisa
Objetivos de aprendizagem
Após esta unidade, você estará apto a:
- Descrever como a fundamentação e as configurações do índice de pesquisa funcionam no Data Cloud.
- Criar uma configuração do índice de pesquisa de vetores.
Fundamentar a pesquisa sobre dados não estruturados com configurações do índice de pesquisa
Fundamentar a pesquisa em dados estruturados e não estruturados melhora o uso de ferramentas de IA generativa, análise e automação em toda a Salesforce Platform. A pesquisa fundamentada traz dados específicos do cliente para aplicativos como o Agentforce, Tableau e Flow Builder, garantindo que os resultados sejam ajustados com precisão às intenções e contextos dos usuários. Este alinhamento tem como resultado conteúdos mais precisos e relevantes gerados por IA, insights aprofundados a partir da análise e fluxos de trabalho de automação mais eficientes para suas equipes e clientes.
Para fundamentar a pesquisa, é necessário dividir os dados não estruturados em blocos semanticamente apropriados e, a partir desses blocos, criar integrações de vetor, que são representações numéricas de seus dados em blocos. O conteúdo em blocos, armazenado no índice de pesquisa do Data Cloud, é pesquisável e pode ser usado em aplicativos de IA generativa do Einstein (Criador de prompts e Agentforce) e aplicativos de automação (Flow Builder) e análise (Tableau).
Formar blocos de dados não estruturados
Na unidade anterior, falamos sobre como o Data Cloud faz referência a dados não estruturados por meio de objetos do modelo de dados não estruturados (UDMOs). Além disso, você pode formar blocos de UDMOs ou DMOs com campos de texto, como artigos do Salesforce Knowledge. É isso que você vai fazer nesta unidade.
Quando você forma blocos de UDMOs ou DMOs, você divide-os em partes gerenciáveis e semanticamente relevantes. Essas unidades de texto são armazenadas no Data Cloud em objetos do modelo de dados do bloco (CDMOs), que são criados a partir de objetos do modelo de dados ou objetos do modelo de dados não estruturados.
Entender como a formação de blocos funciona
O Data Cloud é compatível com várias estratégias de formação de blocos.
A extração de passagens com base na semântica usa o significado semântico inerente às tags de HTML para agrupar blocos de um documento em passagens. Elementos HTML como cabeçalhos (<h1>, <h2>), listas (<ul>, <ol>) ou texto em negrito (<strong>) que funcionam como subcabeçalhos são considerados limites lógicos para as passagens.
A estratégia de extração de passagens baseada em janelas usa elementos a nível de blocos, como tags <div> e <p> ou texto bruto separado por quebras de linha para agrupar blocos de documentos em passagens. Se um parágrafo não tiver código HTML, a extração será feita no nível da frase.
Saiba mais sobre estratégias de formação de blocos na Ajuda do Salesforce.
Por enquanto, vamos ver o que acontece depois que seus dados são agrupados em blocos.
Criar integrações de vetor a partir de conteúdo em blocos
Após formar blocos de conteúdo, o Data Cloud cria uma integração de vetor, ou seja, uma representação numérica do conteúdo em blocos que pode ser recuperada ou usada nos aplicativos de análise, automação ou IA generativa do Salesforce.
As integrações de vetor são representações numéricas de texto que armazenam relacionamentos entre palavras ou frases. A integração registra o significado semântico do conteúdo para que os blocos de conteúdo, que são semanticamente semelhantes, tenham integrações de vetor semelhantes. Estas representações ajudam as máquinas a processar e a compreender a linguagem de forma eficaz.
No Data Cloud, as integrações de vetor são referenciadas por objetos do modelo de dados de índice (IDMOs), de que falaremos detalhadamente mais adiante nesta unidade.
Criar configurações do índice de pesquisa de vetores
Para preparar os dados não estruturados para a pesquisa, é necessário formar blocos e vetorizá-los. Para isso, crie uma configuração do índice de pesquisa. Convém criar uma configuração do índice de pesquisa para todos os objetos de dados com campos de texto que contenham conceitos informativos, narrativas ou descrições detalhadas que seus usuários pesquisam para encontrar resultados relevantes. Um exemplo desses dados são os artigos do Salesforce Knowledge ou outros documentos de texto (como transcrições de chat) guardados em um armazenamento de blob externo como o Amazon S3.
Criar uma configuração do índice de pesquisa de vetores a partir de artigos do Knowledge
Na unidade anterior, você criou um fluxo de dados e um objeto de data lake no pacote do Knowledge, no conetor do Salesforce CRM, que oferece vários exemplos de artigos do Knowledge.
O objeto Knowledge Article Version (Versão do artigo do Knowledge) é útil para indexar já que pode ser usado para consultar, recuperar ou pesquisar todos os tipos de artigos, dependendo da versão. O objeto Knowledge Article Version (Versão do artigo do Knowledge) inclui estes campos que devem ser indexados para pesquisa.
-
Name (Nome): o nome ou o título do artigo do Knowledge
-
Description (Descrição): a descrição ou resumo do artigo do Knowledge, mapeado em Summary (Resumo)
-
Custom text fields (Campos de texto personalizados): todos os campos de rich text (limite de 131 mil) que contenham dados não estruturados
Criar uma configuração do índice de pesquisa de vetores para o DMO Knowledge Article Version (Versão do artigo do Knowledge)
Você concluirá essas etapas na sua organização do Data Cloud para passar o desafio no final desta unidade.
- Se ainda não o fez, inicie o Playground do Data Cloud.
- No App Launcher (Iniciador de aplicativos), selecione Data Cloud.
- Clique em Search Index (Índice de pesquisa) | New (Novo).
Se você não vir a opção Search Index (Índice de pesquisa) na navegação do Data Cloud, clique no menu suspenso More (Mais) e selecione Search Index (Índice de pesquisa).
- Clique em Advanced Setup (Configuração avançada) | Next (Avançar).
- Na página Select Source Object (Selecionar objeto de origem), selecione Vector Search (Pesquisa de vetor), o DMO Knowledge Article Version (Versão do artigo do Knowledge) e clique em Next (Avançar).
- Na página Select Fields to Chunk (Selecionar campos para formar blocos), clique em Manage Fields (Gerenciar campos).
- Clique em Select All Fields (Selecionar todos os campos) e em Save (Salvar).
- Deixe as estratégias de formação de blocos e clique em Next (Avançar).
- Na página Select a Vectorization Strategy (Selecionar uma estratégia de vetorização), deixe a estratégia de vetorização padrão e clique em Next (Avançar).
- Na página Select Related Fields for Search Filtering (Selecionar campos relacionados para filtragem de pesquisa), não adicione nenhum campo e clique em Next (Avançar).
- Na página Search Index Configuration Details (Detalhes da configuração do índice de pesquisa), substitua Search Index Configuration Name (Nome da configuração do índice de pesquisa) gerado automaticamente por
My_kav
. (O nome da API da configuração do índice de pesquisa será preenchido automaticamente).
- Clique em Save (Salvar).
Pronto! A nova configuração do índice de pesquisa, My_kav, está listada na guia do índice de pesquisa.
Exibir CDMO e IDMOs Knowledge Article Version (Versão do artigo do Knowledge)
Após criar uma configuração do índice de pesquisa, o status é alterado para Submitted (Enviado) e, em seguida, para In Progress (Em andamento) à medida que os dados são processados a partir do DMO/UDMO de origem. Se não houver falhas, o status muda de Submitted (Enviado) para In Progress (Em andamento) e para Ready (Pronto). Você não verá registros no Explorador de dados enquanto o status do índice de pesquisa não for Ready (Pronto).
O conteúdo mais útil de um artigo do Knowledge está no campo Description (Descrição). Normalmente, os artigos de exemplo são tão pequenos que têm apenas um bloco. Isso significa que, para cada registro no CDMO e IDMO Knowledge Article Version (Versão do artigo do Knowledge), há um bloco e um vetor, respectivamente. No entanto, um conteúdo mais extenso pode ter mais registros em cada DMO.
Vamos dar uma olhada rápida no CDMO e IDMO que criamos para o DMO Knowledge Article Version (Versão do artigo do Knowledge).
- Confirme se o status do índice de pesquisa é Ready (Pronto).
- No Data Cloud, clique em Data Explorer (Explorador de dados).
- No menu suspenso Object (Objeto), selecione Data Model Object (Objeto do modelo de dados).
- No campo Select an Object (Selecionar um objeto), selecione o bloco My_kav.
Agora, você já deve conseguir visualizar uma lista com todos os blocos que o Data Cloud criou a partir de exemplos de artigos do Knowledge.
- No campo Select an Object (Selecionar um objeto), selecione o índiceMy_kav.
Agora, você já deve conseguir visualizar uma lista com todos os registros de vetor que o Data Cloud criou a partir de exemplos de artigos do Knowledge.
Você pode usar o CDMO e IDMOs contidos no índice de pesquisa em todo o Salesforce, em aplicativos como o Flow Builder, Agentforce, Criador de prompts e até o Tableau. Ou consultar os documentos de pesquisa de vetores para saber mais sobre como executar consultas de pesquisa de vetores.
Conectar dados não estruturados ao Data Cloud permite fundamentar resultados da pesquisa em uma grande quantidade de dados para uma variedade de casos de uso voltados para o cliente. Ao formar blocos e vetorizar esses dados, você pode usar a pesquisa de vetores nos aplicativos de IA generativa do Einstein, no Flow Builder e até mesmo no Tableau para aprimorar seus recursos de IA, análise e automação.