Prepare-se para criar seu modelo de dados
Objetivos de aprendizagem
Após concluir esta unidade, você estará apto a:
- Definir os principais termos relacionados à ingestão de dados e modelagem.
- Identificar os benefícios de usar o Data Cloud.
Planejar com antecedência
É impressionante a quantidade de dados que uma pessoa pode gerar. E quantas origens diferentes esses dados podem ter. Mesmo uma simples ida às compras pode gerar dados do cliente relacionados a mensagens de vendas, tráfego na Web, compras, preferências, localização e uma infinidade de outras origens. Como especialista em conscientização de dados, você precisa manter todas essas informações organizadas e acessíveis para ter uma compreensão mais completa dos clientes. Cabe a você garantir que os dados estejam no local certo e criar todas as ligações necessárias para concluir suas tarefas de análise de negócios.
A definição do modelo de dados pode ser complexa. É preciso compreender quais dados são coletados (e como), a estrutura de dados existente e a forma como esses dados se relacionam com outras origens. Além disso, é preciso reunir todos esses dados em uma visão única e acionável do seu cliente. O Data Cloud disponibiliza todas as ferramentas necessárias para criar essa visão única e, posteriormente, engajar os clientes.
Antes de se aprofundar no Data Cloud, pegue uma folha de papel, um caderno, um quadro ou qualquer outro material onde possa escrever. Faça o mapeamento de uma matriz de todos os seus conjuntos de dados em colunas e, em seguida, crie linhas para considerações especiais para cada conjunto de dados.
Conjuntos de dados
Quando definir as colunas da matriz, considere os seguintes fatores.
- Faça um inventário de todas as origens de dados que você queira incorporar:
- Software tradicional
- Banco de dados externo
- CRM
- Comércio eletrônico
- Data lakes
- Bancos de dados de marketing e email
- Atendimento ao cliente
- Dados de interação digital (incluindo a web e dispositivos móveis)
- Análise
- Identifique todos os conjuntos de dados necessários para cada origem dos dados, como dados de comércio eletrônico com conjuntos de dados de detalhes do pedido de vendas e dados de cabeçalho do pedido de vendas.
Considerações especiais
Quando definir as linhas da matriz, considere as características a seguir.
- Entenda a chave primária (o valor que identifica exclusivamente uma linha de dados) de cada conjunto de dados.
- Identifique chaves estrangeiras no conjunto de dados. Essas chaves auxiliares na fonte podem ser vinculadas à chave primária de um conjunto de dados diferente. (Por exemplo, o conjunto de dados de detalhes do pedido de vendas contém uma ID do produto que corresponde ao item comprado. Essa ID do produto está vinculada a uma tabela totalmente diferente com mais detalhes sobre esse produto, como cor ou tamanho. A instância da ID do produto no conjunto de dados de detalhes do pedido de vendas é a chave externa, e a instância da ID do produto no conjunto de dados do produto é a chave primária.)
- Determine se os dados são imutáveis (não sujeitos a alterações após o envio de um registro) ou se o conjunto de dados precisa acomodar atualizações de registros existentes.
- Determine se há transformações que você gostaria de aplicar aos dados. (Por exemplo, você pode usar fórmulas simples para limpar nomes ou executar cálculos baseados em linhas.)
- Analise os atributos, ou campos, provenientes de cada origem de dados. Se o mesmo campo for monitorado em várias origens, decida qual delas é a mais confiável. Posteriormente, você poderá definir uma preferência ordenada de fontes.
- Não se esqueça de ter os detalhes da autenticação à disposição para acessar cada conjunto de dados.
- Tome nota da frequência com que os dados são atualizados.
Do planejamento dos conceitos à criação do modelo
Depois de concluir todas as etapas para entender a implementação de ponta a ponta, o trabalho restante é apenas mecânico. Como você pode ver no diagrama, adotamos uma abordagem em duas fases para importar dados.
- Ingestão de dados: Importe todos os campos de um conjunto de dados exatamente como eles são, sem modificações. Assim, se houver um erro ou se os requisitos comerciais forem alterados durante a configuração, os dados sempre poderão ser revertidos para a forma original. Também é possível estender o conjunto de dados criando campos de fórmula adicionais com o objetivo de limpar a nomenclatura ou efetuar cálculos baseados em linhas. Cada conjunto de dados será representado por um fluxo de dados no Data Cloud.
- Modelagem de dados: Mapeie os fluxos de dados para o modelo de dados para criar uma visão harmonizada entre as fontes.
Ao concluir essa primeira etapa de ingestão de cada conjunto de dados, consulte a matriz e dê uma olhada no que você determinou como origem do conjunto de dados. No Data Cloud, há um local para escrever o nome da origem. Ao lado da fonte, para especificar o conjunto de dados que está importando dessa origem, preencha o Rótulo do objeto e o Nome da API do objeto.
Consulte a chave primária do conjunto de dados na matriz e designe esse campo como a chave primária ao definir o objeto de origem de dados. Deseja aprimorar o conjunto de dados com campos de fórmula adicionais? É nesta fase que você pode aplicar a lógica da fórmula. Lembra quando você indicou se os dados eram imutáveis ou não? Os conjuntos de dados com valores dateTime de eventos podem ser bons candidatos para a categoria de tipo de engajamento no nosso sistema. Esses conjuntos de dados comportamentais são organizados em contêineres baseados em datas. Quando o Data Cloud lê os dados posteriormente para apresentar contagens de segmentações, ele sabe exatamente onde procurar para recuperar as informações rapidamente.
Modelo de dados do Customer 360
Agora, imagine que todos os dados são ingeridos e que cada conjunto de dados tem sua própria linguagem. Como fazemos para que todos eles se entendam? Esses conjuntos de dados devem estar todos em conformidade com a mesma linguagem universal para começar a interagir uns com os outros. É aí que entra a segunda fase, a modelagem de dados. O Data Cloud usa um modelo de dados conhecido como modelo de dados do Customer 360.
O modelo é composto por vários objetos que englobam uma série de áreas de assunto. Essas áreas incluem (mas não se limitam a) Parte, Produto, Pedido de vendas e Engajamento. O modelo é extensível, ou seja, os objetos padrão podem ter atributos personalizados adicionados a eles e novos objetos personalizados podem ser criados com sua contribuição sobre como esse novo objeto se relaciona com outros objetos existentes.
O Modelo de dados do Customer 360 pode ser visto como uma forma de atribuir um contexto semântico aos objetos de origem para que todos possam entender. Por exemplo, não importa se você chama um apartamento, uma casa ou um condomínio de lar, é possível concordar que se trata de um local onde uma pessoa vive. Da mesma forma, você está criando uma camada de dados harmonizada para todas as origens de dados que é abstraída dos objetos de origem subjacentes. Considere os dados de pedidos offline com um campo de pedido de Salescheck_Number e os dados de pedidos online com um campo de pedido de Order_ID. Embora os campos tenham nomes distintos, ambos se referem a uma ID de pedido. Portanto, basta marcar os dois no mapeamento como a ID de pedido de referência do Modelo de dados do Customer 360. Esse processo remove as informações do contexto das várias origens e produz uma nova camada de dados que respeita uma única taxonomia. Independentemente da origem, seus dados são padronizados e utilizáveis nas tarefas. É assim que fazemos com que todos os conjuntos de dados falem a mesma língua.