Preparar seus dados
Objetivos de aprendizagem
Após concluir esta unidade, você estará apto a:
- Explicar como identificar e solucionar desafios de dados.
- Definir requisitos de dados para seu projeto.
A importância da prontidão de dados
Sua organização precisa ter os dados prontos para iniciar um projeto de IA, o que significa que os dados para o projeto devem ser precisos, disponíveis, acessíveis e gerenciados com segurança.
Em muitas organizações, a qualidade dos dados é um grande obstáculo para a implementação de projetos de IA. E com razão! Os dados são a base dos algoritmos de IA, permitindo que eles aprendam, se adaptem e tomem decisões melhores. Dados de alta qualidade podem melhorar a precisão, a eficiência, a confiabilidade e a imparcialidade dos sistemas de IA.
É fundamental solucionar os problemas de qualidade dos dados antes de implementar seu projeto de IA. No entanto, não deixe que a ideia de dados perfeitos interfira no projeto. Muitos projetos ficam retidos no estágio de prontidão de dados porque as equipes estão tentando buscar a perfeição. Em vez disso, trabalhe com sua equipe para identificar metas razoáveis para a prontidão de dados. Você pode usar o estágio de criação para identificar e solucionar quaisquer lacunas em seus dados que afetem o resultado da IA.
Esta unidade apresenta uma visão geral de como avaliar a qualidade de seus dados e prepará-los para um projeto de IA.
Criar um inventário de dados
Becca sabe que a melhor maneira de obter uma visão completa dos dados para seu projeto é criar um inventário de dados. Um inventário de dados ajuda a gerenciar diversos ativos de dados e a identificar possíveis problemas.
Siga estas etapas para criar seu inventário de dados.
- Identificar que dados você precisa em seu projeto.
- Identificar onde os dados são armazenados.
- Responder a algumas perguntas sobre seus dados.
- O tipo de dados é estruturado, não estruturado ou semiestruturado? (Saiba mais sobre classificação de dados em Noções básicas de dados para IA.)
- Com que frequência os dados são atualizados?
- Os dados são atualizados em tempo real, de hora em hora, diariamente, mensalmente ou de forma estática?
- Como os dados podem ser acessados?
- Foram implementados padrões de governança para os dados?
- Quais são algumas considerações sobre dados que podem gerar dificuldades em seu projeto?
- O tipo de dados é estruturado, não estruturado ou semiestruturado? (Saiba mais sobre classificação de dados em Noções básicas de dados para IA.)
Inventário de dados da Coral Cloud
Vamos continuar a falar do projeto de IA de Becca para automatizar o processo de check-in da Coral Cloud Resorts. Para relembrar, aqui está o plano de implementação de Becca, com os principais pontos de dados em negrito.
- Usar um fluxo para criar um registro Guest Event (Evento de hóspede) com base nos dados de reserva mais recentes no Data Cloud.
- Ensinar o Einstein Copilot a iniciar o fluxo por meio de linguagem conversacional. Então, por exemplo, quando a hóspede Sofia Rodriguez chega para começar sua estadia, a equipe pode simplesmente pedir ao Einstein para “fazer o check-in de Sofia Rodriguez” e o Einstein faz o resto!
- Usar o Criador de prompts para gerar um e-mail de boas-vindas personalizado que sugere excursões em que o hóspede possa estar interessado e enviá-lo.
Becca analisa seu plano para determinar quais dados ela precisa para implementar a solução.
- Na etapa 1, ela precisa de dados de reserva. A Coral Cloud usa uma plataforma externa chamada Reserv-o-matic para armazenar dados de reserva, portanto, ela usa o Data Cloud para transferir esses dados para o Salesforce.
- Na etapa 2, ela precisa recuperar dados de reserva com base no nome do cliente. Os dados dos clientes estão disponíveis no Salesforce.
- Na etapa 3, ela precisa de dados sobre excursões anteriores adquiridas pelo hóspede. O histórico de compras dos clientes também está disponível no Salesforce.
Depois de localizar as fontes de dados necessárias, Becca cria um inventário de dados.
Nome dos dados | Fonte de dados | Tipo de dados | Cadência de atualização | Considerações |
---|---|---|---|---|
Registros de contato | CRM | Estruturados | Diária | Datas no formato MM/DD/AA |
Reservas | Reserv-o-matic | Estruturados | Em tempo real | Datas no formato DD/MM/AA. |
Excursões | CRM | Estruturados | Diária | Datas no formato MM/DD/AA |
Capturar os requisitos de dados do projeto
Os requisitos de dados de um projeto são os requisitos básicos necessários para que seu projeto seja bem-sucedido. A compreensão de seus requisitos de dados reduz o trabalho desnecessário.
Avaliar a qualidade dos dados
Dados de alta qualidade criam projetos de IA confiáveis e eficazes. (Saiba mais sobre como avaliar a qualidade dos dados em Qualidade dos dados.) Ao avaliar a qualidade dos dados, identifique onde eles estão falhando. Essas são áreas que justificam uma limpeza de dados. A limpeza de dados é o processo de correção ou remoção de dados incorretos, corrompidos, formatados incorretamente, duplicados ou incompletos em um conjunto de dados. Isso inclui fechar lacunas de dados. A limpeza de dados pode ser demorada, portanto, limpe somente os dados necessários para o seu projeto.
Como Becca observa em seu inventário de dados, as datas de reserva estão no formato DD/MM/AA enquanto os registros de contato e as excursões estão no formato MM/DD/AA. As datas não estão em um formato consistente, portanto, não atendem aos critérios de qualidade. Becca cria um programa rápido para converter todas as datas de reserva para o formato MM/DD/AA.
À medida que Becca soluciona mais alguns problemas com os dados, ela começa a perceber que há dados demais para que tudo fique perfeito. A Coral Cloud é um resort de classe mundial com milhares de hóspedes por ano. Ela se sente desanimada até perceber que estava superestimando os requisitos de dados de seu projeto e limpando reservas de anos anteriores. Ela só precisa limpar reservas futuras, pois essas são as únicas reservas que usarão o check-in automatizado. Becca filtra as reservas por datas futuras. Ao entender os requisitos de dados do projeto, ela agora tem muito menos registros para analisar.
Migrar e integrar dados
Quando você tem dados de várias fontes, precisa migrar seus dados. Isso significa migrar dados de uma fonte para uma fonte central. Se seu projeto for criado no Salesforce, migre seus dados externos para o Salesforce. Depois de migrar os dados, integre-os combinando dados de diferentes fontes em uma visão unificada e abrangente. Migre e integre apenas os dados necessários para seu projeto. Isso ajuda a manter seu projeto gerenciável e evita sobrecarregar seu sistema com dados desnecessários.
Como o projeto de Becca envolve a criação de um registro Guest Event (Evento de hóspede) com base nos dados de reserva no Reserv-o-matic e no registro de contato no Salesforce, ela sabe que precisa associar os dados de reserva ao registro de contato. Caso contrário, o fluxo não saberá qual reserva pertence a qual contato. Becca não quer integrar dados desnecessários, então ela analisa os registros de reserva para identificar quais campos são desnecessários. Ela observa que as reservas têm um campo Notas para que os clientes façam solicitações especiais. Esse campo não tem um formato específico e muitos clientes o deixam em branco. Becca não precisa do campo Notas para criar um registro Guest Event (Evento de hóspede), portanto, ela exclui esse campo antes de migrar as reservas para o Salesforce.
Becca configura um fluxo de dados para migrar dados do Reserv-o-matic. Em seguida, ela usa a Resolução de identidade para fazer a correspondência entre a Sofia no Salesforce e a Sofia no Reserv-o-matic. Agora, o registro de Sofia tem os detalhes de contato no Salesforce e os detalhes de reserva no Reserv-o-matic.
Estabelecer governança de dados
Quanto menos pessoas trabalharem com seus dados, mais consistentes eles serão. Limite a governança às pessoas necessárias. No caso de Becca, ela só dá acesso a ela mesma e a seu gerente.
Plano de análise
Elabore um plano de análise para medir o sucesso. Esse plano é importante para monitorar o desempenho e demonstrar o retorno sobre o investimento (ROI) do seu projeto. Demonstrar o ROI é muito importante para obter apoio para desenvolver seu projeto ou para futuros projetos de IA.
O plano de análise deve estar alinhado com as metas do projeto que você definiu na unidade anterior. Para relembrar, aqui estão as metas do projeto da Becca.
- Reduzir o tempo de check-in em 50%.
- Manter a satisfação do cliente em um nível igual ou superior ao que existia antes do projeto.
Ela decide como coletar e analisar os dados para avaliar se o projeto atingiu essas metas. Becca elabora o seguinte plano.
- Calcular o tempo de tela nos computadores da recepção no final de cada dia. Compare o tempo médio de tela antes e depois de implementar o processo de check-in com IA.
- Disponibilizar uma pesquisa opcional no final da estadia de cada hóspede, na qual ele poderá avaliar sua satisfação. Compare a satisfação média antes e depois de implementar o processo de check-in com IA.
Agora Becca tem uma maneira concreta de demonstrar o impacto de seu projeto.
Solucionar desafios de dados
Depois de definir os requisitos de seu projeto, Becca termina de solucionar os desafios de dados mais importantes que normalmente incluem problemas de qualidade, obstáculos de integração, lacunas nos dados e, às vezes, até mesmo uma infraestrutura de dados desatualizada. Becca sabe que, se não solucionar os problemas logo no início, o novo projeto de IA da Coral Cloud poderá ser desenvolvido com base em dados não confiáveis ou imprecisos.
A Becca está fazendo grandes progressos em seu projeto até agora! Ela manipula dados como uma verdadeira profissional. Na próxima unidade, saiba como Becca avalia os riscos de seu projeto de IA e implementa o projeto de forma confiável e responsável.