Skip to main content
Group

Developer Group, Varginha, BR

Grupo de desenvolvedores Salesforce da cidade de Varginha. Nosso objetivo é fomentar a comunidade Salesforce na região do Sul de Minas. Aqui vamos realizar discussões técnicas e promover eventos para compartilhar o conhecimento a fim de angariar novos membros expandindo a comunidade. Qualquer entusiasta desta ferramenta CRM incrível é bem vindo no nosso grupo. Fell free to join us!

➡ Inscrições abertas para o DXP Training Camp! ⬅

 

Mais corre. 🏃🏻‍♂️‍➡️🏃🏻‍♀️‍➡️

Aberto ontem o bootcamp da DreamExperience. Foram disponibilizadas 300 vagas, já há mais de 200 inscritos.

 

Este ano, terá uma grande novidade: a primeira trilha dedicada à carreira de Analistas Funcionais, voltada para mulheres. E, claro, haverá a trilha para desenvolvedores e desenvolvedoras.

 

O Training Camp é totalmente gratuito e oferece uma imersão de 4 semanas com tutoria dos especialistas da DreamExperience. Ao final, você terá a chance de fazer parte do time DreamExperience.

 

Pronto para embarcar nessa jornada de conhecimento? 😉

 

Para mais informações e inscrições, acesse os links de cada trilha.

 

DXP Training Camp - Analista Funcional

 

DXP Training Camp - Dev

 

@Treinamento Salesforce.com no Brasil

@Business Analysts Brasil

@Admin Group, Sao Paulo, BR

@Comunidade Salesforce Brasil

@Developer Group, Porto Alegre, BR

@Salesforce com Dendê

@Admin Group, Joinville, BR

@Admin Group, Vitoria, BR

@Admin Group, Belo Horizonte, BR

@Developer Group, Varginha, BR

@Salesforce, Florianópolis, BR

@TVB201 - Português Brasil

5 comments
0/9000
1 comment
0/9000

A Mais1Code em parceria com a BOLDFORCE estão oferecendo um curso de SALESFORCE com certificação em CRM e IA on-line, e Soft-Skills, todas as terças das 19:00 ás 20:00 (horário de Brasília) com certificação gratuita. 

Para quem?

Para pessoas pretas com idade entre 18 e 35 anos.

Inscrições até 19/07 (sexta) no form.

 

Caso prefiram, me conecte no Linkedin.

 

@Treinamento Salesforce.com no Brasil

@Business Analysts Brasil

@Developer Group, Porto Alegre, BR

@Admin Group, Sao Paulo, BR

@Comunidade Salesforce Brasil

@Salesforce com Dendê

@Admin Group, Joinville, BR

@Admin Group, Vitoria, BR

@Admin Group, Belo Horizonte, BR

@Developer Group, Varginha, BR

@TVB201 - Português Brasil

@Salesforce, Florianópolis, BR

2 comments
0/9000

Programa Wave Brazil - Deloitte & Salesforce - Career Changers TA Cohort

Você sabia que 9.3 milhões de empregos serão criados no ecossistema global da Salesforce até 2026? Se você deseja começar no setor de tecnologia trabalhando com #Salesforce, o Programa Wave é para você!

A Deloitte Brasil e a Salesforce estão trabalhando em parceria no Programa Wave para ajudar as pessoas de comunidades que tem baixa representação na área a se desenvolverem profissionalmente no ecossistema Salesforce, seja iniciando uma carreira ou se reinventando. 

O objetivo do programa é ajudar as pessoas a obterem as certificações de Salesforce Associate e Salesforce Administrator e se posicionarem no mercado de trabalho para obter uma vaga na área.

Conheça o Programa Wave!

O programa Wave consiste numa jornada de apoio ao seu desenvolvimento que inclui:

·         Talent Aliance Career Cohort – Career Changers in Brazil proporcionado pela equipe de mentores da Deloitte Brasil. O programa inclui 12 sessões semanais de uma hora, de 22 de julho a 7 de outubro, sempre nas segundas-feiras, das 6 às 7 da tarde, horário de Brasília. Nestas sessões a equipe da Deloitte vai te preparar para se posicionar no mercado e obter o seu primeiro emprego no ecossistema Salesforce. Tópicos incluem como elaborar o seu perfil no LinkedIn e seu curriculum, como se preparar para as entrevistas, e muito mais. Além disso é uma oportunidade valiosa de networking com a equipe da Deloitte e outros participantes. 

·         Clicked Experience – Uma oportunidade incrível de aplicar os seus conhecimentos em uma experiência prática com as equipes do Clicked e da Deloitte. São duas sessões semanais de 8 de agosto a 6 de setembro (datas a serem confirmadas). 

·         Simulação de entrevista – 30% dos participantes que concluíram o programa terão oportunidade de ter uma entrevista simulada, proporcionada pela equipe da Deloitte e receber feedback. Os participantes selecionados serão os que tiveram melhor atendimento e engajamento. Alguns participantes das entrevistas simuladas poderão ser selecionados pela equipe de RH para uma segunda etapa de entrevistas, desta vez para um cargo real e com oportunidade de contratação. 

Inscrições no link

 

@Treinamento Salesforce.com no Brasil

@Business Analysts Brasil

@Admin Group, Sao Paulo, BR

@Comunidade Salesforce Brasil

@Developer Group, Porto Alegre, BR

@Salesforce com Dendê

@Admin Group, Joinville, BR

@Admin Group, Vitoria, BR

@Admin Group, Belo Horizonte, BR

@Developer Group, Varginha, BR

@TVB201 - Português Brasil

2 comments
  1. Jul 12, 2024, 2:12 AM
    Boa tarde! Acho que o prazo pra inscrição acabou, semana passada me inscrevi normalmente por esse link. :/
0/9000

Hoje venho trazer boas notícias para você, que como eu, atua em alguma plataforma de CRM (Customer Relationship Management).

 

Você só está sozinho se assim deseja permanecer.

 

Existe uma comunidade para nós profissionais de CRM, independente da plataforma que trabalhamos.

 

Ingressando nela, poderás aprimorar os seus conhecimentos e/ou aproveitar dos vários parceiros comerciais com os quais mantêm convênio.

 

Não há custos para o ingresso.

 

Pode tomar conhecimento através da página no Linkedin.

 

Ou ainda no Linktree.

 

Eu estou aproveitando a mentoria que foi oferecia gratuitamente.

Um dos diversos programas mantidos.

 

Tem sido bastante enriquecedor os encontros com a minha mentora Heloisa de Oliveira Campanhã

 

Obrigado mentora, obrigado CRM Academy Community.

 

Esta publicação no Linkedin.

 

@Treinamento Salesforce.com no Brasil

@Business Analysts Brasil

@Admin Group, Joinville, BR

@Admin Group, Sao Paulo, BR

@Admin Group, Vitoria, BR

@Comunidade Salesforce Brasil

@Developer Group, Porto Alegre, BR

@Salesforce com Dendê

@Admin Group, Belo Horizonte, BR

@Developer Group, Varginha, BR

@Salesforce, Florianópolis, BR

@TVB201 - Português Brasil

0/9000

Olá DEVs Salesforce!!!

A #NTTDATA está abrindo o tradicional programa de formação do ano de 2024!!! 💙 🚀 

Esse ano eles estão buscando pessoas que residam em 

#Florianópolis/SC e região ou #Recife/PE e região com muita vontade de se desenvolver na área que:

- Sejam graduadas ou estejam cursando graduação na área de TI ou afins (exceto gestão);  E que já possuam alguma dessas vivências:

- Experiência prática (a partir de 6 meses como DEV na plataforma Salesforce); OU

- Certificação Salesforce (exceto Associate); OU

- Já tenha mais de 70.000 pontos na Trailhead.

 

O programa de formação tem como objetivo buscar profissionais apaixonados e que estejam se preparando para atuar como #DEV Salesforce.

As inscrições já estão abertas e ficarão disponíveis até 21/06/24, às 18H.

 

📌 Uma dica super importante: Coloque a sua cidade e o link da Trailhead no seu CV! Esses critérios são fundamentais para a análise!!

 

Os profissionais aprovados no processo serão contratados no regime CLT, com previsão de início em 22/07 e participarão de um programa de capacitação, estando aptos para atuar nos projetos dos nossos clientes.

 

Se você tem interesse em embarcar nessa jornada de muito aprendizado, acesso a publicação no Linkedin que te levará para o site da inscrição.

 

@Treinamento Salesforce.com no Brasil

@Business Analysts Brasil

@Admin Group, Joinville, BR

@Admin Group, Sao Paulo, BR

@Admin Group, Vitoria, BR

@Comunidade Salesforce Brasil

@Developer Group, Porto Alegre, BR

@Salesforce com Dendê

@Admin Group, Belo Horizonte, BR

@Developer Group, Varginha, BR

@Salesforce, Florianópolis, BR

@TVB201 - Português Brasil

1 comment
0/9000

Fala pessoal!

 

Nesta postagem continuaremos sobre o assunto, A Qualidade de Dados.

 

10. Normalização e Padronização

Normalização e padronização são as técnicas finais de pré-processamento de dados sobre as quais falaremos hoje. Exploremos o que eles envolvem, como diferem e exemplos de sua aplicação.

A normalização é uma técnica que ajusta valores medidos em diferentes escalas para uma escala comum, geralmente entre 0 e 1. É especialmente útil quando os parâmetros possuem faixas variáveis. A padronização, por outro lado, transforma os dados para terem média zero e desvio padrão de um, tornando-a essencial para algoritmos que assumem que os dados são normalmente distribuídos.

As diferenças entre essas duas técnicas podem determinar quando cada uma deve ser usada:

A normalização é geralmente usada quando o conjunto de dados não segue uma distribuição gaussiana. Pode ser impactado por valores discrepantes, mas é menos sensível a eles do que a padronização.

A padronização é normalmente usada em cenários que exigem que o conjunto de dados tenha uma distribuição gaussiana, formando a base para técnicas como análise de componentes principais e regressão linear.

Exemplos:

*** Normalização

Ajustando salários que vão de 30.000 para 90.000 em um conjunto de dados fiquem entre 0 e 1 para comparar os rendimentos relativos dos funcionários, independentemente da grande diferença.

Redimensionamento de idades em um conjunto de dados onde os usuários variam de 10 a 60 anos para um estudo de análise de marketing.

Normalização de distâncias percorridas em quilômetros por caminhões de entrega em uma empresa de logística para padronizar avaliações de rotas.

 

*** Estandardização

Padronizar as pontuações dos testes dos alunos para avaliar estatisticamente o desempenho em várias escolas ou universidades.

Transformando recursos como altura e peso em dados de saúde para prever riscos à saúde usando algoritmos de aprendizado de máquina.

Equacionar medidas de volatilidade de diferentes ações em modelos financeiros para avaliar com precisão o risco relativo.

 

Desenvolver um conjunto de habilidades tanto em normalização quanto em padronização não apenas melhora o desempenho e a precisão de seus modelos de dados, mas também contribui para sua versatilidade como profissional de dados pronto para gerenciar uma diversidade de conjuntos de dados e desafios.

 

Além disso, é importante visualizar seus dados antes e após aplicar essas transformações para compreender completamente seus efeitos e decidir informada sobre qual método melhor atende às suas necessidades específicas. Lembre-se de que, embora a normalização seja mais suscetível a ser distorto por valores discrepantes, a padronização exige que os dados sigam idealmente uma distribuição normal para obter resultados ideais.

 

Equívocos e desafios comuns

A limpeza de dados é fundamental para uma análise precisa, mas não é uma tarefa única. À medida que novas informações entram em seu sistema, você precisará limpar e atualizar regularmente seus dados para manter a qualidade.

 

Quais são alguns desafios comuns que você pode enfrentar?

Formatos de dados inconsistentes em conjuntos de dados que exigem alinhamento cuidadoso.

Registros duplicados que precisam ser identificados e mesclados ou removidos.

Garantir a privacidade dos dados e cumprir as regulamentações sem comprometer a integridade dos dados.

Esses problemas podem complicar o processo de limpeza e afetar a confiabilidade dos seus dados. Por exemplo, se os nomes dos clientes forem inseridos em formatos diferentes nos bancos de dados de vendas, levará algum tempo para padronizá-los antes que você possa analisar adequadamente as tendências dos clientes.

Felizmente, existem estratégias que você pode usar para agilizar a limpeza de dados. Considere o uso de ferramentas de automação para lidar com tarefas repetitivas de formatação. A criação de sistemas de codificação padronizados também pode ajudar a manter os dados consistentes. Ao compreender a realidade da limpeza de dados, você estará bem preparado para garantir conjuntos de dados precisos e confiáveis ​​no mundo real.

 

Como começar com habilidades de limpeza de dados.

Pronto para começar a limpeza? Veja como começar com o pé direito:

Construa uma base sólida

Primeiro, certifique-se de entender o básico. Conheça seus dados observando coisas como médias, medianas e valores ausentes. Isso ajuda a garantir que seus dados sejam confiáveis. Pratique filtragem, manipulação de strings e conversão de tipos de dados para obter experiência prática.

 

Concentre-se em habilidades que correspondam aos seus objetivos

Que tipo de ferramentas de limpeza de dados você precisará no emprego dos seus sonhos? Excel? Pitão? SQL? Domine as habilidades que o tornarão eficiente na preparação de dados e avance em sua carreira em ciência de dados. Além disso, não tenha medo de misturar e combinar! Os analistas de dados geralmente usam uma combinação de ferramentas para realizar o trabalho.

 

Pratique, pratique, pratique.

A melhor maneira de consolidar seu novo conhecimento? Aplique-o imediatamente com projetos práticos. Tente praticar com conjuntos de dados reais de fontes como Kaggle ou UCI Machine Learning Repository. Quanto mais experiência prática você tiver, mais intuitivas essas técnicas se tornarão!

 

Continue aprendendo e mantenha-se atualizado.

A limpeza de dados está sempre evoluindo, portanto, mantenha-se atualizado com as técnicas e ferramentas mais recentes. Participe de comunidades on-line, participe de workshops ou faça cursos sobre métodos emergentes*. Ficar por dentro das tendências expandirá suas habilidades e tornará você um candidato a emprego mais forte.

Pronto para se tornar um profissional de limpeza de dados? Siga estas etapas e você estará no caminho certo para essa habilidade de dados tão solicitada.

Por que escolher o Dataquest para limpeza de dados?

Se você deseja iniciar uma carreira em dados, a proficiência em limpeza de dados é obrigatória. Felizmente, o Dataquest oferece uma excelente maneira de adquirir essas habilidades críticas, mesmo se você for um iniciante.

Por meio de projetos práticos, você praticará as principais técnicas de limpeza de dados usadas diariamente por profissionais de dados, como:

Tratamento de valores ausentes e outliers.

Decuplicando e normalizando dados

Analisando datas e trabalhando com dados esparsos.

Ao aplicar essas habilidades em cenários realistas, você desenvolverá um forte entendimento prático que impressionará os empregadores.

A plataforma interativa do Dataquest orienta você passo a passo, para que você aprenda fazendo. Você escreverá código real em Python, uma linguagem essencial para limpeza e análise de dados. Isso significa que você ganhará uma valiosa experiência de programação à medida que aprende.

Tem alguma dúvida enquanto trabalha em um projeto? Sem problemas! A comunidade acolhedora de profissionais e estudantes de dados da Dataquest está pronta para ajudar.

Aprender com outras pessoas mantém você motivado e oferece novas perspectivas.

O currículo completo cobre todas as bases, desde a filtragem básica até operações complexas. Assim, você pode ter certeza de que está desenvolvendo todas as habilidades necessárias para uma carreira em dados.

Quer mostrar suas novas habilidades? Os projetos que você conclui tornam-se um portfólio impressionante que demonstra sua habilidade em limpeza de dados para potenciais empregadores. Imagine como será ótimo compartilhar seu trabalho com orgulho!

Portanto, se você está animado para começar a trabalhar com dados, o Dataquest oferece um caminho envolvente e eficaz para adquirir habilidades essenciais de limpeza de dados. Você ficará surpreso com a rapidez com que pode aprender!

 

 Caso você não tenha se inscrito ainda, na área de eventos para receber todas as comunicações de eventos, aqui segue o link: https://trailblazercommunitygroups.com/salesforce-architect-group-curitiba-brazil/ 

 

Venha fazer parte de nossa comunidade e convide mais Trailblazers para juntar-se a gente nesta jornada de aprendizado e troca de experiências e informações.

 

Valeuuuuuu!!!!

 

@* Success - Português * @* Trailhead Official * @Comunidade Salesforce Brasil @Salesforce Fundamentals Brazil @Salesforce.org Brasil @Treinamento Salesforce.com no Brasil @SFDC Architect @Architect Journeys @Salesforce Architect @Developer Group - CGL, Campinas, BR @Developer Group, Varginha, BR @Developer Group, Salvador, BR

0/9000
0/9000

Fala pessoal!

 

Nesta postagem continuaremos sobre o assunto, A Qualidade de Dados.

 

5. Análise de data/hora

Quer ser um ótimo analista de dados? Análise mestre de data/hora. Simplificando, esta habilidade trata da conversão de dados de data e hora de vários formatos em um formato padrão.

Por que isso é tão importante? Ao analisar dados, você precisa que as datas e horas estejam corretas. Muito do que analisamos está relacionado ao tempo - tendências, previsões, o que você quiser. Se suas datas estiverem em formatos diferentes, isso pode realmente confundir as coisas. Você pode errar na ordem dos eventos ou fazer conexões falsas.

Como disse um cientista de dados: “Quando aprendi a codificar, lidar com a análise de data/hora era um desafio. Cada solução que encontrei on-line usava uma técnica ou biblioteca Python diferente e tudo parecia incompatível com meu conjunto de dados”. O truque é praticar com vários conjuntos de dados diferentes, como dados meteorológicos ou de tráfego cheios de carimbos de data/hora.

Imagine que você está analisando dados de vendas para ver como o clima afeta as compras. Se suas datas estiverem uma bagunça, você pode facilmente confundir uma onda de calor de julho com uma nevasca de janeiro! E isso mudaria totalmente a sua análise.

Resumindo, acertar na análise de data/hora fará de você um analista de dados inestimável. Seus insights serão precisos e qualquer empresa com experiência em dados terá sorte em ter você.

 

6. Mesclando e Unindo Dados

Mesclar e unir dados é uma técnica obrigatória que pode ajudá-lo a criar conjuntos de dados mais abrangentes e confiáveis ​​para tomar decisões mais inteligentes. Na minha primeira entrevista de emprego relacionada a dados, a primeira pergunta técnica que me fizeram foi sobre os diferentes tipos de junções no SQL. Distinguir entre uma junção esquerda e uma junção interna me ajudou a conseguir o emprego, e o fato de ter sido a primeira pergunta que eles fizeram é uma boa evidência anedótica que mostra a importância das fusões e junções para o ciclo de vida dos dados.

Compreender a fusão e a junção pode trazer grandes benefícios para o seu trabalho com dados. Por um lado, ajuda a manter seus conjuntos de dados consistentes e precisos. Também permite trabalhar com estruturas de dados mais complexas, o que é uma habilidade valiosa para enfrentar desafios analíticos.

Dito isso, mesclar grandes conjuntos de dados ou lidar com formatos incompatíveis às vezes pode ser complicado. O segredo é escolher as chaves certas para unir suas tabelas e verificar frequentemente os valores para garantir que a lógica por trás da mesclagem esteja alinhada com o que você está vendo na tabela de dados.

Portanto, se você estiver pronto para aprimorar seu jogo de dados, comece a lidar com fusões e junções. Com um pouco de prática, você combinará conjuntos de dados como um profissional e descobrirá insights que você nem sabia existirem!

 

7. Transformação de dados e conversões de tipo de dados

Você já trabalhou com um conjunto de dados que não estava no formato correto? Talvez as datas fossem inconsistentes ou os números estivessem armazenados como texto. É aqui que entram transformar dados e a conversão de tipo de dados.

Em termos simples, transformação de dados significa alterar o formato ou estrutura dos seus dados. Isso pode envolver tarefas como padronização de formatos de data, divisão de colunas ou agregação de dados para resumir detalhes. A conversão de tipo de dados, por outro lado, consiste em garantir que cada dado seja categorizado corretamente, como números contra texto.

Então, por que isso é importante para a limpeza de dados? Digamos que você tenha um conjunto de dados com datas em formatos diferentes - alguns são MM/DD/AAAA enquanto outros são DD/MM/AAAA. Para analisar esses dados com precisão, você precisaria transformar todas as datas em um formato consistente. Ou se você tivesse números armazenados como texto, não poderia realizar operações matemáticas até os converter em um tipo de dados numérico.

À medida que mais empresas dependem de dados para tomar decisões estratégicas, ter fortes competências em transformação de dados e conversão de tipos torna-se cada vez mais valioso. Ele permite que você trabalhe com conjuntos de dados complexos de forma mais eficiente e garante que sua análise seja construída sobre uma base sólida e precisa.

 

Para desenvolver suas habilidades nesta área, recomendo:

Praticando com conjuntos de dados reais que precisam de limpeza.

Explorando ferramentas como a biblioteca pandas do Python para experimentar diferentes técnicas de transformação de dados (especialmente os métodos to_numeric e to_string)

Familiarizando-se com problemas comuns de tipos de dados e aprendendo estratégias de solução de problemas Com prática, você conseguirá lidar com dados em todos os tipos de formatos e se preparar para análises mais eficazes.

 

8. Integridade de dados: deduplicação e validação

Existe um ditado comum no mundo dos dados: “Entra lixo, sai lixo”. Isso significa que se seus dados não forem confiáveis ​​ou se “dados ruins” levarem sua equipe a resultados equivocados, é pior do que não ter nenhum dado para começar. Garantir que seus dados sejam confiáveis ​​e precisos levará a decisões baseadas em dados nas quais você pode confiar.

Mas como você garante que seus dados tenham integridade? Vamos nos concentrar em dois aspectos principais aqui: deduplicação e validação. A deduplicação trata da remoção de entradas duplicadas de seus conjuntos de dados. Isso não apenas limpa seus dados, mas também torna o processamento mais eficiente. Se o seu arquivo de dados tiver diversas entradas para alguns indivíduos (talvez os dados tenham sido coletados mais de uma vez), você poderá usar técnicas de deduplicação para eliminar essas redundâncias. Uma maneira de fazer isso é identificar identificadores exclusivos, como endereços de e-mail, números de telefone ou IDs de usuário.

A validação, por outro lado, consiste em garantir que seus dados sigam regras ou normas específicas. Isso ajuda a aumentar a confiabilidade dos seus dados para a tomada de decisões. Por exemplo, você pode verificar se os valores numéricos estão nos intervalos esperados ou se as entradas de data usam um formato consistente.

O resultado? Enfrentar esses desafios eficazmente é uma habilidade obrigatória. Isso aumentará sua capacidade de lidar com cenários de dados reais. E isso é fundamental para avançar em sua carreira em dados.

 

9. Lidando com dados esparsos

Ao limpar dados, é crucial saber como lidar com dados esparsos de maneira eficaz. O que exatamente são dados esparsos? São dados que possuem muitos valores ausentes ou nulos.

Dados esparsos podem realmente atrapalhar sua análise, causar problemas como modelos imprecisos e até mesmo introduzir preconceitos em seu trabalho. Isso porque aumenta as chances de problemas como overfitting, em que um modelo tem um bom desempenho nos dados em que foi treinado, mas um desempenho ruim em novos dados.

Então, o que você pode fazer sobre isso? Algumas técnicas comuns incluem o preenchimento de valores ausentes, a criação de novos recursos de dados ou a remoção total de recursos esparsos. Saber quais técnicas usar e quando é mais uma arte do que uma ciência porque exige que você esteja intimamente consciente de como uma determinada técnica impactará positiva e negativamente os dados.

Usar os métodos certos para limpar dados esparsos não leva apenas a modelos de melhor desempenho, mas também ajuda você a tomar decisões mais inteligentes, garantindo que seus insights sejam baseados em dados de alta qualidade.

 

Contínua no próximo Post.

 

 Caso você não tenha se inscrito ainda, na área de eventos para receber todas as comunicações de eventos, aqui segue o link: https://trailblazercommunitygroups.com/salesforce-architect-group-curitiba-brazil/ 

 

Venha fazer parte de nossa comunidade e convide mais Trailblazers para juntar-se a gente nesta jornada de aprendizado e troca de experiências e informações.

 

Valeuuuuuu!!!!

 

@* Success - Português * @* Trailhead Official * @Comunidade Salesforce Brasil @Salesforce Fundamentals Brazil @Salesforce.org Brasil @Treinamento Salesforce.com no Brasil @SFDC Architect @Architect Journeys @Salesforce Architect @Developer Group - CGL, Campinas, BR @Developer Group, Varginha, BR @Developer Group, Salvador, BR

0/9000

Fala pessoal!

 

Nesta postagem continuaremos sobre o assunto, A Qualidade de Dados.

 

1. Exploração de dados

Quer limpar seus dados eficazmente? Comece entendendo o que seus dados já incluem.

Há muitas maneiras de explorar dados, mas alguns ótimos lugares para começar incluem:

Medidas de tendência central (média, mediana e moda) e dispersão (desvio padrão e intervalo) para entender a distribuição dos seus dados.

Verifique se há valores ausentes para identificar lacunas nos dados que possam exigir preenchimento.

Observe a estrutura dos seus dados, incluindo o número de colunas e linhas.

Esta análise estatística descritiva oferece insights sobre a distribuição dos dados e pode destacar possíveis anomalias.

Equipado com esse entendimento dos atributos básicos dos seus dados, você estará mais bem preparado para avançar com processos de limpeza direcionados, garantindo que seus dados sejam precisos e úteis para análise.

 

2. Tratamento de anomalias: valores ausentes e outliers.

Lidar com anomalias de dados, como valores ausentes e valores discrepantes, é uma habilidade crítica para garantir que seus dados sejam confiáveis. Se não forem verificadas, as anomalias muitas vezes distorcem os conjuntos de dados e levam a conclusões erradas.

Embora as anomalias representem desafios, aprender a identificá-las e corrigi-las levará suas habilidades em dados para o próximo nível. Algumas técnicas principais incluem:

Usando métodos de detecção de anomalias, os quais são testes automatizados que sinalizam pontos de dados que estão fora de um intervalo esperado, para detectar rapidamente possíveis problemas.

Tratamento de dados ausentes por meio de exclusão ou suposições baseadas em outras informações disponíveis.

Aprender essas abordagens não apenas melhorará a qualidade dos seus dados, mas também o tornará um melhor solucionador de problemas e tomador de decisões. As ferramentas são importantes, mas o bom senso é insubstituível.

 

3. Filtrando dados

A filtragem de dados é uma parte fundamental da limpeza de dados. Ele melhora a qualidade do seu conjunto de dados para que você possa realizar análises direcionadas e precisas.

Mas o que a filtragem realmente envolve? Basicamente, a filtragem consiste em remover ou alterar dados irrelevantes, imprecisos ou formatados incorretamente em seu conjunto de dados. Este processo ajuda a garantir a integridade e a utilidade dos seus dados.

Filtrar os dados desta forma facilita identificar tendências significativas e tirar conclusões confiáveis.

O desenvolvimento de fortes habilidades de filtragem pode realmente aumentar sua produtividade e eficácia em funções focadas em dados. Um analista de dados que consegue filtrar conjuntos de dados com eficiência economizará tempo e reduzirá erros em suas análises e insights. Essa capacidade de trabalhar com dados limpos e de alta qualidade é inestimável para informar decisões de negócios inteligentes.

 

4. RegEx e manipulação de strings

Você já trabalhou com um conjunto de dados cheio de texto inconsistente? Talvez contivesse números de telefone em formatos diferentes ou endereços de e-mail com erros de digitação. Limpar esse tipo de dados confusos e não estruturados pode ser uma grande dor de cabeça. É aí que entram as expressões regulares (RegEx) e a manipulação de strings.

Em termos simples, as expressões regulares permitem pesquisar padrões específicos no texto. Por exemplo, você poderia escrever um padrão RegEx para localizar todos os números de telefone que seguem o formato (123) 456-7890. A manipulação de strings refere-se a tarefas como remover espaços em branco extras, alterar a caixa das letras ou substituir certos caracteres.

Por que essas habilidades são valiosas?

Digamos que você esteja analisando avaliações de clientes de uma empresa de comércio eletrônico. As resenhas estão cheias de abreviações, erros ortográficos e pontuação inconsistente. Antes de obter insights significativos, você precisa limpar e padronizar todos os dados de texto. Com RegEx e manipulação de strings, você pode remover caracteres especiais, converter tudo para letras minúsculas e substituir abreviações comuns por palavras completas. O que pode levar horas manualmente pode ser feito em segundos com um RegEx bem elaborado.

Essas técnicas tornam-se ainda mais cruciais quando se trabalha com grandes conjuntos de dados. A capacidade de limpar e pré-processar texto com eficiência pode fazer a diferença entre passar dias limpando dados manualmente e passar rapidamente para a análise.

Aprendendo RegEx

Se você é novo em expressões regulares, a sintaxe pode parecer intimidante no início. Quando vi pela primeira vez um padrão RegEx, parecia uma confusão de barras e colchetes que eu realmente não queria aprender. Mas com a prática, começou a fazer sentido. Foi quando encontrei meu primeiro conjunto de dados sujo com mais de 10.000 linhas que realmente apreciei o valor do RegEx - se eu tivesse que lidar manualmente com cada valor de dados inconsistente, levaria semanas!

Tutoriais interativos como Regexr.com são um ótimo lugar para começar. Você pode testar padrões e ver o que eles correspondem em tempo real. Para prática extra que incorpora um pouco de diversão, experimente Regex Golf, um jogo onde você compete para escrever o RegEx mais conciso para um determinado problema.

Com prática, você conseguirá limpar e organizar dados de texto com confiança. À medida que você avança em sua carreira em dados, essas habilidades o ajudarão a trabalhar com mais eficiência e a enfrentar uma gama mais ampla de desafios de dados.

 

Contínua no próximo Post.

 

 Caso você não tenha se inscrito ainda, na área de eventos para receber todas as comunicações de eventos, aqui segue o link: https://trailblazercommunitygroups.com/salesforce-architect-group-curitiba-brazil/ 

 

Faca parte de nossa comunidade e convide mais Trailblazers para juntar-se a gente nesta jornada de aprendizado e troca de experiências e informações.

 

Valeuuuuuu!!!!

 

@* Success - Português * @* Trailhead Official * @Comunidade Salesforce Brasil @Salesforce Fundamentals Brazil @Salesforce.org Brasil @Treinamento Salesforce.com no Brasil @SFDC Architect @Architect Journeys @Salesforce Architect @Developer Group - CGL, Campinas, BR @Developer Group, Varginha, BR @Developer Group, Salvador, BR

0/9000