Conheça os fundamentos de dados
Objetivos de aprendizagem
Após concluir esta unidade, você estará apto a:
- Descrever o que são dados.
- Descrever os vários tipos de fontes de dados.
Introdução
Você sabe que letramento em dados é a capacidade de explorar, entender e se comunicar com dados. O que são exatamente dados?
Dados são fatos, estatísticas ou itens individuais de informação. Uma coleta de dados é uma coleta de fatos. Mais especificamente, considere esta definição expandida. Jeffrey Leek, cientista de dados que trabalha como professor na Johns Hopkins Bloomberg School of Public Health, começou com a definição de dados da Wikipédia e a expandiu para formar sua própria definição:
Os dados são compostos de valores de variáveis qualitativas ou quantitativas, pertencentes a um conjunto de itens.
Vamos desmembrar isso e definir seus termos.
Termo |
Definição |
---|---|
Conjunto de itens |
Às vezes chamado de população, esse é o grupo de objetos em que você está interessado. |
Variável |
Uma medição, propriedade ou característica de um item que pode variar ou mudar (ao contrário de uma medição constante, como pi, que não varia). |
Variável qualitativa |
Uma variável qualitativa descreve qualidades ou características, como país de origem, gênero, nome ou cor do cabelo. |
Variável quantitativa |
Uma variável quantitativa descreve características mensuráveis, como altura, peso ou temperatura. |
Pronto para verificar seus conhecimentos? Na atividade a seguir, você determina se cada característica é uma variável qualitativa ou uma variável quantitativa.
. . . .
Como os dados são coletados?
Temos várias ferramentas e técnicas para coleta de dados, como questionários, entrevistas, observações, análise de documentos, coleta de dados web e medições de máquinas. Os dados recebidos ou coletados são chamados de dados brutos. Os dados brutos, que também são conhecidos como dados de origem ou dados primários, não foram processados de forma alguma. Isso significa que eles não foram repassados em nenhum software, não tiveram variáveis modificadas, não tiveram dados removidos nem foram resumidos de alguma forma. Os dados brutos permitem a análise de dados mais abrangente, pois nenhum dado foi removido ou resumido.
Alguns exemplos de dados brutos incluem:
- Um espécime de bactéria visto sob um microscópio
- Arquivos binários produzidos por máquinas de medição
- Arquivos de planilha não formatados
- Dados JSON coletados na API do X
- Números coletados e registrados manualmente
Tipos de fontes de dados
Uma fonte de dados contém os dados usados para exploração, compreensão e comunicação. No Tableau, por exemplo, cada gráfico que você vê tem uma fonte de dados conectada que fornece os dados. Use estes flashcards interativos para aprender sobre algumas fontes de dados comuns.
Leia o termo em cada cartão e clique no cartão para revelar a descrição do termo. Clique na seta para a direita para passar para o próximo cartão e a seta para a esquerda para retornar ao cartão anterior.
Recursos
- Blog do Tableau: Encontrar insights ocultos em seus dados: perguntar o motivo e o motivo novamente
- Livro: Few, S. (2021). Now You See It: An Introduction to Visual Data Sensemaking (2nd ed). (Agora você vê: uma introdução à compreensão de dados visuais). Analytics Press, 29-32.
- Site da Web: Perceptual Edge, o site profissional de Stephen Few
- Coursera: The Data Scientist’s Toolbox (A caixa de ferramentas do cientista de dados; registro no curso obrigatório)
- Tableau: Missão
Agora você entende o que significa letramento em dados, quão importantes são as perguntas e quais características são úteis para se trabalhar efetivamente com dados. Você também sabe como os dados são definidos, como são coletados e onde estão localizados.