Skip to main content
O Dreamforce está chegando em São Francisco entre 17 e 19 de setembro. Registre-se agora e economize 20% usando o código DF24TRAIL20

Questionar os dados

Objetivos de aprendizagem

Após concluir esta unidade, você estará apto a:

  • Investigar a fonte de dados e gráficos.
  • Avaliar a confiabilidade dos dados e análises.
Nota

Algumas das imagens listadas nesta unidade foram usadas com permissão de Alberto Cairo e foram retiradas de seu livro, How Charts Lie: Getting Smarter about Visual Information.

Conheça a fonte

“Desconfie de qualquer publicação que não mencione claramente ou inclua um link para as fontes das histórias que publica.” Alberto Cairo, especialista em visualização de dados e autor de How Charts Lie

Algumas das imagens listadas nesta unidade foram usadas com permissão de Alberto Cairo e foram retiradas de seu livro How Charts Lie: Getting Smarter about Visual Information.

De relatórios comerciais a publicações de redes sociais, é importante identificar e avaliar a fonte dos dados e gráficos que você encontra. Conhecer a fonte é o primeiro (e mais importante!) passo para determinar se um gráfico induz ao erro. Investigue a fonte fazendo perguntas para chegar ao cerne de quem, o quê, onde, quando e por que o gráfico foi criado.

Tópico a investigar Objetivo Perguntas a se fazer

Quem

Verificar a origem dos dados e se há interesses escusos em produzir a informação ou em apresentá-la daquela forma específica.

  • Quem é responsável pelos dados, análises e apresentações resultantes?
  • Quem coletou e analisou ou criou os dados?
  • O autor foi pago para coletar, analisar e apresentar os dados? Em caso afirmativo, há algum conflito de interesse em potencial?
  • O autor ou editor do gráfico é uma autoridade no assunto?
  • Há alguma organização específica ou várias organizações envolvidas no trabalho?

O quê

Entender o tipo de dados coletados e como eles foram medidos para que você possa verificar a precisão dos dados apresentados.

  • Que métodos foram usados na coleta e preparação dos dados?
  • Que tipo de dados o autor apresenta?
  • Que tipos de medições foram feitas e quão precisas são essas medições?
  • Qual foi o tamanho da amostra dos dados?
  • Quantas pessoas foram entrevistadas em uma pesquisa e como é a distribuição demográfica desses entrevistados?

Onde

Avaliar os métodos de coleta de dados usados e avaliar ainda mais a credibilidade e o contexto da fonte.

  • Os dados foram coletados em uma determinada região, estado ou país?
  • Os dados foram coletados em locais diferentes?
  • Os dados estão disponíveis no site de uma fonte confiável?

Quando 

Determinar a relevância dos dados usados com base em quando foram coletados.

  • Os dados são atuais?
  • Os dados foram coletados ao longo de um período? Se sim, por quanto tempo?
  • Os dados foram coletados anualmente, mensalmente, diariamente ou mesmo por minuto ou segundo?

Por quê

Descobrir quaisquer potenciais motivações financeiras, políticas, científicas, filantrópicas ou outras que possam influenciar a objetividade dos dados apresentados.

  • Os autores tiveram um motivo específico por trás da coleta de dados e da análise?
  • Uma empresa estava pagando um pesquisador para testar um novo produto?
  • Foi um estudo do governo patrocinado pela comunidade?

Para ajudá-lo a questionar os dados, certifique-se de estudar os metadados, que são os dados sobre os dados. Leia toda a documentação que foi fornecida junto para obter insights úteis dos metadados, como quando, como e por que os dados foram coletados.

Nota

Para obter mais dicas sobre como avaliar com eficácia a credibilidade de suas fontes, consulte o Guia de pesquisa do consumidor de informações inteligente da Universidade de Washington.

Analise os números

Você conhece o ditado “começou errado, vai dar errado”? O conceito dessa ideia é que a qualidade do resultado é determinada pela qualidade desde o início do processo. Essa ideia se aplica a uma ampla variedade de coisas, incluindo consumo de dados. Quando você olha para visualizações como gráficos baseados em dados imprecisos (começou errado), você corre o risco de tirar conclusões imprecisas e tomar ações ineficazes (vai dar errado). Para ajudar a determinar a qualidade e a precisão dos dados apresentados nas visualizações, analise o máximo possível dos números subjacentes.

Confira os valores estatísticos

Os gráficos geralmente são acompanhados por valores estatísticos que descrevem e resumem os dados subjacentes. Os valores estatísticos, também conhecidos como estatística, comunicam informações de alto nível sobre os dados, muitas vezes revelando insights significativos que merecem mais reflexão e análise. A tabela abaixo ajudará você a se familiarizar com os valores estatísticos comuns.

Valor estatístico Descrição

Soma

Total dos valores 

Contagem

O número de valores

Média

Média dos números, calculada dividindo o total dos números (soma) pelo número de valores no conjunto de dados (contagem)

Mediana

O valor médio em um conjunto de dados em que os valores foram colocados em ordem de magnitude (do menor para o maior)

Modo

O valor mais frequente

Intervalo

A diferença entre o mínimo e o máximo

Mín.

O menor valor

Máx.

O maior valor

Nota

Estes são apenas alguns valores estatísticos comuns que você pode encontrar, mas há muitos outros. Para saber mais, confira os módulos Distribuições de dados e Agregação e granularidade.

Verifique taxas e porcentagens

Taxas e porcentagens medem uma relação entre valores. Por exemplo, você pode observar que três em cada cinco participantes de uma apresentação se inscrevem para receber um boletim informativo. Você diz que ⅗ ou 0,60 ou 60% dos participantes se inscreveram no boletim informativo. Como você verá na próxima seção, saber a taxa ou porcentagem geralmente o ajudará a fazer comparações melhores. 

Por exemplo, a manchete de um artigo dizia: “2.139 beneficiários do DACA condenados ou acusados de crimes”. Isso pode parecer um número grande sem contexto. No entanto, se você visualizar a taxa ou porcentagem, verá uma nova visualização. O mesmo artigo compartilhou que existem mais de 800.000 beneficiários do DACA. Se você considerar a taxa ou porcentagem, obtém 2.139/800.000 ou 0,003 ou 0,3%! A porcentagem é um valor mais informativo e não é uma grande porcentagem do total de beneficiários.

Cuidado com dados insuficientes

“Nenhum gráfico pode capturar a realidade em toda a sua amplitude. No entanto, um gráfico pode ser piorado ou melhorado, dependendo de sua capacidade de encontrar um equilíbrio entre simplificar demais essa realidade e obscurecê-la com muitos detalhes.” Alberto Cairo, How Charts Lie

Ao ler os gráficos, veja se há dados suficientes para fornecer uma versão significativa e precisa da história. Em seu livro How Charts Lie, Albert Cairo explica como dados insuficientes podem levar a conclusões incorretas. Para provar esse ponto, Cairo se refere a um artigo que dizia que a Lei de redução de impostos e geração de empregos de 2017 (Tax Cuts and Jobs Act, TCJA) prometia que uma família típica de quatro pessoas economizaria US$ 1.182 anualmente e ele explica como esse número não contava a história inteira. Para mostrar uma história mais completa, Cairo descreveu um histograma, uma distribuição de dados quantitativos que mostra os dados agrupados em faixas. 

Histograma mostrando a distribuição da renda familiar nos Estados Unidos em 2017.

Vamos descobrir por que esse número é uma simplificação excessiva observando o histograma. Ao observar os dados no histograma, observe que há uma variação significativa de salários representados. Devido a essa ampla variação, seria muito difícil determinar um salário "típico". Há claramente uma variação significativa de salários nos EUA. Enquanto 3% das famílias ganhavam menos de US$ 5.000 por ano, mais de 9% ganhavam mais de US$ 200.000. Discutir a economia média da TCJA quase não faz sentido, pois é quase impossível calcular um “salário típico”.

Nota

Para saber mais, faça o módulo Distribuições de dados.

Na próxima unidade, aprenda a importância de usar intervalos do mesmo tamanho nos eixos. 

Recursos