Questionar os dados
Objetivos de aprendizagem
Após concluir esta unidade, você estará apto a:
- Investigar a fonte de dados e gráficos.
- Avaliar a confiabilidade dos dados e análises.
Conheça a fonte
“Desconfie de qualquer publicação que não mencione claramente ou inclua um link para as fontes das histórias que publica.” - Alberto Cairo, especialista em visualização de dados e autor de How Charts Lie
Algumas das imagens listadas nesta unidade foram usadas com permissão de Alberto Cairo e foram retiradas de seu livro How Charts Lie: Getting Smarter about Visual Information.
De relatórios comerciais a publicações de redes sociais, é importante identificar e avaliar a fonte dos dados e gráficos que você encontra. Conhecer a fonte é o primeiro (e mais importante!) passo para determinar se um gráfico induz ao erro. Investigue a fonte fazendo perguntas para chegar ao cerne de quem, o quê, onde, quando e por que o gráfico foi criado.
Tópico a investigar |
Objetivo |
Perguntas a se fazer |
---|---|---|
Quem |
Verificar a origem dos dados e se há interesses escusos em produzir a informação ou em apresentá-la daquela forma específica. |
|
O quê |
Entender o tipo de dados coletados e como eles foram medidos para que você possa verificar a precisão dos dados apresentados. |
|
Onde |
Avaliar os métodos de coleta de dados usados e avaliar ainda mais a credibilidade e o contexto da fonte. |
|
Quando |
Determinar a relevância dos dados usados com base em quando foram coletados. |
|
Por quê |
Descobrir quaisquer potenciais motivações financeiras, políticas, científicas, filantrópicas ou outras que possam influenciar a objetividade dos dados apresentados. |
|
Para ajudá-lo a questionar os dados, certifique-se de estudar os metadados, que são os dados sobre os dados. Leia toda a documentação que foi fornecida junto para obter insights úteis dos metadados, como quando, como e por que os dados foram coletados.
Analise os números
Você conhece o ditado “começou errado, vai dar errado”? O conceito dessa ideia é que a qualidade do resultado é determinada pela qualidade desde o início do processo. Essa ideia se aplica a uma ampla variedade de coisas, incluindo consumo de dados. Quando você olha para visualizações como gráficos baseados em dados imprecisos (começou errado), você corre o risco de tirar conclusões imprecisas e tomar ações ineficazes (vai dar errado). Para ajudar a determinar a qualidade e a precisão dos dados apresentados nas visualizações, analise o máximo possível dos números subjacentes.
Confira os valores estatísticos
Os gráficos geralmente são acompanhados por valores estatísticos que descrevem e resumem os dados subjacentes. Os valores estatísticos, também conhecidos como estatística, comunicam informações de alto nível sobre os dados, muitas vezes revelando insights significativos que merecem mais reflexão e análise. A tabela abaixo ajudará você a se familiarizar com os valores estatísticos comuns.
Valor estatístico |
Descrição |
---|---|
Soma |
Total dos valores |
Contagem |
O número de valores |
Média |
Média dos números, calculada dividindo o total dos números (soma) pelo número de valores no conjunto de dados (contagem) |
Mediana |
O valor médio em um conjunto de dados em que os valores foram colocados em ordem de magnitude (do menor para o maior) |
Modo |
O valor mais frequente |
Intervalo |
A diferença entre o mínimo e o máximo |
Mín. |
O menor valor |
Máx. |
O maior valor |
Verifique taxas e porcentagens
Taxas e porcentagens medem uma relação entre valores. Por exemplo, você pode observar que três em cada cinco participantes de uma apresentação se inscrevem para receber um boletim informativo. Você diz que ⅗ ou 0,60 ou 60% dos participantes se inscreveram no boletim informativo. Como você verá na próxima seção, saber a taxa ou porcentagem geralmente o ajudará a fazer comparações melhores.
Por exemplo, a manchete de um artigo dizia: “2.139 beneficiários do DACA condenados ou acusados de crimes”. Isso pode parecer um número grande sem contexto. No entanto, se você visualizar a taxa ou porcentagem, verá uma nova visualização. O mesmo artigo compartilhou que existem mais de 800.000 beneficiários do DACA. Se você considerar a taxa ou porcentagem, obtém 2.139/800.000 ou 0,003 ou 0,3%! A porcentagem é um valor mais informativo e não é uma grande porcentagem do total de beneficiários.
Cuidado com dados insuficientes
“Nenhum gráfico pode capturar a realidade em toda a sua amplitude. No entanto, um gráfico pode ser piorado ou melhorado, dependendo de sua capacidade de encontrar um equilíbrio entre simplificar demais essa realidade e obscurecê-la com muitos detalhes.” Alberto Cairo, How Charts Lie
Ao ler os gráficos, veja se há dados suficientes para fornecer uma versão significativa e precisa da história. Em seu livro How Charts Lie, Albert Cairo explica como dados insuficientes podem levar a conclusões incorretas. Para provar esse ponto, Cairo se refere a um artigo que dizia que a Lei de redução de impostos e geração de empregos de 2017 (Tax Cuts and Jobs Act, TCJA) prometia que uma família típica de quatro pessoas economizaria US$ 1.182 anualmente e ele explica como esse número não contava a história inteira. Para mostrar uma história mais completa, Cairo descreveu um histograma, uma distribuição de dados quantitativos que mostra os dados agrupados em faixas.
Vamos descobrir por que esse número é uma simplificação excessiva observando o histograma. Ao observar os dados no histograma, observe que há uma variação significativa de salários representados. Devido a essa ampla variação, seria muito difícil determinar um salário "típico". Há claramente uma variação significativa de salários nos EUA. Enquanto 3% das famílias ganhavam menos de US$ 5.000 por ano, mais de 9% ganhavam mais de US$ 200.000. Discutir a economia média da TCJA quase não faz sentido, pois é quase impossível calcular um “salário típico”.
Na próxima unidade, aprenda a importância de usar intervalos do mesmo tamanho nos eixos.
Recursos
- Trailhead: Noções básicas de letramento em dados
- Trailhead: Agregação e granularidade
- Trailhead: Distribuições de dados
- Livro: Alberto Cairo (2020): How Charts Lie: Getting Smarter About Visual Information, W.W. Norton & Company
- Livro: Edward Tufte (2006): Beautiful Evidence. Graphics Press
- Site do Tableau: Como entender e usar histogramas
- Livro: Steve Few (2012) Show Me the Numbers, Analytics Press