Verificar os eixos
Objetivos de aprendizagem
Após concluir esta unidade, você estará apto a:
- Descrever a forma como são usados eixos, escalas e intervalos em gráficos.
- Identificar os eixos corretos em tipos de gráficos específicos.
- Reconhecer formas comuns de uso indevido de eixos.
O que são eixos?
Os eixos (singular: eixo) criam a estrutura onde os dados serão exibidos em um gráfico. Os eixos fornecem escalas que atribuem valores e rótulos para os pontos de dados exibidos em um gráfico.
Muitos gráficos têm dois eixos.
- O eixo horizontal, geralmente chamado de eixo x
- O eixo vertical, geralmente chamado de eixo y
Entenda as escalas qualitativas e quantitativas
Quando se trata de eixos em gráficos, existem dois tipos de escalas.
- Qualitativa, que atribui rótulos para categorias como Alimentos, Habitação e Vestuário
- Quantitativa, que atribui valores para variáveis numéricas como 0, 5 e 10
Para saber mais sobre variáveis e escalas, faça o módulo Variáveis e tipos de campo.
Agora que você aprendeu o que são eixos, veja os diferentes tipos de gráficos usados para comunicar dados visualmente.
Tipos de gráfico para comunicar variáveis qualitativas | |
---|---|
Um gráfico de barras usa altura (ou comprimento) para comparar valores entre categorias ou subcategorias. |
|
Um gráfico de pizza representa os dados como uma porcentagem de um todo na comparação de categorias. |
|
Tipos de gráficos para comunicar variáveis quantitativas | |
---|---|
Um gráfico de dispersão mostra a relação entre duas variáveis quantitativas. As variáveis são plotadas como coordenadas cartesianas, marcando a distância de cada ponto de dados na horizontal e na vertical. |
|
Um gráfico de linhas conecta uma série de valores quantitativos e geralmente é usado para mostrar uma série temporal (onde o eixo x é o tempo). Também conhecido como gráfico de linha ou linear. |
|
Um histograma descreve uma distribuição de dados e a frequência de valores em um conjunto de dados como barras conectadas. A largura das barras está ligada aos valores no eixo x. Estatísticos, cientistas e analistas referem-se às larguras de cada barra como classes. |
|
Um gráfico e diagrama de caixa mostra a distribuição de dados usando percentis. Também conhecido como gráfico de caixa. |
Introdução a intervalos
Um intervalo é a distância entre os valores (marcas) em um eixo quantitativo. Sempre deve haver uma distância consistente entre cada marca, ou seja, um intervalo igual em um eixo quantitativo. Por exemplo, se um gráfico mostra os tempos de deslocamento diário dos funcionários, um intervalo consistente de 10 minutos pode ser apropriado. Intervalos inconsistentes (como 15 minutos, 40 minutos e 60 minutos) podem induzir a erros nas interpretações e conclusões incorretas.
Veja um exemplo: um aumento impressionante na safra de tomate da Sue.
No gráfico anterior, você pode ver que Sue colheu vários quilos a mais de tomate em 2022 em comparação a 2010, ano em que ela começou. No entanto, você notou que os anos de 2016 a 2018 estão ausentes no eixo x? Agora, veja o gráfico com esses anos incluídos no eixo.
Com intervalos consistentes ao longo do eixo x, é mais fácil ver que a safra de tomate da Sue pode ter aumentado gradualmente ao longo do tempo.
Além de verificar intervalos mais consistentes, é importante prestar atenção aos pontos de dados ausentes ou nulos. Você sabe o que aconteceu no período de 2016 a 2018? Talvez Sue tenha tido um ano difícil durante esse período.
Cuidado com eixos qualitativos em gráficos destinados a dados quantitativos
Esteja atento a qualquer tentativa de exibir gráficos de dispersão, gráficos de linha ou histogramas com eixos qualitativos. Por exemplo, analise o gráfico a seguir sobre o número de mutuários em determinados setores.
Para esses dados, você precisa de um gráfico de barras! Um gráfico de linha é usado para mostrar valores sequenciais, como datas ou horas. Os gráficos de linha também devem sempre usar eixos x com intervalos uniformes, com o eixo x mostrando uma variável quantitativa. No exemplo acima, não faz sentido colocar as categorias de setores em ordem sequencial. Um gráfico de barras seria uma escolha muito melhor, se a linha de base seguir algumas práticas recomendadas importantes.
Os gráficos de barras devem começar em zero
É importante que todos os gráficos de barras comecem com uma linha de base zero, o que significa que a parte inferior da barra é zero. Para ilustrar melhor essa importância, analise os gráficos a seguir relacionados aos números de vendas por região.
No gráfico à direita, você acredita que há uma diferença significativa entre as duas regiões do eixo x. O segundo gráfico dá uma falsa impressão porque o eixo y começa em $ 380.000 em vez de zero. Ao interpretar gráficos de barras, você está comparando o comprimento das barras. Iniciar o eixo em $ 380.000 faz com que nosso olho interprete uma diferença de três vezes. No primeiro gráfico, a única alteração é que o eixo y começa em zero.
Agora você pode ver rapidamente como a diferença entre as alterações foi exagerada no segundo gráfico; não é uma diferença tão dramática! É por isso que é importante lembrar que, ao visualizar gráficos de barras, deve sempre verificar se a linha de base começa em zero.
Os gráficos de linhas podem começar em zero
Ao visualizar gráficos de linha, no entanto, a regra “deve começar em zero” não se aplica. Na verdade, às vezes é melhor que o eixo y de um gráfico de linhas não comece em zero! Veja nos seguintes gráficos de linhas da temperatura global ao longo do tempo (fonte de dados: Gráfico de tendências globais de temperatura).
O segundo gráfico oferece uma imagem melhor do padrão ou percepção do que pode estar acontecendo com a temperatura global ao longo do tempo e isso ocorre porque o eixo y não começa em zero no segundo gráfico. Neste gráfico, você pode ver mais detalhes que não eram óbvios antes, como mudanças de um ano para o outro.
O grande debate sobre múltiplos eixos
Há muito debate no mundo da visualização de dados sobre a utilidade de eixos duplos em um único gráfico. Embora os eixos duplos sejam úteis quando usados corretamente, eles também podem induzir ao erro e ser mal utilizados às vezes.
O caso dos eixos múltiplos
Existem casos de uso legítimos para usar vários eixos. Por exemplo, pode ser eficaz mostrar o mesmo conjunto de pontos de dados em duas escalas diferentes usando eixos y duplos, como é o caso ao mostrar os mesmos dados com duas unidades de medida diferentes (como polegadas e centímetros ou quilogramas e libras). No gráfico a seguir, a temperatura é mostrada em Fahrenheit em um eixo y e em Celsius no outro.
O caso contra múltiplos eixos
Infelizmente, existem vários casos em que vários eixos induzem ao erro, intencionalmente ou não. Em seu blog Datawrapper, Lisa Charlotte Muth, uma respeitada escritora e educadora na área de visualização de dados, compartilha este gráfico que induz ao erro mostrando duas séries diferentes de pontos de dados que utilizam dois eixos y.
Veja bem as escalas neste gráfico. As duas escalas do eixo y são diferentes e levam você a acreditar erroneamente que o PIB da Alemanha e o PIB global eram os mesmos em 2011. Na realidade, havia uma diferença significativa entre esses números de mais de 66 trilhões de dólares.
Lembre-se, sempre verifique os eixos ao visualizar os gráficos para garantir que os dados façam sentido naquela forma como estão sendo apresentados!
Recursos
- Trailhead: Variáveis e tipos de campo
- Site do Tableau: Truncar o eixo Y: Perigo ou ameaça?
- Livro: Steve Wexler (2021): The Big Picture: How to Use Data Visualization to Make Better Decisions–Faster,. McGraw-Hill Companies
- Livro: Alberto Cairo (2020): How Charts Lie: Getting Smarter about Visual Information, W.W. Norton & Company
- Publicação do blog: Why Not to Use Two Axes, and What to Use Instead