Hacer comparaciones nominales, de series temporales, de clasificación y de la parte del todo
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir series temporales, clasificaciones y comparaciones nominales y de las partes del todo.
- Entender cuáles son los mejores tipos de gráficos y las mejores prácticas para usar con estas comparaciones.
Comparaciones nominales
La palabra “nominal” deriva del latín y significa nombre. Cuando se realizan comparaciones nominales, se están comparando las categorías. Los atributos que funcionan bien con las comparaciones nominales son las posiciones 2D, la tonalidad de color y la forma.
Gráficos de barras
En la unidad anterior, aprendió que la longitud de los gráficos de barras funciona bien con los valores cuantitativos distintivos. Cuando se comparan categorías con un gráfico de barras, se usa el atributo de posición 2D y la longitud de la barra para comparar las categorías. El espacio distintivo entre las barras individuales y el orden de las barras ayudan a comparar los valores cuantitativos que están representados por la longitud de las barras entre las categorías. La clasificación o el orden específicamente para las variables ordinales puede mostrar patrones importantes en los datos.
Categorías de codificación
Cuando compara categorías, puede usar los atributos de color (o tonalidad) y forma para distinguir las categorías.
En la primera imagen anterior, el gráfico de líneas de series temporales, el color se usa para distinguir ciudades. En la segunda imagen, el diagrama de dispersión, las formas distinguen las categorías de producto.
Series temporales
Los gráficos de series temporales comparan los valores cuantitativos a través de intervalos de tiempo. Con los gráficos de líneas, puede ver patrones y tendencias a lo largo del tiempo.
Gráficos de líneas
Los gráficos de líneas son los gráficos más comunes para mostrar series temporales y son la mejor forma de ver patrones y tendencias a lo largo del tiempo. Por ejemplo, en este gráfico de líneas, fácilmente puede realizar un seguimiento de las ganancias a lo largo del tiempo.
Además de un gráfico de líneas que conecta cada punto de datos en el gráfico, puede agregar una línea de tendencia a su gráfico de series temporales. Con la línea de tendencia, puede ver la tendencia y dirección general de su medida y tomar decisiones de orientación. A continuación, la línea de tendencia en el gráfico de línea muestra un patrón de ganancias en aumento a lo largo del tiempo.
Gráficos de barras verticales
Las barras verticales sirven para una comparación de series temporales cuando es importante representar valores individuales en lugar de la tendencia general. En el siguiente gráfico de barras verticales, el valor más bajo en el T2 es el enfoque del gráfico, en vez de la tendencia general.
Diagramas de caja y bigotes
Los diagramas de caja y bigotes muestran una distribución que consiste en la media (la línea en el medio de la caja), percentiles de 25 y 75 (los extremos de las cajas) y puntos de datos individuales. Se pueden usar varios diagramas de caja y bigotes para comparar distribuciones en el tiempo.
Clasificación
Los gráficos que muestran comparaciones de clasificaciones ordenan los valores (descendente o ascendente) entre las categorías. Existen muchas maneras de mostrar comparaciones de clasificaciones.
Gráficos de barras
El gráfico más común que se usa para las comparaciones de clasificaciones es el gráfico de barras. Los gráficos de barras enfatizan las características distintivas de los valores. Es posible clasificar los valores; para ello, puede ordenar las barras en ascenso o descenso. En el siguiente ejemplo, puede ver que la subcategoría Sillas tiene el valor más alto, hay una pequeña diferencia entre Mesas y Carpetas, pero Mesas supera a Carpetas.
Otros gráficos que muestran comparaciones de clasificaciones
Para que se interpreten correctamente, los gráficos de barras siempre deben tener un valor inicial de cero. En los casos en que no es posible tener un valor inicial de cero, puede usar diagramas de puntos. En lugar de una barra, el extremo se reemplaza con un punto. Cuando se visualizan valores pares, los puntos se pueden conectar para destacar la diferencia entre valores pares.
En esta entrada de blog, Lisa Charlotte Muth describe cómo un gráfico de puntos puede mostrar clasificaciones de países por valor de edad promedio. Los diagramas de puntos no requieren de un eje para empezar en cero.
En los casos en que la clasificación cambia en el tiempo, un gráfico bump chart muestra las clasificaciones y permite que las líneas de cada categoría sigan la clasificación con los cambios en el tiempo. En el gráfico bump chart de Matt Chambers de Tableau Public a continuación, la categoría “otros colores” empieza con una clasificación tercera en 2000 y cambia en el tiempo hasta que llega al décimo lugar del 2005 al 2015.
Parte del todo
En los gráficos de comparación de partes del todo, los valores se muestran como una proporción del todo, en general, como porcentajes.
Gráficos de barras apiladas
El gráfico más común para mostrar las relaciones de parte del todo es el gráfico de barras. Los gráficos de barras apiladas dividen cada barra en sus componentes. Las partes se pueden mostrar en porcentajes, recuentos o medidas específicas. Los siguientes ejemplos son tres gráficos de barras apiladas que muestran ventas por modo de envío y segmentos de comparación.
El eje Y en el primer gráfico muestra las ventas. El eje Y en el segundo gráfico muestra el porcentaje del total. El eje Y en el tercero muestra el porcentaje de cada segmento. Con las etiquetas individuales, el lector puede ver los valores de ventas que representan los porcentajes, lo que proporciona contexto. Cuando se presentan los porcentajes, es importante brindar contexto y compartir recuentos o medidas que representen los porcentajes.
Gráficos circulares
La mayoría de los profesionales de visualización de datos se enfrentaron con el “gran debate circular”. En la segunda unidad, aprendió que el atributo de longitud facilita más la percepción de diferencias de valores que la percepción de diferencias de tamaño. Cuando se usa el atributo de tamaño en un gráfico circular, puede ser difícil ver pequeñas diferencias en tamaño. En el siguiente ejemplo, es difícil distinguir las pequeñas partes en el gráfico circular, pero muy fácil distinguir las pequeñas diferencias de tamaño cuando se usa el gráfico de barras.
Hay algunas pocas situaciones en las que un gráfico circular es la opción adecuada. Cuando hay pocas partes y no es necesario distinguir las pequeñas diferencias, un gráfico circular puede ser eficiente. Cuando muestra una categoría que tiene exactamente la mitad (50 %) del todo, un gráfico circular es más fácil de leer.
Gráficos de líneas de área
Con el gráfico de líneas de área, puede contestar preguntas acerca del cambio en el tiempo y la parte del todo. Cuando muestra una parte del todo en el tiempo, el color y tamaño del área se usan para mostrar la parte del todo mediante un gráfico de líneas de series temporales. En el siguiente ejemplo, puede ver que el modo de envío Clase estándar es el tipo más común en todos los meses del año.
Mapas de árbol
Para los conjuntos de datos jerárquicos grandes, los mapas de árbol pueden mostrar categorías anidadas en un gráfico. El próximo ejemplo muestra la proporción de ventas de subcategoría como una parte del todo para cada modo de envío. Dado que los mapas de árbol usan el atributo de tamaño para mostrar las diferencias, al lector se le dificulta hacer comparaciones. Cuando es importante comparar las subcategorías individuales, los diversos gráficos de barras pequeños son una alternativa. Para obtener más información, consulte Usar mapas de árbol para visualizar datos.
Recursos
- Blog de Tableau: Diagrama de caja y bigotes
- Narración de historias con Data Blog: ¿Qué es un diagrama de puntos?
- Trailhead: Directrices para reconocer gráficos engañosos
- Tableau: una lista de comprobación para detectar gráficos engañosos
- Tableau: Gráficos circulares
- Tableau: Diálogos de datos: usar o no usar los gráficos circulares
- Trailhead: Distribuciones de datos
- Entrada de blog de Datawrapper: Estoy rodeado de personas mayores
- Tableau Public: Popularidad de colores para autos nuevos en Norteamérica 2000-2015
- Blog Data Plus Science: Usar mapas de árbol para visualizar datos