Cuestione los datos
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Investigar la fuente de datos y los gráficos.
- Evaluar la confiabilidad de los datos y el análisis.
Conozca la fuente
“Desconfíe de cualquier publicación que no mencione o vincule claramente las fuentes de las historias que se publican” (Alberto Cairo, experto en visualización de datos y autor de Cómo mienten los gráficos).
Algunas de las imágenes enumeradas en esta unidad se usaron con permiso de Alberto Cairo y se tomaron de su libro Cómo mienten los gráficos: Cómo ser más inteligente en relación con la información visual.
Es importante identificar y evaluar la fuente de los datos y los gráficos que encuentre, desde informes comerciales hasta publicaciones en redes sociales. Conocer la fuente es el primer paso (¡y el más importante!) para determinar si un gráfico es engañoso. Para investigar la fuente, haga preguntas para llegar al corazón de quién, qué, dónde, cuándo y por qué se creó el gráfico.
Tema para investigar |
Objetivo |
Preguntas que se deben formular |
---|---|---|
Quién |
Verificar la fuente de los datos y si existen intereses creados en producir la información o presentarla de cierta manera. |
|
Qué |
Comprender el tipo de datos recopilados y cómo se midieron para que pueda verificar la precisión de los datos presentados. |
|
Dónde |
Evaluar los métodos de recopilación de datos usados y evaluar aún más la credibilidad y el contexto de la fuente. |
|
Cuándo |
Determinar la relevancia de los datos usados en función de cuándo se recopilaron. |
|
Por qué |
Detectar posibles motivaciones financieras, políticas, científicas, filantrópicas o de otro tipo que puedan influir en la objetividad de los datos presentados. |
|
Como ayuda para cuestionar los datos, asegúrese de estudiar los metadatos, que son los datos sobre los datos. Lea cualquier documentación adjunta para recopilar información útil de los metadatos, como cuándo, cómo y por qué se recopilaron los datos.
Revise los números
¿Conoce el dicho “si entra basura, sale basura”? El concepto detrás de esta frase común es que la calidad de cualquier resultado está determinada por la calidad de lo que se ingresa. Esta idea se aplica a una amplia variedad de aspectos, incluido el consumo de datos. Cuando observa visualizaciones, como gráficos que se basan en datos inexactos (entrada basura), corre el riesgo de sacar conclusiones imprecisas y tomar medidas ineficientes (salida basura). Para ayudar a determinar la calidad y la precisión de los datos presentados en las visualizaciones, revise la mayor cantidad de números subyacentes que pueda.
Compruebe los valores de resumen
Los gráficos suelen ir acompañados de valores de resumen que describen y resumen los datos subyacentes. Los valores de resumen, también conocidos como estadísticas de resumen, comunican información de alto nivel sobre los datos y, a menudo, revelan información significativa que vale la pena considerar e investigar más a fondo. La siguiente tabla lo ayudará a familiarizarse con los valores de resumen más comunes.
Valor de resumen |
Descripción |
---|---|
Suma |
Total de los valores. |
Conteo |
El número de valores. |
Promedio |
Promedio de los números, calculado dividiendo el total de los números (suma) por el número de valores en el conjunto de datos (recuento). |
Mediana |
El valor medio en un conjunto de datos en el que los valores se ubicaron en orden de magnitud (de menor a mayor). |
Modo |
El valor más frecuente. |
Intervalo |
La diferencia entre el mínimo y el máximo. |
Mínimo |
El valor más bajo |
Máximo |
El valor mayor |
Comprobar tasas y porcentajes
Las tasas y los porcentajes miden una relación entre valores. Por ejemplo, puede observar que tres de cada cinco asistentes a una presentación se registran para recibir un boletín informativo. Usted indica que ⅗, 0,60 o 60 % de los asistentes se suscribieron al boletín. Como verá en la siguiente sección, a menudo, conocer la tasa o el porcentaje lo ayudará a hacer mejores comparaciones.
Por ejemplo, el titular de un artículo indicaba: “2139 beneficiarios de DACA condenados o acusados de delitos”. Esto podría parecer un gran número sin contexto. Sin embargo, si ve la tasa o el porcentaje, obtendrá una visión nueva. En el mismo artículo, se afirma que hay más de 800 000 beneficiarios de DACA. Si considera la tasa o el porcentaje, obtiene 2139/800 000, que es aproximadamente 0,003 o 0,3%. El porcentaje es un valor más informativo, y este no es un gran porcentaje del total de beneficiarios.
Esté atento a los datos insuficientes
“Ningún gráfico puede capturar la realidad en toda su riqueza. Sin embargo, un gráfico puede empeorar o mejorar según su capacidad para lograr un equilibrio entre simplificar demasiado esa realidad y complejizarla con demasiados detalles” (Alberto Cairo, Cómo mienten los gráficos)
Cuando lea los gráficos, pregúntese si se incluyen suficientes datos para proporcionar una versión significativa y precisa de la historia. En su libro Cómo mienten los gráficos, Albert Cairo explica cómo la insuficiencia de datos puede llevar a sacar conclusiones incorrectas. Para probar este punto, Cairo se refiere a un artículo que indica que la Ley de Empleos y Reducción de Impuestos (TCJA, por sus siglas en inglés) de 2017 prometía que la familia típica de cuatro miembros ahorraría $1182 al año, y explica cómo ese número no representaba la historia completa. Para mostrar una historia más completa, Cairo describió un histograma, una distribución de datos cuantitativos que muestra los datos agrupados en rangos.
Analicemos por qué este número es una simplificación excesiva mirando el histograma. Al mirar los datos en el histograma, observe que hay un rango significativo de salarios representados. Debido a esta amplia gama, sería muy difícil determinar un salario “típico”. Claramente, hay una variedad significativa de salarios en los Estados Unidos. Mientras que el 3 % de los hogares ganaba menos de $5000 por año, más del 9 % ganaba más de $200 000. Analizar los ahorros promedio de TCJA es casi insignificante cuando es casi imposible calcular un “salario típico” preciso en primer lugar.
En la siguiente unidad, aprenderá la importancia de usar intervalos de tamaño uniforme en los ejes.
Recursos
- Trailhead: Fundamentos de la alfabetización de datos
- Trailhead: Agregación y granularidad
- Trailhead: Distribuciones de datos
- Libro: Alberto Cairo (2020): Cómo mienten los gráficos: Cómo ser más inteligente en relación con la información visual, W.W. Norton & Company
- Libro: Edward Tufte (2006): La belleza de la evidencia. Graphics Press
- Sitio de Tableau: Descripción y uso de histogramas
- Libro: Steve Few (2012), Muéstreme los números, Analytics Press