Cuestionar los datos
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Investigar la fuente de datos y los gráficos.
- Evaluar la confiabilidad de los datos y el análisis.
Conocer la fuente
"DesconfÃe de cualquier publicación que no mencione o vincule claramente las fuentes de las historias que se publican". –Alberto Cairo, experto en visualización de datos y autor de How Charts Lie
Algunas de las imágenes de esta unidad se han utilizado con permiso de Alberto Cairo y se han tomado de su libro How Charts Lie: Getting Smarter about Visual Information.
Es importante identificar y evaluar la fuente de los datos y los gráficos que encuentre, desde informes comerciales hasta publicaciones en redes sociales. Conocer la fuente es el primer paso (y el más importante) para determinar si un gráfico es erróneo. Para investigar la fuente, haga preguntas para saber quién, qué, dónde, cuándo y por qué se creó el gráfico.
Tema para investigar |
Objetivo |
Preguntas para realizar |
---|---|---|
Quién |
Para verificar la fuente de los datos y si existen intereses creados en producir la información o presentarla de cierta manera. |
|
Qué |
Para comprender el tipo de datos recopilados y cómo se midieron a fin de poder comprobar la precisión de los datos presentados. |
|
Dónde |
Para evaluar los métodos de recopilación de datos utilizados y evaluar aún más la credibilidad y el contexto de la fuente. |
|
Cuándo |
Para determinar la relevancia de los datos utilizados en función de cuándo se recopilaron. |
|
Por qué |
Para detectar posibles motivaciones financieras, polÃticas, cientÃficas, filantrópicas o de otro tipo que puedan influir en la objetividad de los datos presentados. |
|
Como método de ayuda para cuestionar los datos, asegúrese de estudiar los metadatos, que son los datos sobre los datos. Lea cualquier documentación adjunta para recopilar información útil de los metadatos, como cuándo, cómo y por qué se recopilaron los datos.
Revisar los números
¿Conoce el dicho "basura entra, basura sale?" El concepto detrás de esta frase común es que la calidad de cualquier resultado está determinada por la calidad de lo que se introduce. Esta idea se aplica a una amplia variedad de aspectos, incluido el consumo de datos. Al observar visualizaciones, como gráficos que se basan en datos inexactos (basura entra), corre el riesgo de sacar conclusiones imprecisas y tomar medidas ineficientes (basura sale). Para ayudar a determinar la calidad y la precisión de los datos presentados en las visualizaciones, compruebe la mayor cantidad de números subyacentes que pueda.
Comprobar los valores de resumen
Los gráficos suelen ir acompañados de valores de resumen que describen y sintetizan los datos subyacentes. Los valores de resumen, también conocidos como estadÃsticas de resumen, comunican información general sobre los datos y, a menudo, revelan información significativa que vale la pena considerar e investigar más a fondo. La siguiente tabla le ayudará a familiarizarse con los valores de resumen más comunes.
Valor de resumen |
Descripción |
---|---|
Suma |
Total de los valores |
Recuento |
El número de valores |
Media |
La media de los números calculada al dividir el total de los números (suma) por el número de valores en el conjunto de datos (recuento) |
Mediana |
El valor de en medio en un conjunto de datos en el que los valores se ubicaron en orden de magnitud (de menor a mayor). |
Modo |
El valor más frecuente |
Intervalo |
La diferencia entre el mÃnimo y el máximo |
MÃnimo |
El valor más pequeño |
Máximo |
El valor más grande |
Comprobar tasas y porcentajes
Las tasas y los porcentajes miden una relación entre valores. Por ejemplo, puede observar que tres de cada cinco asistentes a una presentación se registran para recibir un boletÃn informativo. Usted indica que â…—, 0,60 o 60 % de los asistentes se suscribieron al boletÃn. Como verá en la siguiente sección, a menudo, conocer la tasa o el porcentaje le ayudará a hacer mejores comparaciones.
Por ejemplo, el titular de un artÃculo indicaba: "2139 beneficiarios de DACA condenados o acusados de delitos". Esto podrÃa parecer un gran número sin contexto. Sin embargo, si ve la tasa o el porcentaje, obtendrá una nueva visión. En el mismo artÃculo, se afirma que hay más de 800 000 beneficiarios de DACA. Si considera la tasa o el porcentaje, obtiene 2139/800 000, que es aproximadamente 0,003 o 0,3 %. El porcentaje es un valor más informativo, y este no es un gran porcentaje del total de beneficiarios.
Tener cuidado con los datos insuficientes
"Ningún gráfico puede capturar la realidad en toda su riqueza. Sin embargo, un gráfico puede empeorar o mejorar según su capacidad para lograr un equilibrio entre simplificar demasiado esa realidad y hacerla más compleja con demasiados detalles". –Alberto Cairo, How Charts Lie
Cuando lea los gráficos, pregúntese si se incluyen suficientes datos para proporcionar una versión significativa y precisa de la historia. En su libro How Charts Lie, Albert Cairo explica cómo la insuficiencia de datos puede llevar a sacar conclusiones incorrectas. Para probar este punto, Cairo se refiere a un artÃculo que indica que la Ley de Empleos y Reducción de Impuestos (TCJA, por sus siglas en inglés) de 2017 prometÃa que la familia tÃpica de cuatro miembros ahorrarÃa 1182 $ al año, y explica cómo ese número no representaba la historia completa. Para mostrar una historia más completa, Cairo describió un histograma, una distribución de datos cuantitativos que muestra los datos agrupados en intervalos.
Vamos a analizar por qué este número es una simplificación excesiva observando el histograma. Al mirar los datos en el histograma, observe que hay un intervalo significativo de salarios representados. Debido a este amplio intervalo, serÃa muy difÃcil determinar un salario "tÃpico". Claramente, hay una variedad significativa de salarios en Estados Unidos. Mientras que el 3 % de los hogares ganaba menos de 5000 $ al año, más del 9 % ganaba más de 200 000 %. Analizar la media de ahorros de TCJA es casi insignificante , ya que es casi imposible calcular un "salario tÃpico" preciso en primer lugar.
En la siguiente unidad, aprenderá la importancia de utilizar intervalos de tamaño uniforme en los ejes.
Recursos
- Trailhead: Fundamentos de la alfabetización de datos
- Trailhead: Agregación y granularidad
- Trailhead: Distribuciones de datos
- Libro: Alberto Cairo (2020): How Charts Lie: Getting Smarter About Visual Information, W.W. Norton & Company
- Libro: Edward Tufte (2006): Beautiful Evidence. Graphics Press
- Sitio de Tableau: Understanding and Using Histograms
- Libro: Steve Few (2012) Show Me the Numbers, Analytics Press