Skip to main content

Cuestione los datos

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

  • Investigar la fuente de datos y los gráficos.
  • Evaluar la confiabilidad de los datos y el análisis.
Nota

Algunas de las imágenes enumeradas en esta unidad se usaron con permiso de Alberto Cairo y se tomaron de su libro Cómo mienten los gráficos: Cómo ser más inteligente en relación con la información visual.

Conozca la fuente

“Desconfíe de cualquier publicación que no mencione o vincule claramente las fuentes de las historias que se publican” (Alberto Cairo, experto en visualización de datos y autor de Cómo mienten los gráficos).

Algunas de las imágenes enumeradas en esta unidad se usaron con permiso de Alberto Cairo y se tomaron de su libro Cómo mienten los gráficos: Cómo ser más inteligente en relación con la información visual.

Es importante identificar y evaluar la fuente de los datos y los gráficos que encuentre, desde informes comerciales hasta publicaciones en redes sociales. Conocer la fuente es el primer paso (¡y el más importante!) para determinar si un gráfico es engañoso. Para investigar la fuente, haga preguntas para llegar al corazón de quién, qué, dónde, cuándo y por qué se creó el gráfico.

Tema para investigar

Objetivo

Preguntas que se deben formular

Quién

Verificar la fuente de los datos y si existen intereses creados en producir la información o presentarla de cierta manera.

  • ¿Quién es responsable de los datos, los análisis y las presentaciones resultantes?
  • ¿Quién recopiló y analizó los datos, o quién los creó?
  • ¿Se pagó al autor por recopilar, analizar y presentar los datos? Si es así, ¿existen posibles conflictos de intereses?
  • ¿El autor o editor del gráfico es una autoridad en el tema?
  • ¿Hubo una organización en particular o múltiples organizaciones involucradas en el trabajo?

Qué

Comprender el tipo de datos recopilados y cómo se midieron para que pueda verificar la precisión de los datos presentados.

  • ¿Qué métodos se usaron para recopilar y preparar los datos?
  • ¿Qué tipos de datos presenta el autor?
  • ¿Qué tipos de medidas se tomaron y qué tan precisas son esas medidas?
  • ¿Cuál fue el tamaño de la muestra de los datos?
  • ¿A cuántas personas se encuestó y cuál fue el desglose demográfico de los encuestados?

Dónde

Evaluar los métodos de recopilación de datos usados y evaluar aún más la credibilidad y el contexto de la fuente.

  • ¿Se recopilaron los datos de una región, estado o país en particular?
  • ¿Los datos se recopilaron en diferentes lugares?
  • ¿Los datos están disponibles en el sitio web de una fuente creíble?

Cuándo 

Determinar la relevancia de los datos usados en función de cuándo se recopilaron.

  • ¿Están actualizados los datos?
  • ¿Los datos retroceden en el tiempo? Si es así, ¿cuánto tiempo?
  • ¿Se recopilaron datos anualmente, mensualmente, diariamente o incluso por minuto o segundo?

Por qué

Detectar posibles motivaciones financieras, políticas, científicas, filantrópicas o de otro tipo que puedan influir en la objetividad de los datos presentados.

  • ¿Tuvieron los autores algún motivo en particular para recopilar los datos y hacer el análisis?
  • ¿Una empresa le pagó a un investigador para probar un nuevo producto?
  • ¿Fue un estudio del Gobierno patrocinado por la comunidad?

Como ayuda para cuestionar los datos, asegúrese de estudiar los metadatos, que son los datos sobre los datos. Lea cualquier documentación adjunta para recopilar información útil de los metadatos, como cuándo, cómo y por qué se recopilaron los datos.

Nota

Para obtener más consejos sobre cómo evaluar eficazmente la credibilidad de sus fuentes, consulte la Guía de investigación para consumidores de información inteligente de la Universidad de Washington.

Revise los números

¿Conoce el dicho “si entra basura, sale basura”? El concepto detrás de esta frase común es que la calidad de cualquier resultado está determinada por la calidad de lo que se ingresa. Esta idea se aplica a una amplia variedad de aspectos, incluido el consumo de datos. Cuando observa visualizaciones, como gráficos que se basan en datos inexactos (entrada basura), corre el riesgo de sacar conclusiones imprecisas y tomar medidas ineficientes (salida basura). Para ayudar a determinar la calidad y la precisión de los datos presentados en las visualizaciones, revise la mayor cantidad de números subyacentes que pueda.

Compruebe los valores de resumen

Los gráficos suelen ir acompañados de valores de resumen que describen y resumen los datos subyacentes. Los valores de resumen, también conocidos como estadísticas de resumen, comunican información de alto nivel sobre los datos y, a menudo, revelan información significativa que vale la pena considerar e investigar más a fondo. La siguiente tabla lo ayudará a familiarizarse con los valores de resumen más comunes.

Valor de resumen

Descripción

Suma

Total de los valores. 

Conteo

El número de valores.

Promedio

Promedio de los números, calculado dividiendo el total de los números (suma) por el número de valores en el conjunto de datos (recuento).

Mediana

El valor medio en un conjunto de datos en el que los valores se ubicaron en orden de magnitud (de menor a mayor).

Modo

El valor más frecuente.

Intervalo

La diferencia entre el mínimo y el máximo.

Mínimo

El valor más bajo

Máximo

El valor mayor

Nota

Estos son solo algunos valores de resumen comunes que puede encontrar, pero hay muchos más. Para obtener más información, consulte los módulos Distribuciones de datos y Agregación y granularidad.

Comprobar tasas y porcentajes

Las tasas y los porcentajes miden una relación entre valores. Por ejemplo, puede observar que tres de cada cinco asistentes a una presentación se registran para recibir un boletín informativo. Usted indica que ⅗, 0,60 o 60 % de los asistentes se suscribieron al boletín. Como verá en la siguiente sección, a menudo, conocer la tasa o el porcentaje lo ayudará a hacer mejores comparaciones. 

Por ejemplo, el titular de un artículo indicaba: “2139 beneficiarios de DACA condenados o acusados de delitos”. Esto podría parecer un gran número sin contexto. Sin embargo, si ve la tasa o el porcentaje, obtendrá una visión nueva. En el mismo artículo, se afirma que hay más de 800 000 beneficiarios de DACA. Si considera la tasa o el porcentaje, obtiene 2139/800 000, que es aproximadamente 0,003 o 0,3%. El porcentaje es un valor más informativo, y este no es un gran porcentaje del total de beneficiarios.

Esté atento a los datos insuficientes

“Ningún gráfico puede capturar la realidad en toda su riqueza. Sin embargo, un gráfico puede empeorar o mejorar según su capacidad para lograr un equilibrio entre simplificar demasiado esa realidad y complejizarla con demasiados detalles” (Alberto Cairo, Cómo mienten los gráficos)

Cuando lea los gráficos, pregúntese si se incluyen suficientes datos para proporcionar una versión significativa y precisa de la historia. En su libro Cómo mienten los gráficos, Albert Cairo explica cómo la insuficiencia de datos puede llevar a sacar conclusiones incorrectas. Para probar este punto, Cairo se refiere a un artículo que indica que la Ley de Empleos y Reducción de Impuestos (TCJA, por sus siglas en inglés) de 2017 prometía que la familia típica de cuatro miembros ahorraría $1182 al año, y explica cómo ese número no representaba la historia completa. Para mostrar una historia más completa, Cairo describió un histograma, una distribución de datos cuantitativos que muestra los datos agrupados en rangos. 

Histograma que muestra la distribución del ingreso familiar de los hogares en los Estados Unidos en 2017.

Analicemos por qué este número es una simplificación excesiva mirando el histograma. Al mirar los datos en el histograma, observe que hay un rango significativo de salarios representados. Debido a esta amplia gama, sería muy difícil determinar un salario “típico”. Claramente, hay una variedad significativa de salarios en los Estados Unidos. Mientras que el 3 % de los hogares ganaba menos de $5000 por año, más del 9 % ganaba más de $200 000. Analizar los ahorros promedio de TCJA es casi insignificante cuando es casi imposible calcular un “salario típico” preciso en primer lugar.

Nota

Para obtener más información sobre las distribuciones, complete el módulo Distribuciones de datos.

En la siguiente unidad, aprenderá la importancia de usar intervalos de tamaño uniforme en los ejes. 

Recursos

Comparta sus comentarios de Trailhead en la Ayuda de Salesforce.

Nos encantaría saber más sobre su experiencia con Trailhead. Ahora puede acceder al nuevo formulario de comentarios en cualquier momento en el sitio de Ayuda de Salesforce.

Más información Continuar a Compartir comentarios