Skip to main content
Únase a nosotros en TDX, en San Francisco, o en Salesforce+ los días 5 y 6 de marzo en la conferencia para desarrolladores sobre la era de agentes de IA. Registrarse ahora.

Cuestionar los datos

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

  • Investigar la fuente de datos y los gráficos.
  • Evaluar la confiabilidad de los datos y el análisis.
Nota

Las imágenes de esta unidad se han utilizado con permiso de Alberto Cairo y se han tomado de su libro How Charts Lie: Getting Smarter about Visual Information.

Conocer la fuente

"Desconfíe de cualquier publicación que no mencione o vincule claramente las fuentes de las historias que se publican". –Alberto Cairo, experto en visualización de datos y autor de How Charts Lie

Algunas de las imágenes de esta unidad se han utilizado con permiso de Alberto Cairo y se han tomado de su libro How Charts Lie: Getting Smarter about Visual Information.

Es importante identificar y evaluar la fuente de los datos y los gráficos que encuentre, desde informes comerciales hasta publicaciones en redes sociales. Conocer la fuente es el primer paso (y el más importante) para determinar si un gráfico es erróneo. Para investigar la fuente, haga preguntas para saber quién, qué, dónde, cuándo y por qué se creó el gráfico.

Tema para investigar

Objetivo

Preguntas para realizar

Quién

Para verificar la fuente de los datos y si existen intereses creados en producir la información o presentarla de cierta manera.

  • ¿Quién es responsable de los datos, los análisis y las presentaciones resultantes?
  • ¿Quién recopiló y analizó los datos, o quién los creó?
  • ¿Se pagó al autor por recopilar, analizar y presentar los datos? Si es así, ¿existen posibles conflictos de intereses?
  • ¿El autor o editor del gráfico es una autoridad en el tema?
  • ¿Hubo una organización en particular o múltiples organizaciones involucradas en el trabajo?

Qué

Para comprender el tipo de datos recopilados y cómo se midieron a fin de poder comprobar la precisión de los datos presentados.

  • ¿Qué métodos se utilizaron para recopilar y preparar los datos?
  • ¿Qué tipos de datos presenta el autor?
  • ¿Qué tipos de medidas se tomaron y qué nivel de precisión presentan?
  • ¿Cuál fue el tamaño de la muestra de los datos?
  • ¿A cuántas personas se encuestó y cuál fue el desglose demográfico de los encuestados?

Dónde

Para evaluar los métodos de recopilación de datos utilizados y evaluar aún más la credibilidad y el contexto de la fuente.

  • ¿Se recopilaron los datos de una región, estado o país en particular?
  • ¿Los datos se recopilaron en diferentes lugares?
  • ¿Los datos están disponibles en el sitio web de una fuente creíble?

Cuándo 

Para determinar la relevancia de los datos utilizados en función de cuándo se recopilaron.

  • ¿Están actualizados los datos?
  • ¿Los datos retroceden en el tiempo? Si es así, ¿cuánto tiempo?
  • ¿Se recopilaron datos anualmente, mensualmente, diariamente o incluso por minuto o segundo?

Por qué

Para detectar posibles motivaciones financieras, políticas, científicas, filantrópicas o de otro tipo que puedan influir en la objetividad de los datos presentados.

  • ¿Tuvieron los autores algún motivo en particular para recopilar los datos y hacer el análisis?
  • ¿Una empresa le pagó a un investigador para probar un nuevo producto?
  • ¿Fue un estudio del Gobierno patrocinado por la comunidad?

Como método de ayuda para cuestionar los datos, asegúrese de estudiar los metadatos, que son los datos sobre los datos. Lea cualquier documentación adjunta para recopilar información útil de los metadatos, como cuándo, cómo y por qué se recopilaron los datos.

Nota

Para obtener más consejos sobre cómo evaluar de manera eficaz la credibilidad de sus fuentes, consulte la Guía University of Washington’s Savvy Info Consumers Research Guide.

Revisar los números

¿Conoce el dicho "basura entra, basura sale?" El concepto detrás de esta frase común es que la calidad de cualquier resultado está determinada por la calidad de lo que se introduce. Esta idea se aplica a una amplia variedad de aspectos, incluido el consumo de datos. Al observar visualizaciones, como gráficos que se basan en datos inexactos (basura entra), corre el riesgo de sacar conclusiones imprecisas y tomar medidas ineficientes (basura sale). Para ayudar a determinar la calidad y la precisión de los datos presentados en las visualizaciones, compruebe la mayor cantidad de números subyacentes que pueda.

Comprobar los valores de resumen

Los gráficos suelen ir acompañados de valores de resumen que describen y sintetizan los datos subyacentes. Los valores de resumen, también conocidos como estadísticas de resumen, comunican información general sobre los datos y, a menudo, revelan información significativa que vale la pena considerar e investigar más a fondo. La siguiente tabla le ayudará a familiarizarse con los valores de resumen más comunes.

Valor de resumen

Descripción

Suma

Total de los valores 

Recuento

El número de valores

Media

La media de los números calculada al dividir el total de los números (suma) por el número de valores en el conjunto de datos (recuento)

Mediana

El valor de en medio en un conjunto de datos en el que los valores se ubicaron en orden de magnitud (de menor a mayor).

Modo

El valor más frecuente

Intervalo

La diferencia entre el mínimo y el máximo

Mínimo

El valor más pequeño

Máximo

El valor más grande

Nota

Estos son solo algunos valores de resumen comunes que puede encontrar, pero hay muchos más. Para obtener más información, consulte los módulos Distribuciones de datos y Agregación y granularidad.

Comprobar tasas y porcentajes

Las tasas y los porcentajes miden una relación entre valores. Por ejemplo, puede observar que tres de cada cinco asistentes a una presentación se registran para recibir un boletín informativo. Usted indica que â…—, 0,60 o 60 % de los asistentes se suscribieron al boletín. Como verá en la siguiente sección, a menudo, conocer la tasa o el porcentaje le ayudará a hacer mejores comparaciones. 

Por ejemplo, el titular de un artículo indicaba: "2139 beneficiarios de DACA condenados o acusados de delitos". Esto podría parecer un gran número sin contexto. Sin embargo, si ve la tasa o el porcentaje, obtendrá una nueva visión. En el mismo artículo, se afirma que hay más de 800 000 beneficiarios de DACA. Si considera la tasa o el porcentaje, obtiene 2139/800 000, que es aproximadamente 0,003 o 0,3 %. El porcentaje es un valor más informativo, y este no es un gran porcentaje del total de beneficiarios.

Tener cuidado con los datos insuficientes

"Ningún gráfico puede capturar la realidad en toda su riqueza. Sin embargo, un gráfico puede empeorar o mejorar según su capacidad para lograr un equilibrio entre simplificar demasiado esa realidad y hacerla más compleja con demasiados detalles". –Alberto Cairo, How Charts Lie

Cuando lea los gráficos, pregúntese si se incluyen suficientes datos para proporcionar una versión significativa y precisa de la historia. En su libro How Charts Lie, Albert Cairo explica cómo la insuficiencia de datos puede llevar a sacar conclusiones incorrectas. Para probar este punto, Cairo se refiere a un artículo que indica que la Ley de Empleos y Reducción de Impuestos (TCJA, por sus siglas en inglés) de 2017 prometía que la familia típica de cuatro miembros ahorraría 1182 $ al año, y explica cómo ese número no representaba la historia completa. Para mostrar una historia más completa, Cairo describió un histograma, una distribución de datos cuantitativos que muestra los datos agrupados en intervalos. 

Histograma que muestra la distribución de los ingresos familiares en Estados Unidos en 2017.

Vamos a analizar por qué este número es una simplificación excesiva observando el histograma. Al mirar los datos en el histograma, observe que hay un intervalo significativo de salarios representados. Debido a este amplio intervalo, sería muy difícil determinar un salario "típico". Claramente, hay una variedad significativa de salarios en Estados Unidos. Mientras que el 3 % de los hogares ganaba menos de 5000 $ al año, más del 9 % ganaba más de 200 000 %. Analizar la media de ahorros de TCJA es casi insignificante , ya que es casi imposible calcular un "salario típico" preciso en primer lugar.

Nota

Para obtener más información sobre las distribuciones, consulte el módulo Distribuciones de datos.

En la siguiente unidad, aprenderá la importancia de utilizar intervalos de tamaño uniforme en los ejes. 

Recursos

Comparta sus comentarios sobre Trailhead en la Ayuda de Salesforce.

Nos encantaría conocer su experiencia con Trailhead. Ahora puede acceder al nuevo formulario de comentarios cuando quiera desde el sitio de la Ayuda de Salesforce.

Más información Continuar para compartir comentarios