Considerar la fuente de datos
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Mejorar el contexto de sus datos.
- Identificar las preguntas que debe hacer sobre sus datos.
- Explicar por qué quién está o no incluido en sus datos es algo que afecta a sus análisis.
Elimine el sesgo de los datos
Del mismo modo en que analizar datos defectuosos genera resultados defectuosos, intentar visualizar datos defectuosos también generará tableros y gráficos engañosos y decepcionantes.
Cuando piense en la honestidad ante todo, verifique sus datos para detectar formas en que los datos puedan estar sesgados o puedan ser el producto de sistemas de recopilación de datos racistas u opresivos. Si los datos subyacentes a la visualización están sesgados, la visualización amplificará ese sesgo y el daño que genera ese sesgo.
¿Cómo se elimina el sesgo del análisis de datos? Mediante la incorporación de una perspectiva equitativa en un proyecto desde el principio. Pregunte:
- ¿Quiénes son los miembros del equipo involucrados en la creación del análisis?
- ¿El equipo o la organización son diversos?
- ¿Son primordiales las cuestiones de diversidad, equidad e inclusión (DEI)?
- ¿Estos problemas son familiares para el equipo/la organización?
Examine de cerca cómo se diseña un estudio, cómo se recopilan los datos y cómo se realiza el análisis de esos datos y se comunican los resultados. Esta no es una solución mágica, pero esta perspectiva más amplia puede ser fundamental para eliminar el sesgo de la investigación, el análisis y la comunicación de datos.
Reconozca el sesgo en los datos
Un marco sólido para abordar los datos puede ayudar a los analistas de datos, comunicadores e investigadores a identificar y manejar datos potencialmente sesgados. Considere las siguientes preguntas.
- ¿Cómo se generaron estos datos?
- ¿Por qué se recopilaron estos datos?
- ¿De quiénes son las voces, las vidas y las experiencias que se incluyeron en esos datos, y de quiénes son las que se excluyeron de estos datos?
- ¿Qué porcentaje de estos datos se puede desglosar por raza, género, origen étnico, etc.?
- ¿Los datos son demográficamente representativos?
- ¿Quién se beneficiará y quién podría verse perjudicado por la recopilación o publicación de estos datos?
Los datos, en particular los datos recopilados sobre las personas, no son neutrales ni objetivos. Reflejan los sesgos conscientes e inconscientes, así como el punto de vista, de los investigadores o recopiladores de datos. Este punto es importante porque la aplicación de una lente DEI por sí sola no puede corregir datos o análisis sesgados. Como investigador, analista y comunicador de datos, es esencial que considere las causas fundamentales de las disparidades reveladas en los datos y que enmarque su trabajo con esa información en la mente.
Dé prioridad a la inclusión
Es importante reconocer quién está y quién no está incluido en sus datos y visualizaciones. Como investigador, ¿puede ayudar a su organización a realizar encuestas que sean más inclusivas? El hecho de que pueda ser más difícil obtener datos sobre ciertos grupos no significa que no deba intentar comprender mejor sus vidas.
A menudo, los grupos cuyos datos no se recopilan o no se muestran reflejan a qué grupos la sociedad considera menos importantes. Por el contrario, lo que ignora puede revelar sesgos e indiferencias sociales ocultos. La cartografía nos muestra un excelente ejemplo de esto: los mapas de los Estados Unidos con frecuencia no muestran los territorios de los Estados Unidos, borran poblaciones completas que no tienen representación en el Congreso y en su mayoría no son blancas.
Además, muchos gráficos sobre la raza muestran a los negros, los hispanos/latinos y los blancos, pero no a otros grupos raciales o étnicos, a menudo debido a limitaciones de datos, como tamaños de muestra pequeños o la falta absoluta de datos. Al pensar en los grupos faltantes y en quién está representado, tenga en cuenta lo importante que es usar datos inclusivos.
Mejore la inclusión en los datos
Para garantizar que sus datos sean lo más inclusivos posible, lidere con empatía y sensibilidad hacia todas las personas y siga las directrices a continuación.
Evite agrupar comunidades
Si hay un tamaño de muestra pequeño, las poblaciones a veces se agrupan para que el análisis sea más conveniente. Por ejemplo, un mapa que mostrara la raza y el origen étnico en los Estados Unidos podría incluir una agrupación de “Todos los demás grupos”, sin explicar qué grupos han sido excluidos. Hacer eso puede tener efectos nocivos en las comunidades que están agrupadas.
El uso de tamaños de muestra pequeños para grupos que ya están subrepresentados es una elección realizada por los privilegiados, no una limitación inherente a las poblaciones pequeñas. En términos prácticos, sin embargo, los tamaños de muestra pequeños a veces son inevitables debido a limitaciones de tiempo o presupuesto. Pero puede hacerlo mejor reconociendo dónde la agregación puede enmascarar la variación dentro de ciertos grupos o cuándo los tamaños de muestra pequeños no permiten que las estadísticas y la ciencia se lleven a cabo de manera objetiva y precisa. Como productor de datos (alguien que diseña y publica encuestas), también debe tratar de ampliar el número de grupos recopilados en sus datos. Tanto los investigadores como los productores de datos deben esforzarse por hacer un mejor trabajo recopilando datos que reflejen las vidas de todas las personas, en lugar de colocar la carga en las comunidades ya marginadas.
Incluya categorías de género no binario
A veces, ciertas poblaciones quedan fuera de la recopilación de datos por completo. Muchas encuestas federales importantes, por ejemplo, no ofrecen opciones de respuesta no binarias o transgénero cuando se pregunta sobre género. Esto presenta una oportunidad para que usted deje claro a sus lectores qué información tiene y no tiene en sus datos.
Señalar la ausencia de categorías no binarias puede hacer que el próximo investigador de datos y comunicador realice los cambios necesarios en sus futuras encuestas y visualizaciones. Se necesita que todo el ecosistema de productores de datos, consumidores y comunicadores trabaje en conjunto para alcanzar los objetivos de inclusión.
Busque alternativas para “Otros”
Es importante comprender la importancia de usar un lenguaje inclusivo al segmentar grupos. ¿Cuál es el enfoque correcto para analizar y comunicar a esos “Otros”? ¿Puede usar un lenguaje más inclusivo para hablar sobre este grupo? En primer lugar, debe comprender qué está midiendo la categoría. Esto puede incluir una amplia gama de razas, orígenes étnicos, religiones, otras características y sus intersecciones. Si bien esta opción es útil para las personas que no se ven a sí mismas en las categorías habituales, debe preguntarse si agrupar a personas con características y experiencias de vida tan variadas es realmente significativo.
Aquí hay seis alternativas posibles a “Otros”:
- Otra raza
- Grupos adicionales
- Todas las demás autodescripciones
- Personas que se identifican como otras razas o múltiples razas
- Identidad no listada
- Identidad no incluida en la encuesta
Algunos de estos términos son más largos, y es posible que no quepan bien en una tabla o debajo de una barra de un gráfico de barras. Pero son más inclusivos y evitan algunos problemas que ya analizamos. Es importante considerar que estas etiquetas pueden no ser las opciones exactas disponibles para los encuestados y que se marcó “Otro” porque no había otra opción disponible.
Si tiene esa inquietud, se puede incluir una nota simple o una nota al pie para reconocer el cambio de los datos sin procesar en su presentación de los resultados. No obstante, estas alternativas son, en el sentido general, verdaderas y precisas, por lo que puede agregar una nota o nota al pie separada del gráfico, tabla o texto para que el cambio sea claro para los lectores.
Si no incluye todos los grupos, proporcione una explicación
En los casos en que se recopilaron datos sobre un grupo específico, pero ese grupo no se presentó en el gráfico o no se incluyó en el análisis, sea transparente acerca de sus métodos: indique qué grupos se incluyeron en el conjunto de datos original. De manera alternativa, las discrepancias en la investigación de datos se pueden indicar sin desinformar a los lectores.
Recursos
- Entrevista: ¿Cómo podemos poner la honestidad ante todo con los datos?
- Video: Guía de Honestidad ante todo
- Transcripción del video: Guía de Honestidad ante todo
- Sitio web: La Honestidad ante todo de Tableau
- Documento: Recomendaciones consolidadas de Urban Institute
- Libro: Data Feminism, de Catherine D’Ignazio y Lauren F. Klein