Realizar inferencias
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir para qué sirven las pruebas de hipótesis.
- Definir el uso y las limitaciones de los valores p en las pruebas de hipótesis.
Introducción
En la unidad anterior, se familiarizó con los conceptos de variación y distribución normal para explorar, interpretar los datos y comunicarse con ellos. También exploró los intervalos de confianza como un ejemplo de inferencia.
En esta unidad, continúa aprendiendo las inferencias. La inferencia es un proceso que implica extraer conclusiones sobre una población a partir de una muestra de los datos. Esta herramienta resulta útil porque, en la mayoría de los casos, no es posible obtener todas las mediciones para una población determinada.
En otras palabras, si tenemos datos de todos los miembros de una población, no necesitamos hacer ninguna inferencia sobre la diferencia entre los grupos que conforman esa población. Cuando no es posible recopilar datos para cada uno de los miembros de una población, recopilamos datos de muestras y, luego, hacemos inferencias.
Ben Jones es autor del libro Evitar las trampas de datos (en inglés), además de fundador y director ejecutivo de Data Literacy, LLC, y miembro de la comunidad de Tableau. En su libro, afirma que el censo en los Estados Unidos se realiza solo una vez cada diez años debido a lo costoso y complicado que es tratar de contar a “todas y cada una de las personas en cada una de las estructuras residenciales de todo el país, una empresa que no está exenta de sesgos y errores”. Debido a que la mayoría de las organizaciones no tienen recursos financieros ni humanos similares a los del gobierno federal de EE. UU., basan sus decisiones en inferencias realizadas a partir de muestras de datos.
Pruebas de hipótesis
Muchos tipos de organizaciones utilizan pruebas de hipótesis. Algunas empresas, por ejemplo, utilizan pruebas de hipótesis de control de calidad a fin de saber si un determinado producto cumple con un estándar o para comparar métodos de venta nuevos y anteriores.
En general, en la investigación médica también se realizan inferencias a partir de muestras de datos. Imagine que una empresa de biotecnología fabricó un nuevo fármaco para paliar una enfermedad. A fin de determinar si el medicamento funciona, se debe realizar un experimento o ensayo controlado. Debido a que no es posible experimentar con todas las personas que tienen la enfermedad, se toma una muestra aleatoria de un subconjunto de personas que padecen esa enfermedad para realizar las pruebas.
Dentro de esta muestra, el grupo experimental recibe el tratamiento y el grupo de control recibe un placebo en lugar de la medicación. Los grupos se asignan al azar para que cualquier diferencia en los resultados de salud pueda atribuirse a la intervención de la investigación.
Se preparan pruebas para ambos grupos y se toman medidas. Al analizar las diferencias entre los dos grupos, los investigadores deciden cuán separados deben estar los resultados para determinar si los resultados de salud para el grupo experimental y el grupo de control son significativamente diferentes.
Los investigadores recopilan datos de los grupos de muestra y ejecutan las pruebas estadísticas correspondientes. Luego, usan los resultados de estas pruebas para decidir si hay una diferencia significativa entre los grupos. Una vez que se obtienen los datos, los investigadores deben hacer inferencias sobre el conjunto de la población, esto significa todas las personas que padecen la enfermedad. Esto se conoce como pruebas de hipótesis.
Las pruebas de hipótesis comienzan con la creación de una declaración de hipótesis nula y una alternativa.
- La hipótesis nula establece que el medicamento no tendrá efecto en los resultados de salud. Propone que quienes reciban el tratamiento no tendrán resultados diferentes de quienes no lo reciban.
- La hipótesis alternativa establece que habrá una diferencia en los resultados de salud. Propone que aquellos que reciban el medicamento mostrarán mejores resultados de salud que aquellos que no.
Las pruebas de hipótesis comienzan suponiendo que la hipótesis nula es verdadera. Las pruebas tienen como objetivo discernir cuán probable es lograr resultados que sean al menos tan buenos como en el experimento, suponiendo que la hipótesis nula sea verdadera.
En otras palabras, si hay una pequeña probabilidad de que los resultados sean tan buenos si la hipótesis nula es verdadera, entonces hay evidencia para respaldar la hipótesis alternativa. Si hay una gran probabilidad de que los resultados sean tan buenos si la hipótesis nula es verdadera, entonces no hay evidencia suficiente para respaldar la hipótesis alternativa y los investigadores deberían volver a intentarlo con una fórmula nueva.
Las pruebas de hipótesis tienen en cuenta el número de muestras, el tamaño de la diferencia medida y la cantidad de variación observada en cada grupo.
El resultado numérico de una prueba de hipótesis (la probabilidad de que la hipótesis nula sea verdadera) se conoce como valor p. Un valor p ayuda a determinar si se rechaza la hipótesis nula. En este caso, rechazar la hipótesis nula significa que el tratamiento funcionaría en el conjunto de la población. Un valor p pequeño indica que hay suficiente evidencia para rechazar la hipótesis nula y apoyar la hipótesis alternativa.
Sin embargo, es importante tener en cuenta que el valor p no demuestra ni refuta nada. Un valor p alto no demuestra que la hipótesis nula sea válida, y un valor p bajo no demuestra que no lo sea. Es por eso que los valores p deben analizarse cuidadosamente.
Cómo utilizar los valores p
Hubo una época en que los investigadores usaban el valor p de 0,05 como punto de corte. En otras palabras, se creía que un valor p de 0,05 o menos era suficiente para rechazar la hipótesis nula. El punto de corte de 0,05 corresponde a los extremos de la distribución normal. Recuerde que los intervalos de confianza del 95 % coinciden con el área de la distribución normal que se encuentra dentro de las desviaciones estándar de -2 y +2 respecto de la media. El punto de corte de 0,05 (o un 5 %) corresponde al área que se encuentra fuera de las desviaciones estándar de -2 y +2 respecto de la media.
En los últimos años, esa práctica se corrigió. En un ensayo para un medicamento, si se utilizara un punto de corte más bajo (con lo que aumentaría efectivamente el intervalo de confianza por encima del 95 %), podría resultar más difícil rechazar la hipótesis nula.
Por estas razones, y muchas otras, la Asociación Estadounidense de Estadística emitió una declaración en 2016 en la que afirmaba lo siguiente: “Por sí mismo, un valor p no proporciona una medida fiable con respecto a un modelo o una hipótesis”.
Los valores p también pueden ser manipulados por el tipo de datos que se incluye en el análisis.
Para ver un ejemplo de cómo se pueden manipular los valores p, explore esta actividad interactiva de manipulación del valor p, “Hackear el camino a la gloria científica” (en inglés), en FiveThirtyEight, un sitio web de agregación de encuestas en el que también se analizan encuestas de opinión, política, economía y deportes.
Ahora ya sabe qué son la inferencia, las pruebas de hipótesis y los valores p. Comprender estos conceptos puede ayudar a medir, resumir, hacer comparaciones y sacar conclusiones informadas con sus datos.
Recursos
- Artículo: La declaración de la ASA sobre los valores p: Contexto, proceso y propósito. The American Statistician, 2016
- Libro: Cairo, Alberto. El arte veraz: Datos, gráficos y mapas para la comunicación (en inglés). Indianápolis, IN: New Riders, 2016
- Blog: “Explicación de visualizaciones en The New York Times, NPR y la BBC” (en inglés). The Functional Art (blog), 2019. Enlace al blog. Acceder al sitio web profesional de Alberto Cairo
- Artículo: “Esos mapas de huracanes no significan lo que cree que significan” (en inglés). The New York Times, 2019. Enlace al artículo
- Artículo: “Hackear el camino a la gloria científica” (en inglés). FiveThirtyEight. ABC News Internet Ventures
- Libro: Jones, Ben. Evitar las trampas de datos: Cómo mantenerse alejado de los errores comunes al trabajar con datos y presentar análisis y visualizaciones (en inglés). Hoboken, NJ: John Wiley & Sons, 2019
- Sitio web: Data Literacy de Ben Jones
- Libro: Lane, David M. Introducción a la estadística (en inglés). Educación sobre estadística en línea: Curso de estudio multimedia interactivo, 2020