Realizar inferencias

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

Describir el objetivo de las pruebas de hipótesis.
Definir el uso y las limitaciones de los valores p en las pruebas de hipótesis.

Introducción

En la unidad anterior, se familiarizó con los conceptos de variación y distribución normal para explorar, interpretar los datos y comunicarse con ellos. También exploró los intervalos de confianza como un ejemplo de inferencia.

En esta unidad, continuará aprendiendo las inferencias. La inferencia es un proceso que implica extraer conclusiones sobre una población a partir de una muestra de los datos. Esta herramienta resulta útil porque, en la mayoría de los casos, no es posible obtener todas las mediciones para una población determinada.

En otras palabras, si tenemos datos de todos los miembros de una población, no necesitamos hacer ninguna inferencia sobre la diferencia entre los grupos que conforman esa población. Cuando no es posible recopilar datos para cada uno de los miembros de una población, recopilamos datos de muestras y, después, hacemos inferencias. Monigotes en un óvalo grande que representa la población total y una cantidad más pequeña de monigotes en un óvalo más pequeño que representa la muestra

Ben Jones es autor del libro Avoiding Data Pitfalls, además de fundador y director ejecutivo de Data Literacy, LLC y miembro de la comunidad de Tableau. En su libro, afirma que el censo de Estados Unidos se realiza solo una vez cada diez años debido a lo costoso y complicado que es tratar de contar a todas y cada una de las personas de las estructuras residenciales de todo el país; esta es una tarea que no está exenta de sesgos y errores. Debido a que la mayoría de las organizaciones no tienen recursos financieros ni humanos similares a los del gobierno federal de EE. UU., basan sus decisiones en inferencias realizadas a partir de muestras de datos.

Pruebas de hipótesis

Muchos tipos de organizaciones utilizan pruebas de hipótesis. Algunas empresas, por ejemplo, utilizan pruebas de hipótesis de control de calidad a fin de saber si un determinado producto cumple con un estándar o para comparar métodos de venta nuevos y anteriores.

En general, en la investigación médica también se realizan inferencias a partir de muestras de datos. Imagine que una empresa de biotecnología fabricó un nuevo fármaco para aliviar una enfermedad. A fin de determinar si el medicamento funciona, se debe realizar un experimento o ensayo controlado. Debido a que no es posible experimentar con todas las personas que tienen la enfermedad, se toma una muestra aleatoria de un subconjunto de personas que padecen esa enfermedad para realizar las pruebas.

Un gráfico de flujo con rectángulos de colores que muestra que hay asignaciones aleatorias que dividen grupos y se miden los efectos en cada grupo

Dentro de esta muestra, el grupo experimental recibe el tratamiento y el grupo de control recibe un placebo en lugar de la medicación. Los grupos se asignan al azar para que cualquier diferencia en los resultados de salud pueda atribuirse a la intervención de la investigación.

Se preparan pruebas para ambos grupos y se toman medidas. Al analizar las diferencias entre los dos grupos, los investigadores deciden el nivel de lejanía al que deben estar los resultados para determinar si los resultados de salud para el grupo experimental y el grupo de control son significativamente diferentes.

Los investigadores recopilan datos de los grupos de muestra y ejecutan las pruebas estadísticas correspondientes. A continuación, utilizan los resultados de estas pruebas para decidir si hay una diferencia significativa entre los grupos. Una vez que se obtienen los datos, los investigadores deben hacer inferencias sobre el conjunto de la población, es decir, todas las personas que padecen la enfermedad. Esto se conoce como pruebas de hipótesis.

Las pruebas de hipótesis comienzan con la creación de una declaración de hipótesis nula y una alternativa.

La hipótesis nula establece que el medicamento no tendrá efecto en los resultados de salud. Propone que quienes reciban el tratamiento no tendrán resultados diferentes de quienes no lo reciban.
La hipótesis alternativa establece que habrá una diferencia en los resultados de salud. Propone que aquellos que reciban el medicamento mostrarán mejores resultados de salud que los que no lo reciban.

Las pruebas de hipótesis comienzan suponiendo que la hipótesis nula es verdadera. Las pruebas tienen como objetivo discernir la probabilidad de lograr resultados que sean al menos tan buenos como en el experimento, suponiendo que la hipótesis nula sea verdadera.

En otras palabras, si hay una pequeña probabilidad de que los resultados sean tan buenos si la hipótesis nula es verdadera, entonces hay evidencia para respaldar la hipótesis alternativa. Si hay una gran probabilidad de que los resultados sean tan buenos si la hipótesis nula es verdadera, entonces no hay evidencia suficiente para respaldar la hipótesis alternativa y los investigadores deberían volver a intentarlo con una fórmula nueva.

Las pruebas de hipótesis tienen en cuenta el número de muestras, el tamaño de la diferencia medida y la cantidad de variación observada en cada grupo.

El resultado numérico de una prueba de hipótesis (la probabilidad de que la hipótesis nula sea verdadera) se conoce como valor p. Un valor p ayuda a determinar si se rechaza la hipótesis nula. En este caso, rechazar la hipótesis nula significa que el tratamiento funcionaría en el conjunto de la población. Un valor p pequeño indica que hay suficiente evidencia para rechazar la hipótesis nula y apoyar la hipótesis alternativa.

Sin embargo, es importante tener en cuenta que el valor p no demuestra ni desmiente nada. Un valor p alto no demuestra que la hipótesis nula sea válida, y un valor p bajo no demuestra que no lo sea. Es por eso que los valores p deben analizarse cuidadosamente.

Cómo utilizar los valores p

Hubo una época en la que los investigadores utilizaban el valor p de 0,05 como punto de corte. En otras palabras, se creía que un valor p de 0,05 o menos era suficiente para rechazar la hipótesis nula. El punto de corte de 0,05 corresponde a los extremos de la distribución normal. Recuerde que los intervalos de confianza del 95 % coinciden con el área de la distribución normal que se encuentra dentro de las desviaciones estándar de -2 y +2 con respecto a la media. El punto de corte de 0,05 (o 5 %) corresponde al área que se encuentra fuera de las desviaciones estándar de -2 y +2 con respecto a la media.

En los últimos años, esa práctica se ha corregido. En un ensayo para un medicamento, si se utilizara un punto de corte más bajo (con lo que aumentaría eficazmente el intervalo de confianza por encima del 95 %), podría resultar más difícil rechazar la hipótesis nula.

Por estas razones, y muchas otras, la Asociación Estadounidense de Estadística emitió una declaración en 2016 en la que afirmaba lo siguiente: "Por sí mismo, un valor p no proporciona una medida fiable con respecto a un modelo o una hipótesis".

Los valores p también pueden manipulados por el tipo de datos que se incluye en el análisis.

Para ver un ejemplo de cómo se pueden manipular los valores p, observe esta actividad interactiva de manipulación del valor p, Hack Your Way to Scientific Glory, en FiveThirtyEight, un sitio web de agregación de encuestas en el que también se analizan encuestas de opinión, política, economía y deportes.

Ahora ya sabe qué son la inferencia, las pruebas de hipótesis y los valores p. Comprender estos conceptos puede ayudar a medir, describir, resumir, hacer comparaciones y sacar conclusiones fundamentadas con sus datos.

Recursos

Artículo: The ASA Statement on P-Values: Context, Process, And Purpose. The American Statistician, 2016
Libro: Cairo, Alberto. The Truthful Art: Data, Charts, and Maps for Communication. Indianapolis, IN: New Riders, 2016
Blog: Explaining visualizations in The New York Times, NPR, and the BBC.” The Functional Art (blog), 2019. Enlace al blog. Acceder al sitio web profesional de Alberto Cairo
Artículo: Those Hurricane Maps Don’t Mean What You Think They Mean. The New York Times, 2019. Enlace al artículo
Artículo: Hack Your Way to Scientific Glory. FiveThirtyEight. ABC News Internet Ventures
Libro: Jones, Ben. Avoiding Data Pitfalls: How to Steer Clear of Common Blunders When Working with Data and Presenting Analysis and Visualizations. Hoboken, NJ: John Wiley & Sons, 2019
Sitio web: Data Literacy by Ben Jones
Libro: Lane, David M. Introduction to Statistics. Online Statistics Education: An Interactive Multimedia Course of Study, 2020

Estimación de tiempo

Temas

¿Necesita ayuda?

Recursos de Tableau