Fazer inferĂȘncias
Objetivos de aprendizagem
ApĂłs concluir esta unidade, vocĂȘ estarĂĄ apto a:
- Descrever o objetivo dos testes de hipĂłtese.
- Definir o uso e as limitaçÔes dos valores P nos testes de hipótese.
Introdução
Na unidade anterior, vocĂȘ viu conceitos em torno do uso da variação e da distribuição normal para explorar, interpretar e se comunicar com dados. VocĂȘ tambĂ©m viu intervalos de confiança como um exemplo de inferĂȘncia.
Nesta unidade, vocĂȘ continuarĂĄ a aprender sobre inferĂȘncia. A inferĂȘncia Ă© o processo de tirar conclusĂ”es sobre uma população com base em uma amostra dos dados. Ă Ăștil porque, na maioria dos casos, nĂŁo Ă© viĂĄvel obter todas as medidas em determinada população.
Em outras palavras, se temos dados para todos os membros de uma população, nĂŁo precisamos fazer nenhuma inferĂȘncia sobre a diferença entre grupos dentro dessa população. Quando nĂŁo Ă© possĂvel coletar dados para cada membro individual de uma população, coletamos dados de amostra e, em seguida, fazemos inferĂȘncias.
Em seu livro Avoiding Data Pitfalls (Evitando armadilhas nos dados), o autor Ben Jones, fundador e CEO da Data Literacy, LLC e membro da Tableau Community, aponta que o censo nos Estados Unidos acontece apenas uma vez por dĂ©cada devido ao quĂŁo caro e complicado Ă© tentar contar "cada pessoa em cada estrutura residencial em todo o paĂs, e tal iniciativa nĂŁo estĂĄ livre de preconceito e erro". Como a maioria das organizaçÔes nĂŁo tem recursos financeiros ou humanos iguais aos do Governo Federal dos EUA, elas baseiam suas decisĂ”es em inferĂȘncias feitas com a anĂĄlise de amostras de dados.
Testes de hipĂłtese
Muitos tipos de organizaçÔes usam testes de hipótese. Algumas empresas, por exemplo, usam testes de hipótese para controle de qualidade a fim de ver se determinado produto atende a um padrão ou para comparar novos e antigos métodos de vendas.
Pesquisas mĂ©dicas tambĂ©m frequentemente baseiam inferĂȘncias em amostras de dados. Imagine que uma empresa de biotecnologia fabricou uma nova droga para mitigar uma doença. Para determinar se a medicação funciona, um experimento controlado precisa ser realizado. Como nĂŁo Ă© possĂvel experimentar em cada pessoa que tem a doença, um subconjunto de pessoas com a doença sĂŁo sondadas aleatoriamente para testes.
Dentro dessa amostra, o grupo experimental recebe o tratamento e o grupo de controle recebe um placebo em vez da medicação. Os grupos sĂŁo atribuĂdos aleatoriamente para que eventuais diferenças nos desfechos de saĂșde possam ser atribuĂdas Ă intervenção da pesquisa.
SĂŁo definidos testes para ambos os grupos e mediçÔes sĂŁo feitas. Ao testar as diferenças entre os dois grupos, os pesquisadores decidem quĂŁo distantes os resultados precisam estar para determinar se os resultados de saĂșde para o grupo experimental e o grupo de controle sĂŁo significativamente diferentes.
Os pesquisadores coletam dados dos grupos de amostra e fazem os testes estatĂsticos apropriados. Em seguida, os pesquisadores usam esses resultados de teste para decidir se hĂĄ uma diferença significativa entre os grupos. Uma vez obtidos os dados, os pesquisadores precisarĂŁo fazer inferĂȘncias sobre a população em geral, ou seja, cada pessoa que tem a doença. Isso Ă© chamado de teste de hipĂłtese.
O teste de hipótese começa com a criação de afirmativas de hipótese nulas e alternativas.
- A hipĂłtese nula afirma que a medicação nĂŁo terĂĄ impacto nos resultados de saĂșde. Ela propĂ”e que aqueles que receberĂŁo o tratamento nĂŁo terĂŁo desfechos diferentes daqueles que nĂŁo receberĂŁo.
- A hipĂłtese alternativa afirma que haverĂĄ diferença nos resultados de saĂșde. Ela propĂ”e que aqueles que receberĂŁo a medicação apresentarĂŁo melhores resultados de saĂșde do que aqueles que nĂŁo a receberĂŁo.
Os testes de hipótese começam assumindo que a hipótese nula é verdadeira. Os testes visam a entender a probabilidade de encontrar resultados que serão pelo menos tão bons quanto no experimento, assumindo que a nula seja verdadeira.
Em outras palavras, se houver uma pequena probabilidade de que os resultados sejam tĂŁo bons quanto se a nula for verdade, entĂŁo haverĂĄ indĂcios para apoiar a hipĂłtese alternativa. Se houver uma grande probabilidade de que os resultados sejam tĂŁo bons se a nula for verdade, entĂŁo nĂŁo haverĂĄ indĂcios suficientes para apoiar a hipĂłtese alternativa, e os pesquisadores deverĂŁo tentar novamente com uma nova fĂłrmula.
Os testes de hipĂłtese levam em conta o nĂșmero de amostras, o tamanho da diferença medida e a quantidade de variação observada em cada grupo.
O resultado numĂ©rico de um teste de hipĂłtese (a probabilidade de que a hipĂłtese nula seja verdadeira) Ă© chamado de valor P. Um valor P ajuda a determinar se a hipĂłtese nula deve ser rejeitada ou nĂŁo. Neste caso, rejeitar a hipĂłtese nula significa que o tratamento funcionaria na população em geral. Um pequeno valor P indica que hĂĄ evidĂȘncias suficientes para rejeitar a hipĂłtese nula e apoiar a hipĂłtese alternativa.
Ă importante notar, no entanto, que o valor P nĂŁo prova nem refuta nada. Um alto valor P nĂŁo prova que a hipĂłtese nula Ă© vĂĄlida e um baixo valor P nĂŁo prova que Ă© invĂĄlida. Ă por isso que os valores P precisam ser considerados com cuidado.
Como usar os valores P
Em algum momento, os pesquisadores foram treinados para usar o valor P de 0,05 como corte. Em outras palavras, acreditava-se que um valor P de 0,05 ou inferior era suficiente para rejeitar a hipótese nula. O corte de 0,05 corresponde às caudas da distribuição normal. Lembre-se, intervalos de confiança de 95% correspondiam à årea da distribuição normal que se enquadra em um desvio padrão de -2 ou +2 da média. O corte de 0,05 (ou 5%) corresponde à årea que fica fora do desvio padrão de -2 ou +2 da média.
Esse raciocĂnio foi revisto nos Ășltimos anos. No experimento de medicação, se fosse utilizado um corte mais baixo (efetivamente aumentando o intervalo de confiança acima de 95%), poderia ser mais difĂcil rejeitar a hipĂłtese nula.
Por essas razĂ”es, e muitas outras, a Associação Americana de EstatĂstica (ASA) emitiu uma declaração em 2016 que dizia: "Por si sĂł, um valor P nĂŁo fornece uma boa medida em relação a um modelo ou uma hipĂłtese".
Os valores P também podem ser manipulados pelo tipo de dados trazidos para anålise.
Para ver um exemplo de como os valores P podem ser manipulados, dĂȘ uma olhada neste exercĂcio interativo de "p-hacking", Hack Your Way to Scientific Glory, no FiveThirtyEight, um site de agregação de pesquisas que tambĂ©m analisa pesquisas de opiniĂŁo, polĂtica, economia e esportes.
VocĂȘ foi agora apresentado Ă inferĂȘncia, aos testes de hipĂłtese e aos valores P. Entender esses conceitos pode ajudar vocĂȘ a medir, descrever, resumir, fazer comparaçÔes e tirar conclusĂ”es fundamentadas sobre seus dados.
Recursos
- Artigo: A Declaração da ASA sobre valores P: contexto, processo e propósito. The American Statistician, 2016
- Livro: Cairo, Alberto. The Truthful Art: Data, Charts, and Maps for Communication. Indianapolis, IN: New Riders, 2016
- Blog: Explicando visualizaçÔes no The New York Times, na NPR e na BBC." The Functional Art (blog), 2019. Link do blog. Acessar o site profissional de Alberto Cairo
- Artigo: Those Hurricane Maps Donât Mean What You Think They Mean. (Esses mapas de furacĂ”es nĂŁo sĂŁo o que vocĂȘ pensa) The New York Times, 2019. Link para o artigo
- Artigo: Hack Your Way to Scientific Glory. (Hackear rumo Ă glĂłria cientĂfica) FiveThirtyEight. ABC News Internet Ventures
- Livro: Jones, Ben. Avoiding Data Pitfalls: How to Steer Clear of Common Blunders When Working with Data and Presenting Analysis and Visualizations. (Evitando armadilhas nos dados: como evitar erros comuns ao trabalhar com dados e apresentar anålises e visualizaçÔes) Hoboken, NJ: John Wiley & Sons, 2019
- Site da Web: Data Literacy (Letramento em dados), por Ben Jones
- Livro: Lane, David M. Introduction to Statistics. (Introdução Ă EstatĂstica) Online Statistics Education: An Interactive Multimedia Course of Study, 2020 (Estudo de estatĂstica online: um curso multimĂdia de estudo)