Skip to main content
Junte-se a nĂłs na TDX em SĂŁo Francisco ou no Salesforce+ nos dias 5 e 6 de maio e assista Ă  Developer Conference for the AI Agent Era. Registre-se agora.

Fazer inferĂȘncias

Objetivos de aprendizagem

ApĂłs concluir esta unidade, vocĂȘ estarĂĄ apto a:

  • Descrever o objetivo dos testes de hipĂłtese.
  • Definir o uso e as limitaçÔes dos valores P nos testes de hipĂłtese.

Introdução

Na unidade anterior, vocĂȘ viu conceitos em torno do uso da variação e da distribuição normal para explorar, interpretar e se comunicar com dados. VocĂȘ tambĂ©m viu intervalos de confiança como um exemplo de inferĂȘncia.

Nesta unidade, vocĂȘ continuarĂĄ a aprender sobre inferĂȘncia. A inferĂȘncia Ă© o processo de tirar conclusĂ”es sobre uma população com base em uma amostra dos dados. É Ăștil porque, na maioria dos casos, nĂŁo Ă© viĂĄvel obter todas as medidas em determinada população.

Em outras palavras, se temos dados para todos os membros de uma população, nĂŁo precisamos fazer nenhuma inferĂȘncia sobre a diferença entre grupos dentro dessa população. Quando nĂŁo Ă© possĂ­vel coletar dados para cada membro individual de uma população, coletamos dados de amostra e, em seguida, fazemos inferĂȘncias.Pessoas em animação em um grande oval que representa a população total e um nĂșmero menor de pessoas em animação em um oval menor que representa a amostra

Em seu livro Avoiding Data Pitfalls (Evitando armadilhas nos dados), o autor Ben Jones, fundador e CEO da Data Literacy, LLC e membro da Tableau Community, aponta que o censo nos Estados Unidos acontece apenas uma vez por dĂ©cada devido ao quĂŁo caro e complicado Ă© tentar contar "cada pessoa em cada estrutura residencial em todo o paĂ­s, e tal iniciativa nĂŁo estĂĄ livre de preconceito e erro". Como a maioria das organizaçÔes nĂŁo tem recursos financeiros ou humanos iguais aos do Governo Federal dos EUA, elas baseiam suas decisĂ”es em inferĂȘncias feitas com a anĂĄlise de amostras de dados.

Testes de hipĂłtese

Muitos tipos de organizaçÔes usam testes de hipótese. Algumas empresas, por exemplo, usam testes de hipótese para controle de qualidade a fim de ver se determinado produto atende a um padrão ou para comparar novos e antigos métodos de vendas.

Pesquisas mĂ©dicas tambĂ©m frequentemente baseiam inferĂȘncias em amostras de dados. Imagine que uma empresa de biotecnologia fabricou uma nova droga para mitigar uma doença. Para determinar se a medicação funciona, um experimento controlado precisa ser realizado. Como nĂŁo Ă© possĂ­vel experimentar em cada pessoa que tem a doença, um subconjunto de pessoas com a doença sĂŁo sondadas aleatoriamente para testes.

Um fluxograma com retùngulos coloridos para mostrar que atribuiçÔes aleatórias dividem grupos, e cada grupo tem efeitos medidos

Dentro dessa amostra, o grupo experimental recebe o tratamento e o grupo de controle recebe um placebo em vez da medicação. Os grupos sĂŁo atribuĂ­dos aleatoriamente para que eventuais diferenças nos desfechos de saĂșde possam ser atribuĂ­das Ă  intervenção da pesquisa. 

SĂŁo definidos testes para ambos os grupos e mediçÔes sĂŁo feitas. Ao testar as diferenças entre os dois grupos, os pesquisadores decidem quĂŁo distantes os resultados precisam estar para determinar se os resultados de saĂșde para o grupo experimental e o grupo de controle sĂŁo significativamente diferentes.

Os pesquisadores coletam dados dos grupos de amostra e fazem os testes estatĂ­sticos apropriados. Em seguida, os pesquisadores usam esses resultados de teste para decidir se hĂĄ uma diferença significativa entre os grupos. Uma vez obtidos os dados, os pesquisadores precisarĂŁo fazer inferĂȘncias sobre a população em geral, ou seja, cada pessoa que tem a doença. Isso Ă© chamado de teste de hipĂłtese.

O teste de hipótese começa com a criação de afirmativas de hipótese nulas e alternativas.

  • A hipĂłtese nula afirma que a medicação nĂŁo terĂĄ impacto nos resultados de saĂșde. Ela propĂ”e que aqueles que receberĂŁo o tratamento nĂŁo terĂŁo desfechos diferentes daqueles que nĂŁo receberĂŁo.
  • A hipĂłtese alternativa afirma que haverĂĄ diferença nos resultados de saĂșde. Ela propĂ”e que aqueles que receberĂŁo a medicação apresentarĂŁo melhores resultados de saĂșde do que aqueles que nĂŁo a receberĂŁo.

Os testes de hipĂłtese começam assumindo que a hipĂłtese nula Ă© verdadeira. Os testes visam a entender a probabilidade de encontrar resultados que serĂŁo pelo menos tĂŁo bons quanto no experimento, assumindo que a nula seja verdadeira. 

Em outras palavras, se houver uma pequena probabilidade de que os resultados sejam tĂŁo bons quanto se a nula for verdade, entĂŁo haverĂĄ indĂ­cios para apoiar a hipĂłtese alternativa. Se houver uma grande probabilidade de que os resultados sejam tĂŁo bons se a nula for verdade, entĂŁo nĂŁo haverĂĄ indĂ­cios suficientes para apoiar a hipĂłtese alternativa, e os pesquisadores deverĂŁo tentar novamente com uma nova fĂłrmula. 

Os testes de hipĂłtese levam em conta o nĂșmero de amostras, o tamanho da diferença medida e a quantidade de variação observada em cada grupo.

O resultado numĂ©rico de um teste de hipĂłtese (a probabilidade de que a hipĂłtese nula seja verdadeira) Ă© chamado de valor P. Um valor P ajuda a determinar se a hipĂłtese nula deve ser rejeitada ou nĂŁo. Neste caso, rejeitar a hipĂłtese nula significa que o tratamento funcionaria na população em geral. Um pequeno valor P indica que hĂĄ evidĂȘncias suficientes para rejeitar a hipĂłtese nula e apoiar a hipĂłtese alternativa.

É importante notar, no entanto, que o valor P nĂŁo prova nem refuta nada. Um alto valor P nĂŁo prova que a hipĂłtese nula Ă© vĂĄlida e um baixo valor P nĂŁo prova que Ă© invĂĄlida. É por isso que os valores P precisam ser considerados com cuidado.

Como usar os valores P

Em algum momento, os pesquisadores foram treinados para usar o valor P de 0,05 como corte. Em outras palavras, acreditava-se que um valor P de 0,05 ou inferior era suficiente para rejeitar a hipótese nula. O corte de 0,05 corresponde às caudas da distribuição normal. Lembre-se, intervalos de confiança de 95% correspondiam à årea da distribuição normal que se enquadra em um desvio padrão de -2 ou +2 da média. O corte de 0,05 (ou 5%) corresponde à årea que fica fora do desvio padrão de -2 ou +2 da média.

Esse raciocĂ­nio foi revisto nos Ășltimos anos. No experimento de medicação, se fosse utilizado um corte mais baixo (efetivamente aumentando o intervalo de confiança acima de 95%), poderia ser mais difĂ­cil rejeitar a hipĂłtese nula. 

Por essas razĂ”es, e muitas outras, a Associação Americana de EstatĂ­stica (ASA) emitiu uma declaração em 2016 que dizia: "Por si sĂł, um valor P nĂŁo fornece uma boa medida em relação a um modelo ou uma hipĂłtese". 

Os valores P tambĂ©m podem ser manipulados pelo tipo de dados trazidos para anĂĄlise. 

Para ver um exemplo de como os valores P podem ser manipulados, dĂȘ uma olhada neste exercĂ­cio interativo de "p-hacking", Hack Your Way to Scientific Glory, no FiveThirtyEight, um site de agregação de pesquisas que tambĂ©m analisa pesquisas de opiniĂŁo, polĂ­tica, economia e esportes. 

VocĂȘ foi agora apresentado Ă  inferĂȘncia, aos testes de hipĂłtese e aos valores P. Entender esses conceitos pode ajudar vocĂȘ a medir, descrever, resumir, fazer comparaçÔes e tirar conclusĂ”es fundamentadas sobre seus dados.

Recursos

Compartilhe seu feedback do Trailhead usando a Ajuda do Salesforce.

Queremos saber sobre sua experiĂȘncia com o Trailhead. Agora vocĂȘ pode acessar o novo formulĂĄrio de feedback, a qualquer momento, no site Ajuda do Salesforce.

Saiba mais Continue compartilhando feedback