Skip to main content

Medir a variância

Objetivos de aprendizagem

Após concluir esta unidade, você estará apto a:

  • Definir variância e desvio padrão.
  • Calcular média, variância e desvio padrão.

Quando você está olhando para a distribuição de seus dados, existem dados espalhados? O que o espalhamento pode dizer sobre os dados e quais conclusões você pode tirar? Neste módulo, você ganha familiaridade com os conceitos de variação e comparações informadas, ou sábias, que podem ajudá-lo a explorar, entender e se comunicar com os dados. 

Variância e desvio padrão

O módulo Distribuições de dados introduz a forma (simétrica ou enviesada) e o centro (média ou mediana) dos dados. 

Agora vamos olhar para a variância, ou espalhamento, dos dados. A variância mede como os pontos de dados variam em relação à média; já o desvio padrão é a medida da distribuição dos dados estatísticos. Vamos considerar um exemplo.

Dois grupos de estudantes fizeram testes valendo 10 pontos cada. Ambos os grupos tiveram média de pontuação de 7, ou 70%. No entanto, as pontuações do grupo A variam de 5 a 9 (50% a 90%) e as pontuações do grupo B variam de 4 a 10 (40% a 100%). As pontuações do grupo B estão mais espalhadas do que as do grupo A.

Queremos entender melhor o espalhamento dos dados. Para isso, medimos a variância e o desvio padrão usando as etapas a seguir.

  • Verifique a média. Ao olhar para os dados, vemos que cada grupo tem 20 participantes. Se calcularmos a soma de todas as pontuações de cada grupo, teremos um total de 140 tanto para o Grupo A quanto para o Grupo B.
Pontuações dos testes do Grupo A Pontuações dos testes do Grupo B

9

10

9

10

9

10

8

9

8

9

8

9

8

8

7

8

7

7

7

7

7

7

7 6

6

6

6

6

6

5

6

5

6

5

6

5

5

4

5

4

Para calcular a média, dividimos o total de cada grupo pelo número de participantes do teste no grupo. Para cada grupo, a equação é 140/20, e a média de cada grupo é 7 (ou 70%).
Grupo A: 
9 + 9 + 9 + 8 + 8 + 8 + 8 + 7 + 7 + 7 + 7 + 7 + 6 + 6 + 6 + 6 + 6 + 6 + 5 + 5 = 140
140/20 = 7

Grupo B:
10 + 10 + 10 + 9 + 9 + 9 + 8 + 8 + 7 + 7 + 7 + 6 + 6 + 6 + 5 + 5 + 5 + 5 + 4 + 4 = 140
140/20 = 7

  • Comece a calcular a variância encontrando as diferenças.

Agora que calculamos a média, podemos começar a calcular a variância. A variância mede o espalhamento dos dados. Uma variância de zero indica que todos os valores de dados são idênticos. Uma alta variância indica que os pontos de dados estão muito espalhados tanto em relação à média quanto uns dos outros.

Pontuações dos testes do Grupo A Diferença da média (7, ou 70%) Pontuações dos testes do Grupo B Diferença da média (7, ou 70%)

9

2

10

3

9

2

10

3

9

2

10

3

8

1

9

2

8

1

9

2

8

1

9

2

8

1

8

1

7

0

8

1

7

0

7

0

7

0

7

0

7

0

7

0

7

0

6

-1

6

-1

6

-1

6

-1

6

-1

6

-1

5

-2

6

-1

5

-2

6

-1

5

-2

6

-1

5

-2

5

-2

4

-3

5

-2

4

-3

Para calcular a variância, adicione os quadrados das distâncias da média de cada ponto de dados e, em seguida, divida pelo número de pontos de dados.

Para começar, vamos calcular a diferença da pontuação média de 7 para cada participante do teste. Por exemplo, a diferença entre 9 e 7 é 2 (já que 9 - 7 = 2) e a diferença entre 6 e 7 é -1 (desde 6 - 7 = -1).

  • Continue calculando a variância, elevando as diferenças ao quadrado.

Calculamos a diferença da média para cada participante do teste. Agora, vamos elevar cada diferença ao quadrado. Por exemplo, a diferença entre 9 e 7 é 2 (9 - 7 = 2) e 2 elevado ao quadrado é 4 (já que 2 * 2 = 4). A diferença entre 6 e 7 é -1 (já que 6 - 7 = -1) e -1 elevado ao quadrado é 1 (já que -1 * -1 = 1).

Pontuações dos testes do Grupo A Diferença da média (7, ou 70%) Valor elevado ao quadrado da diferença da média Pontuações dos testes do Grupo B Diferença da média (7, ou 70%) Valor elevado ao quadrado da diferença da média

9

2

4

10

3

9

9

2

4

10

3

9

9

2

4

10

3

9

8

1

1

9

2

4

8

1

1

9

2

4

8

1

1

9

2

4

8

1

1

8

1

1

7

0

0

8

1

1

7

0

0

7

0

0

7

0

0

7

0

0

7

0

0

7

0

0

7

0

0

6

-1

1

6

-1

1

6

-1

1

6

-1

1

6

-1

1

6

-1

1

5

-2

4

6

-1

1

5

-2

4

6

-1

1

5

-2

4

6

-1

1

5

-2

4

5

-2

4

4

-3

9

5

-2

4

4

-3

9

  • Continue calculando a variância pela soma das diferenças.

Calculamos a diferença da média de cada participante do teste e elevamos cada diferença ao quadrado. Agora, somamos o quadrado das diferenças para cada grupo:

Grupo A: 

4 + 4 + 4 + 1 + 1 + 1 + 1 + 0 + 0 + 0 + 0 + 0 + 1 + 1 + 1 + 1 + 1 + 1 + 4 + 4 = 30

Grupo B:

9 + 9 + 9 + 4 + 4 + 4 + 1 + 1 + 0 + 0 + 0 + 1 + 1 + 1 + 4 + 4 + 4 + 4 + 9 + 9 = 78

  • Finalize o cálculo da variância fazendo a média das diferenças somadas.

Para encontrar a variância, agora dividimos os quadrados somados de cada grupo pelo número total de pontos de dados (participantes do teste) no grupo, ou 20. 

A variância para o Grupo A é de 1,5 e para o Grupo B é de 3,9.

Grupo A: 

4 + 4 + 4 + 1 + 1 + 1 + 1 + 0 + 0 + 0 + 0 + 0 + 1 + 1 + 1 + 1 + 1 + 1 + 4 + 4 = 30

30/20 = 1,5

Grupo B:

9 + 9 + 9 + 4 + 4 + 4 + 1 + 1 + 0 + 0 + 0 + 1 + 1 + 1 + 4 + 4 + 4 + 4 + 9 + 9 = 78

78/20 = 3,9

  • Calcule o desvio padrão.

O desvio padrão mede a dispersão de um conjunto de dados em relação à sua média e é calculado como a raiz quadrada da variância. Se os pontos de dados estiverem mais distantes da média, há um maior desvio dentro do conjunto de dados. Em outras palavras, quanto mais espalhados os dados, maior o desvio padrão.

Calculamos a variância de cada grupo. Para encontrar o desvio padrão de cada grupo, calculamos a raiz quadrada da variância. 

O desvio padrão do Grupo A é de 1,22 e do Grupo B é de 1,97.

Grupo A: 

Variância = 1,5

Raiz quadrada de 1,5 = 1,22

Grupo B:

Variância = 3,9

Raiz quadrada de 3,9 = 1,97

  • Reveja os dados.

Agora podemos mostrar quais as pontuações dos participantes do teste que estão dentro do desvio padrão da média de cada grupo. (A diferença da média pode ser positiva ou negativa.)

Pontuações dos testes do Grupo A Diferença da média (7, ou 70%) Valor elevado ao quadrado da diferença da média Dentro do desvio padrão da média (1,22)? Pontuações dos testes do Grupo B Diferença da média (7, ou 70%) Valor elevado ao quadrado da diferença da média Dentro do desvio padrão da média (1,97)?

9

2

4

Não

10

3

9

Não

9

2

4

Não

10

3

9

Não

9

2

4

Não

10

3

9

Não

8

1

1

Sim

9

2

4

Não

8

1

1

Sim

9

2

4

Não

8

1

1

Sim

9

2

4

Não

8

1

1

Sim

8

1

1

Sim

7

0

0

Sim

8

1

1

Sim

7

0

0

Sim

7

0

0

Sim

7

0

0

Sim

7

0

0

Sim

7

0

0

Sim

7

0

0

Sim

7

0

0

Sim

6

-1

1

Sim

6

-1

1

Sim

6

-1

1

Sim

6

-1

1

Sim

6

-1

1

Sim

6

-1

1

Sim

5

-2

4

Não

6

-1

1

Sim

5

-2

4

Não

6

-1

1

Sim

5

-2

4

Não

6

-1

1

Sim

5

-2

4

Não

5

-2

4

Não

4

-3

9

Não

5

-2

4

Não

4

-3

9

Não

Você já viu o processo de cálculo da variância e do desvio padrão. Mais adiante nesta unidade, você terá a chance de realizar esses cálculos em um cenário simples.

Variância da amostra

O que você deve fazer se não tem dados de toda a população?

Há uma diferença no cálculo da variância para uma população e para uma amostra, ou subconjunto, de uma população. Em ambos, você calcula a média, as diferenças da média, eleva todas as diferenças ao quadrado e soma o quadrado das diferenças.

Como no exemplo anterior, ao calcular a variância populacional, divida a soma dos quadrados dos desvios da média pelo número de itens na população. Em uma população completa de 20, por exemplo, dividimos por 20. 

Agora, aqui está a diferença. Ao calcular a variância de amostra, divida a soma dos quadrados dos desvios da média pelo número de itens na amostra menos um. Neste caso, se você tivesse 20 itens em uma amostra (ou subconjunto) da população, dividiria por 19. O objetivo dessa diferença é obter uma estimativa menos tendenciosa da variância da população. Em outras palavras, dividir pelo tamanho da amostra menos um (n-1) compensa trabalhar com uma amostra e não com toda a população. O n minúsculo representa o número de observações em uma amostra. A equação n - 1

Exemplo: Calcular a variância e o desvio padrão

Agora, acompanhe para determinar a variância e o desvio padrão usando um exemplo com menos números.

Imagine que você tenha cinco gatos em sua casa, Cinnamon, The Amazing Fluffy, Lilypad, Danielle e Steve.Cinco gatos, fotografados de costas, olhando pela janela

Para manter as coisas simples, vamos considerar os gatos em sua casa uma população completa em vez de uma amostra. Você pesa cada um dos gatos e registra os resultados representados na tabela a seguir.

Nome do gato Peso em libras

Cinnamon

7

Danielle

8

Lilypad

9

Steve

12

The Amazing Fluffy

14

Primeiro, calcule o peso médio (ou a média) dos cinco gatos.

  1. Some todos os pesos:  
    7 + 8 + 9 + 12 + 14 = 50
  2. Em seguida, divida esse total pelo número de gatos nos dados:
    50/5 = 10  
    10 libras é o peso médio desse grupo de gatos.
    Agora, comece a calcular a variância.
  3. Primeiro, calcule a diferença de cada gato em relação ao peso médio:

    Nome do gato Peso (em libras)

    Diferença da média 

    (10 libras)

    Cinnamon

    7

    7 - 10 = (-3)

    Danielle

    8

    8 - 10 = (-2)

    Lilypad

    9

    9 - 10 = (-1)

    Steve

    12

    12 - 10 = 2

    The Amazing Fluffy

    14

    14 - 10 = 4


  4. Agora, eleve cada diferença da média ao quadrado.

    Nome do gato Peso (em libras)

    Diferença da média 

    (10 libras)


    Valor elevado ao quadrado da diferença da média

    Cinnamon

    7

    (-3)

    (-3) * (-3) = 9

    Danielle

    8

    (-2)

    (-2) * (-2) = 4

    Lilypad

    9

    (-1)

    (-1) * (-1) = 1

    Steve

    12

    2

    2 * 2 = 4

    The Amazing Fluffy

    14

    4

    4 * 4 = 16


  5. Em seguida, some os quadrados de todos os valores das diferenças da média:
    9 + 4 + 1 + 4 + 16 = 34

  6. Em seguida, divida o resultado pelo número de pontos de dados (ou gatos):
    34/5 = 6,8. Ou seja, 6,8 é a variância para os gatos.

  7. Agora que você calculou a variância, calcule o desvio padrão encontrando a raiz quadrada da variância. (Você pode usar uma calculadora para fazer isso.)
    A raiz quadrada de 6,8 é 2,6. Então, 2,6 é o desvio padrão.
    Agora você pode ver quais pesos dos gatos estão dentro do desvio padrão (2,6 libras) da média (10 libras):
Nome do gato Peso (em libras)

Diferença da média 

(10 libras)


Dentro do desvio padrão (2,6 libras)?

Cinnamon

7

(-3)

Não

Danielle

8

(-2)

Sim

Lilypad

9

(-1)

Sim

Steve

12

2

Sim

The Amazing Fluffy

14

4

Não

Recursos

Compartilhe seu feedback do Trailhead usando a Ajuda do Salesforce.

Queremos saber sobre sua experiência com o Trailhead. Agora você pode acessar o novo formulário de feedback, a qualquer momento, no site Ajuda do Salesforce.

Saiba mais Continue compartilhando feedback