Skip to main content

Mesure de la variance

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

  • Donner la définition de la variance et de l’écart type
  • Calculer une moyenne, une variance et un écart type

Vos données sont-elles dispersées lorsque vous observez leur distribution ? Qu’est-ce que la dispersion peut vous indiquer sur les données, et quelles conclusions pouvez-vous en tirer ? Dans ce module, vous pourrez vous familiariser avec les concepts de variation et de comparaison pertinente et éclairée, qui vous seront utiles pour explorer des phénomènes, comprendre des situations et communiquer grâce aux données. 

Variance et écart type

Le module Distributions des données présente les concepts de forme (symétrique ou asymétrique) et de point central (moyenne ou médiane) des données. 

Nous allons maintenant aborder le concept de variance, ou dispersion, des données. La variance mesure la manière dont des points de données varient par rapport à la moyenne, tandis que l’écart type mesure la distribution de données statistiques. Penchons-nous sur un exemple.

Deux groupes d’étudiants ont répondu à un questionnaire noté sur 10 points. Le score moyen pour les deux groupes est de 7, ou 70 %. Néanmoins, les scores du groupe A varient entre 5 et 9 (50-90 %), tandis que ceux du groupe B varient entre 4 et 10 (40-100 %). Les scores du groupe B sont plus dispersés que ceux du groupe A.

Nous souhaitons mieux comprendre cette dispersion des données. Pour ce faire, nous allons mesurer la variance et l’écart type en suivant les étapes ci-après.

  • Vérifiez la moyenne. Les données indiquent que chaque groupe compte 20 étudiants. Si nous calculons la somme de tous les scores de chaque groupe, nous obtenons un total de 140 pour le groupe A et le groupe B.
Résultats au questionnaire du groupe A Résultats au questionnaire du groupe B

9

10

9

10

9

10

8

9

8

9

8

9

8

8

7

8

7

7

7

7

7

7

7 6

6

6

6

6

6

5

6

5

6

5

6

5

5

4

5

4

Pour calculer la moyenne, nous divisons le total de chaque groupe par le nombre d’étudiants dans le groupe. Pour chaque groupe, l’opération sera 140/20, et la moyenne pour chaque groupe sera de 7 (ou 70 %).
Groupe A : 
9 + 9 + 9 + 8 + 8 + 8 + 8 + 7 + 7 + 7 + 7 + 7 + 6 + 6 + 6 + 6 + 6 + 6 + 5 + 5 = 140
140/20 = 7

Groupe B :
10 + 10 + 10 + 9 + 9 + 9 + 8 + 8 + 7 + 7 + 7 + 6 + 6 + 6 + 5 + 5 + 5 + 5 + 4 + 4 = 140
140/20 = 7

  • Commencez le calcul de la variance en trouvant les différences.

Maintenant que nous avons calculé la moyenne, nous pouvons calculer la variance. La variance mesure la dispersion des données. Une variance de zéro indique que toutes les valeurs sont identiques. Une variance élevée indique que les points de données sont très dispersés aussi bien par rapport à la moyenne que les uns par rapport aux autres.

Résultats au questionnaire du groupe A Différence par rapport à la moyenne (7 ou 70 %) Résultats au questionnaire du groupe B Différence par rapport à la moyenne (7 ou 70 %)

9

2

10

3

9

2

10

3

9

2

10

3

8

1

9

2

8

1

9

2

8

1

9

2

8

1

8

1

7

0

8

1

7

0

7

0

7

0

7

0

7

0

7

0

7

0

6

-1

6

-1

6

-1

6

-1

6

-1

6

-1

5

-2

6

-1

5

-2

6

-1

5

-2

6

-1

5

-2

5

-2

4

-3

5

-2

4

-3

Pour calculer la variance, vous devez ajouter le carré de la distance qui sépare chaque point de données de la moyenne, puis diviser le résultat par le nombre de points de données.

Pour commencer, calculons la différence par rapport au score moyen de 7 pour chaque étudiant. Par exemple, la différence entre 9 et 7 est 2 (9 - 7 = 2), et la différence entre 6 et 7 est -1 (6 - 7 = -1).

  • Continuez le calcul de la variance en élevant les différences au carré.

Nous avons calculé la différence par rapport à la moyenne pour chaque étudiant. Élevons maintenant chaque différence au carré. Par exemple, la différence entre 9 et 7 est (9 - 7 = 2), et le carré de 2 est 4 (2 x 2 = 4). La différence entre 6 et 7 est -1 (6 - 7 = -1), et le carré de -1 est 1 (-1 x -1 = 1).

Résultats au questionnaire du groupe A Différence par rapport à la moyenne (7 ou 70 %) Valeur au carré de la différence par rapport à la moyenne Résultats au questionnaire du groupe B Différence par rapport à la moyenne (7 ou 70 %) Valeur au carré de la différence par rapport à la moyenne

9

2

4

10

3

9

9

2

4

10

3

9

9

2

4

10

3

9

8

1

1

9

2

4

8

1

1

9

2

4

8

1

1

9

2

4

8

1

1

8

1

1

7

0

0

8

1

1

7

0

0

7

0

0

7

0

0

7

0

0

7

0

0

7

0

0

7

0

0

6

-1

1

6

-1

1

6

-1

1

6

-1

1

6

-1

1

6

-1

1

5

-2

4

6

-1

1

5

-2

4

6

-1

1

5

-2

4

6

-1

1

5

-2

4

5

-2

4

4

-3

9

5

-2

4

4

-3

9

  • Continuez le calcul de la variance en additionnant les différences.

Nous avons calculé la différence par rapport à la moyenne pour chaque étudiant, et calculé le carré de chaque différence. Maintenant, nous additionnons le carré de ces différences pour chaque groupe :

Groupe A : 

4 + 4 + 4 + 1 + 1 + 1 + 1 + 0 + 0 + 0 + 0 + 0 + 1 + 1 + 1 + 1 + 1 + 1 + 4 + 4 = 30

Groupe B :

9 + 9 + 9 + 4 + 4 + 4 + 1 + 1 + 0 + 0 + 0 + 1 + 1 + 1 + 4 + 4 + 4 + 4 + 9 + 9 = 78

  • Terminez le calcul de la variance en faisant la moyenne des différences additionnées.

Pour déterminer la variance, nous divisons maintenant la somme des carrés pour chaque groupe par le nombre total de points de données (étudiants ayant répondu au questionnaire) dans chaque groupe, à savoir 20. 

La variance pour le groupe A est de 1,5, et de 3,9 pour le groupe B.

Groupe A : 

4 + 4 + 4 + 1 + 1 + 1 + 1 + 0 + 0 + 0 + 0 + 0 + 1 + 1 + 1 + 1 + 1 + 1 + 4 + 4 = 30

30/20 = 1,5

Groupe B :

9 + 9 + 9 + 4 + 4 + 4 + 1 + 1 + 0 + 0 + 0 + 1 + 1 + 1 + 4 + 4 + 4 + 4 + 9 + 9 = 78

78/20 = 3,9

  • Calculez l’écart type.

L’écart type mesure la dispersion de l’ensemble de données par rapport à sa moyenne et correspond à la racine carrée de la variance. Plus les points de données sont éloignés de la moyenne, plus la déviation est élevée dans l’ensemble de données. En d’autres termes, plus les données sont dispersées, plus l’écart type sera élevé.

Nous avons calculé la variance pour chaque groupe. Pour déterminer l’écart type dans chaque groupe, nous calculons la racine carrée de la variance. 

L’écart type pour le groupe A est de 1,22, et de 1,97 pour le groupe B.

Groupe A : 

Variance = 1,5

Racine carrée de 1,5 = 1,22.

Groupe B :

Variance = 3,9

Racine carrée de 3,9 = 1,97.

  • Examinez à nouveau les données.

Nous pouvons maintenant déterminer, pour chaque groupe d’étudiants, quels sont les scores compris dans un intervalle d’un écart type autour de la moyenne (la différence par rapport à la moyenne peut être positive ou négative).

Résultats au questionnaire du groupe A Différence par rapport à la moyenne (7 ou 70 %) Valeur au carré de la différence par rapport à la moyenne Score compris dans un intervalle d’un écart type autour de la moyenne (1,22) ? Résultats au questionnaire du groupe B Différence par rapport à la moyenne (7 ou 70 %) Valeur au carré de la différence par rapport à la moyenne Score compris dans un intervalle d’un écart type autour de la moyenne (1,97) ?

9

2

4

Non

10

3

9

Non

9

2

4

Non

10

3

9

Non

9

2

4

Non

10

3

9

Non

8

1

1

Oui

9

2

4

Non

8

1

1

Oui

9

2

4

Non

8

1

1

Oui

9

2

4

Non

8

1

1

Oui

8

1

1

Oui

7

0

0

Oui

8

1

1

Oui

7

0

0

Oui

7

0

0

Oui

7

0

0

Oui

7

0

0

Oui

7

0

0

Oui

7

0

0

Oui

7

0

0

Oui

6

-1

1

Oui

6

-1

1

Oui

6

-1

1

Oui

6

-1

1

Oui

6

-1

1

Oui

6

-1

1

Oui

5

-2

4

Non

6

-1

1

Oui

5

-2

4

Non

6

-1

1

Oui

5

-2

4

Non

6

-1

1

Oui

5

-2

4

Non

5

-2

4

Non

4

-3

9

Non

5

-2

4

Non

4

-3

9

Non

Vous connaissez maintenant les étapes à suivre pour calculer la variance et l’écart type. Plus tard dans cette unité, vous aurez l’occasion de réaliser ces calculs dans le cadre d’un scénario simple.

Variance dans un échantillon

Que faire si vous ne disposez pas de données pour la population entière ?

Il existe des différences dans le calcul de la variance pour une population et pour un échantillon, ou sous-ensemble, d’une population. Dans les deux cas, vous calculez la moyenne, puis les différences par rapport à la moyenne, avant d’élever les différences au carré et d’additionner les carrés obtenus.

Lorsque vous calculez la variance pour une population, comme dans l’exemple précédent, vous divisez la somme des carrés des différences par le nombre d’éléments qui constituent la population. Par exemple, si la population compte 20 éléments, vous divisez par 20. 

Voici à présent en quoi le processus est différent. Lorsque vous calculez la variance pour un échantillon, vous devez diviser le total des carrés des différences par le nombre d’éléments qui constituent l’échantillon, moins 1. Dans le cas présent, si vous avez 20 éléments dans un échantillon, ou sous-ensemble, de population, vous devez diviser par 19. L’objectif de ce calcul est d’obtenir une estimation moins biaisée de la variance au sein de la population. En d’autres termes, le fait de diviser par la taille de l’échantillon moins 1 (n-1) permet de compenser la différence due à l’utilisation d’un échantillon au lieu d’une population entière. La lettre n représente le nombre d’observations dans un échantillon. Équation n - 1

Exemple : calcul de la variance et de l’écart type

Suivez maintenant les étapes ci-après pour déterminer la variance et l’écart type à l’aide d’un exemple comportant moins d’éléments.

Imaginez que votre foyer compte cinq chats : Cinnamon, The Amazing Fluffy, Lilypad, Danielle et Steve.Photo de cinq chats de dos, regardant par une fenêtre

Pour faire simple, imaginons que ces chats constituent une population totale, et non un échantillon. Vous pesez chaque chat et notez les résultats dans un tableau comme suit.

Nom du chat Poids en livres

Cinnamon

7

Danielle

8

Lilypad

9

Steve

12

The Amazing Fluffy

14

Tout d’abord, calculez le poids moyen des cinq chats.

  1. Additionnez tous les poids :  
    7 + 8 + 9 + 12 + 14 = 50
  2. Divisez ensuite le total par le nombre de chats :
    50/5 = 10  
    Le poids moyen de ce groupe de chats est de 10 livres.
    Maintenant, calculez la variance.
  3. Tout d’abord, calculez, pour chaque chat, la différence par rapport au poids moyen :

    Nom du chat Poids (en livres)

    Différence par rapport à la moyenne 

    (10 livres)

    Cinnamon

    7

    7 - 10= -3

    Danielle

    8

    8 - 10 = -2

    Lilypad

    9

    9 - 10 = -1

    Steve

    12

    12 - 10 = 2

    The Amazing Fluffy

    14

    14 - 10 = 4


  4. Calculez maintenant le carré de chaque différence.

    Nom du chat Poids (en livres)

    Différence par rapport à la moyenne 

    (10 livres)


    Valeur au carré de la différence par rapport à la moyenne

    Cinnamon

    7

    (-3)

    (-3) * (-3) = 9

    Danielle

    8

    (-2)

    (-2) * (-2) = 4

    Lilypad

    9

    (-1)

    (-1) * (-1) = 1

    Steve

    12

    2

    2 * 2 = 4

    The Amazing Fluffy

    14

    4

    4 - 4 = 16


  5. Additionnez maintenant tous les carrés des différences :
    9 + 4 + 1 + 4 + 16 = 34

  6. Ensuite, divisez le résultat par le nombre de points de données (ou chats) :
    34/5 = 6,8. La variance pour ces chats est donc égale à 6,8.

  7. Maintenant que vous avez calculé la variance, calculez l’écart type en trouvant la racine carrée de la variance (vous pouvez utiliser une calculatrice pour y parvenir).
    La racine carrée de 6,8 est 2,6. L’écart type est donc égal à 2,6.
    Vous pouvez maintenant déterminer quels sont les chats qui se trouvent dans l’intervalle d’un écart type (2,6 livres) autour de la moyenne (10 livres) :
Nom du chat Poids (en livres)

Différence par rapport à la moyenne 

(10 livres)


Poids compris dans un intervalle d’un écart type (2,6 livres) ?

Cinnamon

7

(-3)

Non

Danielle

8

(-2)

Oui

Lilypad

9

(-1)

Oui

Steve

12

2

Oui

The Amazing Fluffy

14

4

Non

Ressources

Partagez vos commentaires sur Trailhead dans l'aide Salesforce.

Nous aimerions connaître votre expérience avec Trailhead. Vous pouvez désormais accéder au nouveau formulaire de commentaires à tout moment depuis le site d'aide Salesforce.

En savoir plus Continuer à partager vos commentaires