Mesure de la variance

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

Donner la définition de la variance et de l’écart type
Calculer une moyenne, une variance et un écart type

Vos données sont-elles dispersées lorsque vous observez leur distribution ? Qu’est-ce que la dispersion peut vous indiquer sur les données, et quelles conclusions pouvez-vous en tirer ? Dans ce module, vous pourrez vous familiariser avec les concepts de variation et de comparaison pertinente et éclairée, qui vous seront utiles pour explorer des phénomènes, comprendre des situations et communiquer grâce aux données.

Variance et écart type

Le module Distributions des données présente les concepts de forme (symétrique ou asymétrique) et de point central (moyenne ou médiane) des données.

Nous allons maintenant aborder le concept de variance, ou dispersion, des données. La variance mesure la manière dont des points de données varient par rapport à la moyenne, tandis que l’écart type mesure la distribution de données statistiques. Penchons-nous sur un exemple.

Deux groupes d’étudiants ont répondu à un questionnaire noté sur 10 points. Le score moyen pour les deux groupes est de 7, ou 70 %. Néanmoins, les scores du groupe A varient entre 5 et 9 (50-90 %), tandis que ceux du groupe B varient entre 4 et 10 (40-100 %). Les scores du groupe B sont plus dispersés que ceux du groupe A.

Nous souhaitons mieux comprendre cette dispersion des données. Pour ce faire, nous allons mesurer la variance et l’écart type en suivant les étapes ci-après.

Vérifier la moyenne

Les données indiquent que chaque groupe compte 20 étudiants.

Résultats au questionnaire du groupe A	Résultats au questionnaire du groupe B
9	10
9	10
9	10
8	9
8	9
8	9
8	8
7	8
7	7
7	7
7	7
7	6
6	6
6	6
6	5
6	5
6	5
6	5
5	4
5	4

Pour calculer la moyenne, nous divisons le total de chaque groupe par le nombre d’étudiants dans le groupe. Pour chaque groupe, l’équation sera 140/20, et le score moyen pour chaque groupe sera de 7 (ou 70 %).

Groupe A :

9 + 9 + 9 + 8 + 8 + 8 + 8 + 7 + 7 + 7 + 7 + 7 + 6 + 6 + 6 + 6 + 6 + 6 + 5 + 5 = 140

140/20 = 7

Groupe B :

10 + 10 + 10 + 9 + 9 + 9 + 8 + 8 + 7 + 7 + 7 + 6 + 6 + 6 + 5 + 5 + 5 + 5 + 4 + 4 = 140

140/20 = 7

Commencer à calculer la variance en trouvant les différences

Maintenant que nous avons calculé la moyenne, nous pouvons calculer la variance. La variance mesure la dispersion des données. Une variance de zéro indique que toutes les valeurs sont identiques. Une variance élevée indique que les points de données sont très dispersés aussi bien par rapport à la moyenne que les uns par rapport aux autres.

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)
9	2	10	3
9	2	10	3
9	2	10	3
8	1	9	2
8	1	9	2
8	1	9	2
8	1	8	1
7	0	8	1
7	0	7	0
7	0	7	0
7	0	7	0
7	0	6	-1
6	-1	6	-1
6	-1	6	-1
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
5	-2	4	-3
5	-2	4	-3

Pour calculer la variance, vous devez ajouter le carré des différences qui séparent chaque point de données de la moyenne, puis diviser le résultat par le nombre de points de données.

Pour commencer, calculons la différence par rapport au score moyen de 7 pour chaque étudiant. Par exemple, la différence entre 9 et 7 est 2 (9 - 7 = 2), et la différence entre 6 et 7 est -1 (6 - 7 = -1).

Continuer à calculer la variance en élevant les différences au carré

Nous avons calculé la différence par rapport à la moyenne pour chaque étudiant. Élevons maintenant chaque différence au carré. Par exemple, la différence entre 9 et 7 est (9 - 7 = 2), et le carré de 2 est 4 (2 x 2 = 4). La différence entre 6 et 7 est -1 (6 - 7 = -1), et le carré de -1 est 1 (-1 x -1 = 1).

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne
9	2	4	10	3	9
9	2	4	10	3	9
9	2	4	10	3	9
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	8	1	1
7	0	0	8	1	1
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	6	-1	1
6	-1	1	6	-1	1
6	-1	1	6	-1	1
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
5	-2	4	4	-3	9
5	-2	4	4	-3	9

Continuer à calculer la variance en additionnant les différences

Nous avons calculé la différence par rapport à la moyenne pour chaque étudiant, et calculé le carré de chaque différence. Maintenant, nous additionnons le carré de ces différences pour chaque groupe :

Groupe A :

4 + 4 + 4 + 1 + 1 + 1 + 1 + 0 + 0 + 0 + 0 + 0 + 1 + 1 + 1 + 1 + 1 + 1 + 4 + 4 = 30

Groupe B :

9 + 9 + 9 + 4 + 4 + 4 + 1 + 1 + 0 + 0 + 0 + 1 + 1 + 1 + 4 + 4 + 4 + 4 + 9 + 9 = 78

Finir de calculer la variance en faisant la moyenne des différences additionnées

Pour déterminer la variance, nous divisons maintenant la somme des carrés pour chaque groupe par le nombre total de points de données (étudiants ayant répondu au questionnaire) dans chaque groupe, à savoir 20.

La variance pour le groupe A est de 1,5, et de 3,9 pour le groupe B.

Groupe A :

4 + 4 + 4 + 1 + 1 + 1 + 1 + 0 + 0 + 0 + 0 + 0 + 1 + 1 + 1 + 1 + 1 + 1 + 4 + 4 = 30

30/20 = 1,5

Groupe B :

9 + 9 + 9 + 4 + 4 + 4 + 1 + 1 + 0 + 0 + 0 + 1 + 1 + 1 + 4 + 4 + 4 + 4 + 9 + 9 = 78

78/20 = 3,9

Calculer l’écart type

L’écart type mesure la dispersion de l’ensemble de données par rapport à sa moyenne et correspond à la racine carrée de la variance. Plus les points de données sont éloignés de la moyenne, plus la déviation est élevée dans l’ensemble de données. En d’autres termes, plus les données sont dispersées, plus l’écart type sera élevé.

Nous avons calculé la variance pour chaque groupe. Pour déterminer l’écart type dans chaque groupe, nous calculons la racine carrée de la variance.

L’écart type pour le groupe A est de 1,22, et de 1,97 pour le groupe B.

Groupe A :

Variance = 1,5

Racine carrée de 1,5 = 1,22

Groupe B :

Variance = 3,9

Racine carrée de 3,9 = 1,97

Examiner à nouveau les données

Nous pouvons maintenant déterminer, pour chaque groupe d’étudiants, quels sont les scores compris dans un intervalle d’un écart type autour de la moyenne (la différence par rapport à la moyenne peut être positive ou négative).

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,22) ?	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,97) ?
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	8	1	1	Oui
7	0	0	Oui	8	1	1	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
5	-2	4	Non	4	-3	9	Non
5	-2	4	Non	4	-3	9	Non

Vous connaissez maintenant les étapes à suivre pour calculer la variance et l’écart type. Plus tard dans cette unité, vous aurez l’occasion de réaliser ces calculs dans le cadre d’un scénario simple.

Variance dans un échantillon

Que faire si vous ne disposez pas de données pour la population entière ?

Il existe des différences dans le calcul de la variance pour une population et pour un échantillon, ou sous-ensemble, d’une population. Dans les deux cas, vous calculez la moyenne, puis les différences par rapport à la moyenne, avant d’élever les différences au carré et d’additionner les carrés obtenus.

Lorsque vous calculez la variance pour une population, comme dans l’exemple précédent, vous divisez la somme des carrés des différences par le nombre d’éléments qui constituent la population. Par exemple, si la population compte 20 éléments, vous divisez par 20.

Voici à présent en quoi le processus est différent. Lorsque vous calculez la variance pour un échantillon, vous devez diviser le total des carrés des différences par le nombre d’éléments qui constituent l’échantillon, moins 1. Dans le cas présent, si vous avez 20 éléments dans un échantillon, ou sous-ensemble, de population, vous devez diviser par 19. L’objectif de ce calcul est d’obtenir une estimation moins biaisée de la variance au sein de la population. En d’autres termes, le fait de diviser par la taille de l’échantillon moins 1 (n-1) permet de compenser la différence due à l’utilisation d’un échantillon au lieu d’une population entière. La lettre n représente le nombre d’observations dans un échantillon. Équation n - 1

Exemple : calcul de la variance et de l’écart type

Suivez maintenant les étapes ci-après pour déterminer la variance et l’écart type à l’aide d’un exemple comportant moins d’éléments.

Imaginez que votre foyer compte cinq chats : Cinnamon, The Amazing Fluffy, Lilypad, Danielle et Steve. Photo de cinq chats de dos, regardant par une fenêtre

Pour faire simple, imaginons que ces chats constituent une population totale, et non un échantillon. Vous pesez chaque chat et notez les résultats dans un tableau comme suit.

Nom du chat	Poids en livres
Cinnamon	7
Danielle	8
Lilypad	9
Steve	12
The Amazing Fluffy	14

Tout d’abord, calculez le poids moyen des cinq chats.

Additionnez tous les poids :
7 + 8 + 9 + 12 + 14 = 50
Divisez ensuite ce total par le nombre de chats dans les données :
50/5 = 10
Le poids moyen de ce groupe de chats est de 10 livres.

Maintenant, calculez la variance.

Tout d’abord, calculez, pour chaque chat, la différence par rapport au poids moyen :

Nom du chat	Poids (en livres)	Différence par rapport à la moyenne (10 livres)
Cinnamon	7	7 - 10 = (-3)
Danielle	8	8 - 10 = (-2)
Lilypad	9	9 - 10 = (-1)
Steve	12	12 - 10 = 2
The Amazing Fluffy	14	14 - 10 = 4

Calculez maintenant le carré de chaque différence.

Nom du chat	Poids (en livres)	Différence par rapport à la moyenne (10 livres)	Valeur au carré de la différence par rapport à la moyenne
Cinnamon	7	(-3)	(-3) * (-3) = 9
Danielle	8	(-2)	(-2) * (-2) = 4
Lilypad	9	(-1)	(-1) * (-1) = 1
Steve	12	2	2 - 2 = 4
The Amazing Fluffy	14	4	4 - 4 = 16

Additionnez maintenant tous les carrés des différences :
9 + 4 + 1 + 4 + 16 = 34
Ensuite, divisez le résultat par le nombre de points de données (ou chats) :
34/5 = 6,8. La variance pour ces chats est donc égale à 6,8.
Maintenant que vous avez calculé la variance, calculez l’écart type en trouvant la racine carrée de la variance (Vous pouvez utiliser une calculatrice pour y parvenir.)
La racine carrée de 6,8 est 2,6. L’écart type est donc égal à 2,6.
Vous pouvez maintenant déterminer quels sont les chats qui se trouvent dans l’intervalle d’un écart type (2,6 livres) autour de la moyenne (10 livres) :

Nom du chat	Poids (en livres)	Différence par rapport à la moyenne (10 livres)	Poids compris dans un intervalle d’un écart type (2,6 livres) ?
Cinnamon	7	(-3)	Non
Danielle	8	(-2)	Oui
Lilypad	9	(-1)	Oui
Steve	12	2	Oui
The Amazing Fluffy	14	4	Non

Ressources

Site Web : Introduction to Statistics, ouvrage en ligne de David M. Lane appartenant au domaine public

Durée estimée

Thèmes

Besoin d'aide ?

Ressources Tableau

Mesure de la variance

Objectifs de formation

Variance et écart type

Vérifier la moyenne

Commencer à calculer la variance en trouvant les différences

Continuer à calculer la variance en élevant les différences au carré

Continuer à calculer la variance en additionnant les différences

Finir de calculer la variance en faisant la moyenne des différences additionnées

Calculer l’écart type

Examiner à nouveau les données

Exemple : calcul de la variance et de l’écart type

Ressources

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)
9	2	10	3
9	2	10	3
9	2	10	3
8	1	9	2
8	1	9	2
8	1	9	2
8	1	8	1
7	0	8	1
7	0	7	0
7	0	7	0
7	0	7	0
7	0	6	-1
6	-1	6	-1
6	-1	6	-1
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
5	-2	4	-3
5	-2	4	-3

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne
9	2	4	10	3	9
9	2	4	10	3	9
9	2	4	10	3	9
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	8	1	1
7	0	0	8	1	1
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	6	-1	1
6	-1	1	6	-1	1
6	-1	1	6	-1	1
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
5	-2	4	4	-3	9
5	-2	4	4	-3	9

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,22) ?	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,97) ?
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	8	1	1	Oui
7	0	0	Oui	8	1	1	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
5	-2	4	Non	4	-3	9	Non
5	-2	4	Non	4	-3	9	Non

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)
9	2	10	3
9	2	10	3
9	2	10	3
8	1	9	2
8	1	9	2
8	1	9	2
8	1	8	1
7	0	8	1
7	0	7	0
7	0	7	0
7	0	7	0
7	0	6	-1
6	-1	6	-1
6	-1	6	-1
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
5	-2	4	-3
5	-2	4	-3

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne
9	2	4	10	3	9
9	2	4	10	3	9
9	2	4	10	3	9
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	8	1	1
7	0	0	8	1	1
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	6	-1	1
6	-1	1	6	-1	1
6	-1	1	6	-1	1
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
5	-2	4	4	-3	9
5	-2	4	4	-3	9

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,22) ?	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,97) ?
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	8	1	1	Oui
7	0	0	Oui	8	1	1	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
5	-2	4	Non	4	-3	9	Non
5	-2	4	Non	4	-3	9	Non

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)
9	2	10	3
9	2	10	3
9	2	10	3
8	1	9	2
8	1	9	2
8	1	9	2
8	1	8	1
7	0	8	1
7	0	7	0
7	0	7	0
7	0	7	0
7	0	6	-1
6	-1	6	-1
6	-1	6	-1
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
6	-1	5	-2
5	-2	4	-3
5	-2	4	-3

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne
9	2	4	10	3	9
9	2	4	10	3	9
9	2	4	10	3	9
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	9	2	4
8	1	1	8	1	1
7	0	0	8	1	1
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	7	0	0
7	0	0	6	-1	1
6	-1	1	6	-1	1
6	-1	1	6	-1	1
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
6	-1	1	5	-2	4
5	-2	4	4	-3	9
5	-2	4	4	-3	9

Résultats au questionnaire du groupe A	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,22) ?	Résultats au questionnaire du groupe B	Différence par rapport à la moyenne (7 ou 70 %)	Valeur au carré de la différence par rapport à la moyenne	Score compris dans un intervalle d’un écart type autour de la moyenne (1,97) ?
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
9	2	4	Non	10	3	9	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	9	2	4	Non
8	1	1	Oui	8	1	1	Oui
7	0	0	Oui	8	1	1	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	7	0	0	Oui
7	0	0	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	6	-1	1	Oui
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
6	-1	1	Oui	5	-2	4	Non
5	-2	4	Non	4	-3	9	Non
5	-2	4	Non	4	-3	9	Non