Définitions
La variance et l'écart-type sont deux mesures de dispersion des observations d'une
variable
quantitative. On les calcule de
manière systématique pour chacune des variables utilisées. Ces mesures, liées à la moyenne,
donnent une bonne représentation de la réalité, surtout si la variable respecte la distribution
normale.
En eux-mêmes, ces indicateurs n'évoquent rien de précis, cependant ils
permettent de comparer mathématiquement la dispersion des variables.
Formule mathématique
L'interprétation de l'écart-type
Difficultés d'interprétation
Interprétation pour une distribution normale
Formule mathématique pour un
échantillon
Exemple de calcul
Calcul de la
variance et de l'écart-type avec un logiciel
Interprétation des résultats

La
variance (σ2) est la
moyenne des carrés des déviations de la moyenne arithmétique. L'écart-type
(σ) est la racine carrée de la variance. Il est donc facile de trouver la
variance à partir de l'écart-type et vice versa.
La formule mathématique de la variance s'écrit comme suit :
i, observation
«i» de la variable
X;
μ,
moyenne de la variable X;
n, nombre
d'observations;
Tous les logiciels
statistiques en font le calcul. La logique du calcul, est fondée sur le
calcul du carré de la distance entre les observations et la moyenne
Σ(X - μ)2 , minimiser
cette somme nous donne le critère des moindres carrés. On retrouve un
grand nombre de procédures statistiques, comme la régression par exemple,
utilisant ce critère dans leurs calculs.
Le calcul de la variance et de l'écart-type n'est valide que pour les variables
quantitatives.

Plus l'écart-type est élevé, plus grande est la
dispersion des observations d'une variable. En effet, l'écart-type doit
englober les 68% des observations autour de la moyenne.

L'écart-type est surtout utile pour comparer la dispersion d'une variable
dans une même
population (P) à des temps différents ou auprès de deux
populations comparables.
Comme toutes les observations d'une variable servent au calcul de l'écart-type, sa valeur représente bien la dispersion de la variable.
La difficulté d'interpréter l'écart-type provient que sa valeur varie selon
l'ordre de grandeur des observations de la variable. Ainsi, pour plusieurs
variables différentes, un plus grand écart-type ne signifie pas nécessairement une plus grande dispersion. On utilise le coefficient
de variation pour mieux comprendre l'ampleur de la dispersion.
L'écart-type prend plus de sens si la distribution de la variable respecte la
distribution normale. On peut alors
calculer quel pourcentage des cas où des observations se retrouvent sur un
intervalle de distribution. Par exemple, la forme de la distribution normale
nous enseigne que deux écarts types autour de la moyenne, de -1 à +1, regroupent
68 % des observations de la population.
Pour une étendue de quatre écarts types autour de la moyenne, soit de -2 à
+2, on rassemble 95 % des cas observés.


On calcule la variance d'une manière différente selon que la variable représente une
population ou un
échantillon, c'est-à-dire
une portion de la population.

On calcule la variance en quatre étapes simples :
1– Calculer la moyenne de la variable;2– Calculer le carré des déviations pour chaque observation : soustraire la moyenne
de l'observation et mettre le résultat au carré;
3– Faire la somme des carrés des déviations;4– Diviser par le nombre
d'observations;
Pour calculer l'écart-type, on ajoute une cinquième étape :
5- Calculer la racine carrée de la variance.
Prenons comme exemple, le nombre d'heures d'ensoleillement quotidien pendant une
semaine, donc 7 observations.
Heures d'ensoleillements : 7, 10, 12, 2, 4, 13, 8.
1– Calculer la moyenne de la variable :
= (7
+ 10 + 12 + 2 + 4 + 13 + 8)/7 = 56 / 7 = 8
La moyenne est de 8.
2–Calculer le carré des déviations : pour chaque observation, soustraire la moyenne et mettre au carré
la différence :

(
7 - 8)2 = 1
(10 - 8)2 = 4
(12 - 8)2 = 16
(
2 - 8)2 = 36
(
4 - 8)2 = 16
(13 - 8)2 = 25
(
8 - 8)2 = 0
3– Faire la somme des carrés des déviations :
(1 + 4 + 16 + 36 + 16 + 25 + 0) = 98.
4– Diviser par la population n
(ou n -1 pour un échantillon).
À cette étape, le calcul se divise en deux selon que les données sont
pour une population ou pour un échantillon d'une population :
|
|
Population |
Échantillon de population |
|
|
98 / 7 |
98 / 6 |
|
Variance |
|
|
|
Écart type |
|
|
|
|
|
|
Lorsque le nombre d'observations est supérieur à 20, la différence
d'un échantillonnage avec la population n'est que de 5%. La différence devient minime pour plus
de 100 observations.

Logiciel utilisé : SPSS version 10 en français.
Entrez vos données dans SPSS. Les données
que nous utilisons dans notre exemple sont fictives. Pour suivre cet
exemple, téléchargez les données dans l'un des deux formats suivants :
SPSS (préférable) ou
ASCII (difficile).
Description des étapes
Dans l'explorateur de
résultats, cliquez sur Statistiques.
En haut du tableau on obtient le nom de la variable, dans ce cas
« Heures d'ensoleillement »
-
N, est l'effectif
: le nombre d'observations ou d'enregistrements;
-
N Valide : 7 est le nombre d'observations valides, excluant
les observations manquantes;
-
N
Manquante : 0 est le nombre d'observations
manquantes;
-
L'écart-type est 4.04;
-
La Variance est 16.33.
Note, SPSS calcule l'écart-type et la variance pour un échantillon.
 Voir aussi
|