Université du Québec à Rimouski

Écart-type


Accueil ] Remonter ]Plan du site ] [ Définitions ]


Définitions

La variance et l'écart-type sont deux mesures de dispersion des observations d'une variable quantitative. On les calcule de manière systématique pour chacune des variables utilisées. Ces mesures, liées à la moyenne, donnent une bonne représentation de la réalité, surtout si la variable respecte la distribution normale

En eux-mêmes, ces indicateurs n'évoquent rien de précis, cependant ils permettent de comparer mathématiquement la dispersion des variables.  

Sommaire

Formule mathématique

L'interprétation de l'écart-type

Difficultés d'interprétation

Interprétation pour une distribution normale

Formule mathématique pour un échantillon

Exemple de calcul

Calcul de la variance et de l'écart-type avec un logiciel

Interprétation des résultats

 

Formule mathématique

La variance2) est la moyenne des carrés des déviations de la moyenne arithmétique. L'écart-type (σ) est la racine carrée de la variance. Il est donc facile de trouver la variance à partir de l'écart-type et vice versa. 

La formule mathématique de la variance s'écrit comme suit :

     

i, observation «i» de la variable X;
μ
,   moyenne de la variable X;
n,    nombre d'observations;
 

Tous les logiciels statistiques en font le calcul. La logique du calcul, est fondée sur le calcul du carré de la distance entre les observations et la moyenne Σ(X - μ)2 , minimiser cette somme nous donne le critère des moindres carrés. On retrouve un grand nombre de procédures statistiques, comme la régression par exemple, utilisant ce critère dans leurs calculs.

Le calcul de la variance et de l'écart-type n'est valide que pour les variables quantitatives

 

L'interprétation de l'écart-type

Plus l'écart-type est élevé, plus grande est la dispersion des observations d'une variable. En effet, l'écart-type doit englober les 68% des observations autour de la moyenne. 

L'écart-type est surtout utile pour comparer la dispersion d'une variable dans une même population (P) à des temps différents ou auprès de deux populations comparables.

Comme toutes les observations d'une variable servent au calcul de l'écart-type, sa valeur représente bien la dispersion de la variable.

Difficultés d'interprétation

La difficulté d'interpréter l'écart-type provient que sa valeur varie selon l'ordre de grandeur des observations de la variable. Ainsi, pour plusieurs variables différentes, un plus grand écart-type ne signifie pas nécessairement une plus grande dispersion. On utilise le coefficient de variation pour mieux comprendre l'ampleur de la dispersion.

Interprétation pour une distribution normale

L'écart-type prend plus de sens si la distribution de la variable respecte la distribution normale. On peut alors calculer quel pourcentage des cas où des observations se retrouvent sur un intervalle de distribution. Par exemple, la forme de la distribution normale nous enseigne que deux écarts types autour de la moyenne, de -1 à +1, regroupent 68 % des observations de la population.

Pour une étendue de quatre écarts types autour de la moyenne, soit de -2 à +2, on rassemble 95 % des cas observés. 

 

Formules de calculs de l'écart-type pour un échantillon

On calcule la variance d'une manière différente selon que la variable représente une population ou un échantillon, c'est-à-dire une portion de la population. 

 

Formule de calcul de l'écart-type
Population Échantillon de population
Formule
Variance (sigma carré)   
Écart type  
Moyenne arithmétique  
Valeurs des observations
 Taille de la population

 

Exemple de calcul

On calcule la variance en quatre étapes simples : 

1– Calculer la moyenne de la variable;

2– Calculer le carré des déviations pour chaque observation : soustraire la moyenne de l'observation et mettre le résultat au carré;

3– Faire la somme des carrés des déviations;

4– Diviser par le nombre d'observations;

Pour calculer l'écart-type, on ajoute une cinquième étape :

5- Calculer la racine carrée de la variance.

 

Prenons comme exemple, le nombre d'heures d'ensoleillement quotidien pendant une semaine, donc 7 observations.

Heures d'ensoleillements : 7, 10, 12, 2, 4, 13, 8.

1– Calculer la moyenne de la variable :

         = (7 + 10 + 12 + 2 + 4 + 13 + 8)/7 = 56 / 7 = 8

        La moyenne est de 8.

2–Calculer le carré des déviations : pour chaque observation, soustraire la moyenne et mettre au carré la différence :


            (  7 - 8)=   1
            (10 - 8)=   4
            (12 - 8)= 16
            (  2 - 8)= 36
            (  4 - 8)= 16
            (13 - 8)= 25
            (  8 - 8)=   0

3– Faire la somme des carrés des déviations :

(1 + 4 + 16 + 36 + 16 + 25 + 0) = 98.

4– Diviser par la population n (ou n -1 pour un échantillon).

À cette étape, le calcul se divise en deux selon que les données sont pour une population ou pour un échantillon d'une population :

Population

Échantillon de population

 98 / 7

 98 / 6

Variance

 

 

Écart type

 

 

Lorsque le nombre d'observations est supérieur à 20, la différence d'un échantillonnage avec la population n'est que de 5%. La différence devient minime pour plus de 100 observations.

 

Calcul de la variance et de l'écart-type avec un logiciel

Logiciel utilisé : SPSS version 10 en français.

Entrez vos données dans SPSS. Les données que nous utilisons dans notre exemple sont fictives. Pour suivre cet exemple, téléchargez les données dans l'un des deux formats suivants :  SPSS  (préférable) ou ASCII (difficile).

Description des étapes

  • Menu Analyse --> Statistiques descriptives --> Fréquences.
    Une fenêtre intitulée Fréquences s'ouvre. Assurez-vous de placer dans la fenêtre de droite, les variables dont vous souhaitez faire l'analyse;
  • Vous pouvez décocher la case « Affichez les tableaux de fréquences ». Ne vous préoccupez pas du message d'avertissement;
    • Cliquez sur le bouton Statistique. Une fenêtre intitulée « Fréquences : Statistiques » s'ouvre et offre des choix d'analyses;

    • Cochez les cases Écart-type et Variance et décochez les autres cases, s'il y a lieu. Cliquez sur le bouton Poursuivre pour fermer la fenêtre.

  • De retour à la fenêtre Fréquences, cliquez sur le bouton « OK » pour faire faire le calcul par SPSS.

Interprétation des résultats

Dans l'explorateur de résultats, cliquez sur Statistiques.

En haut du tableau on obtient le nom de la variable, dans ce cas « Heures d'ensoleillement »

  • N, est l'effectif : le nombre d'observations ou d'enregistrements; 

  • N Valide : 7 est le nombre d'observations valides, excluant les observations manquantes;

  • N Manquante : 0 est le nombre d'observations manquantes;

  • L'écart-type est 4.04;
  • La Variance est 16.33.

Note, SPSS calcule l'écart-type et la variance pour un échantillon.

 

Voir aussi

Étendue Quantile Intervalles interquartiles Écart-type Coefficient de variation Distribution Normale Cote Z