Écart type
| Sommaire |
En statistique élémentaire
L'écart type (ou déviation standard) est un critère de dispersion. Il mesure l'écart à la moyenne observée (et non à la moyenne théorique) et correspond à la moyenne quadratique des écarts entre les valeurs observées et la moyenne de ces valeurs observées. Il se note avec la lettre de l'alphabet grec, σ (sigma minuscule).
Formules : on trouve les formules suivantes
dans le cas d'une série discrète non regroupée.
dans le cas d'une série discrète regroupée.
dans le cas d'une série continue.
où xi sont les valeurs du caractère, ni les effectifs, fi les fréquences, mi les milieux des classes et
la moyenne
En probabilité
L'écart type mesure la dispersion d'une variable aléatoire autour de son espérance E(X). Il se calcule sous plusieurs formes
si la variable aléatoire est discrète.
lorsque la variable aléatoire est continue de densité de probabilité f.
En théorie des sondages
Lorsqu'il s'agit d'estimer la dispersion autour de la moyenne d'un caractère statistique dans une population de grande taille à partir d'un échantillon de taille n, on utilise pour l'écart type la valeur suivante
.
On peut remarquer que
Pourquoi n-1 ?
La question que l'on se pose généralement est « Pourquoi n - 1 ? ». La raison pour laquelle on divise par n - 1 au lieu de n est un bel exemple de l'interaction permanente entre les statistiques et les probabilités.
- Le sondage de n individus correspond à une série de n variables aléatoires xi indépendantes d'espérance E(X) et de variance V(X).
- La moyenne
de l'échantillon est une variable aléatoire d'espérance E(X) et de variance
(la moyenne de n variables aléatoires fluctue moins qu'une seule variable aléatoire).
- La variance v de l'échantillon est une variable aléatoire dont on veut calculer l'espérance.
.
est une variable aléatoire d'espérance
donc égale à E(X)2 + V(X).
est une variable aléatoire d'espérance E(X)2 + V(X).
est une variable aléatoire d'espérance
.
- Donc
.
- La variance v de l'échantillon fluctue donc autour de
et non autour de V(X) comme on aurait pu s'y attendre.
- Pour obtenir une estimation de V(X), il est donc nécessaire de prendre
.
- Et pour obtenir une estimation de l'écart type σ(X), il est nécessaire de prendre
.
Aspect qualitatif
Plus communément appelée ECART-TYPE, la déviation standard caractérise la largeur de la distribution. Elle est exprimée mathématiquement comme étant la racine carrée de la variance, celle-ci mesurant la distribution des valeurs autour du centre de la courbe.
Écart-type (S) = Racine carrée de la variance
- L'écart-type est la mesure de dispersion, ou étalement, la plus couramment utilisée en statistique lorsqu'on emploie la moyenne pour calculer une tendance centrale. Il mesure donc la dispersion autour de la moyenne. En raison de ses liens étroits avec la moyenne, l'écart-type peut être grandement influencé si cette dernière donne une mauvaise mesure de tendance centrale.
- Contrairement à l'étendue et aux quartiles, la variance permet de combiner toutes les valeurs à l'intérieur d'un ensemble de données afin d'obtenir la mesure de dispersion. La variance (symbolisée par S2) et l'écart-type (la racine carré de la variance, symbolisée par S) sont les mesures de dispersion les plus couramment utilisées.
La variance est définie comme étant la moyenne arithmétique des carrés des différences entre les valeurs observées et la moyenne. C'est une mesure du degré de dispersion d'un ensemble de données. On la calcule sous la forme de l'écart au carré moyen de chaque nombre par rapport à la moyenne d'un ensemble de données.
Répartition de la population
Lorsque la variable étudiée est gaussienne (répartition selon une courbe en cloche), l'écart-type permet de déterminer la répartition de la population autour de la valeur moyenne.
Par exemple : Si par convention, la déviation standard par rapport à un échantillon équivaut à 15 points de QI de différence, cela signifie que les 2/3 environ de la population d'une classe d'âge ont un QI compris entre 85 et 115 --> Voir QI et intervalle de confiance
Interprétation d'un écart type élévé
Généralement, plus les valeurs sont largement distribuées, plus l'écart-type est élevé. Imaginez, par exemple, que nous devons séparer deux ensembles différents de résultats d'examens de 30 élèves; les notes du premier examen varient de 31 % à 98 % et celles du second, de 82 % à 93 %. Compte tenu de ces étendues, l'écart-type serait plus grand pour les résultats du premier examen.
Cependant, il n'est pas toujours facile d'évaluer l'importance que doit avoir l'écart-type pour que les données soient largement dispersées.
L'importance de l'écart-type dépend aussi de l'importance de la valeur moyenne de l'ensemble des données. Lorsque vous mesurez quelque chose en millions, le fait d'avoir des mesures qui se rapprochent de la valeur moyenne n'a pas la même signification que si vous mesurez le poids de deux personnes.
Par exemple, si après avoir mesuré les recettes annuelles de deux grandes entreprises, vous constatez un écart de 100 000 euros, la différence est considérée comme étant peu significative, alors que si vous mesurez le poids de deux personnes, dont l'écart est de 30 kilogrammes, la différence est considérée comme étant très significative.
Voilà pourquoi il est parfois utile de travailler, dans certains cas, sur l'écart type relatif (écart-type quotienté par la moyenne).
On nomme variance le carré de l'écart type : V(X) = σ2
