Calcul d'erreur


Le calcul d'erreur, ou calcul d'incertitudes est un ensemble de techniques permettant d'estimer l'erreur faite sur un résultat numérique, à partir des incertitudes ou des erreurs faites sur les mesures qui ont conduit à ce résultat. Ceci permet donc d'estimer la propagation des erreurs.

L'erreur de mesure détermine la sensibilité (capacité à sélectionner les bons « candidats ») et la sélectivité (capacité à éliminer les mauvais « candidats ») d'une méthode.

Image manquante
GonioX.jpg



Cet article fait partie de la série
Science
Disciplines scientifiques
Méthode scientifique
Recherche scientifique
Matière
Physique
Chimie
Nature
Sciences de la Terre
Agronomie
Écologie
Vie
Biologie
Médecine
Humaines
Sciences humaines
Sciences sociales
Méta
Page projet
Sommaire

Erreur de mesure

Il faut considérer trois sources d'erreur (uncertainty en anglais) :

l'erreur totale étant

Δ = Δ1 + Δ2 + Δ3

Si l'on fait la comparaison avec des flèches que l'on tire sur une cible :

Image manquante
Incertitude_illustree_par_fleches_et_cible.png
Métaphore de l'incertitude de mesure : a) la dispersion statistique et l'erreur systématique sont faibles ; b) la dispersion statistique est forte mais l'erreur systématique est faible ; c) la dispersion statistique est faible mais l'erreur systématique est forte.


Métaphore de l'incertitude de mesure : a) la dispersion statistique et l'erreur systématique sont faibles ; b) la dispersion statistique est forte mais l'erreur systématique est faible ; c) la dispersion statistique est faible mais l'erreur systématique est forte.

Précision de mesure

Sur un appareil analogique, la première limitation est la distance séparant les graduations ; on peut améliorer ceci avec un vernier, comme sur un pied à coulisse ou certains goniomètres, ou bien avec une vis micrométrique comme sur un Palmer. Sur un appareil numérique, cette précision est donnée par le nombre de chiffres de l'affichage.

Δ1 est l'espacement entre les graduations, ou bien la valeur d'une unité du dernier chiffre de l'affichage

Mais il se peut que le phénomène soit instable ou bien perturbé par un phénomène extérieur aléatoire. Alors, on verra l'aiguille osciller ou bien les derniers chiffres de l'affichage numérique changer. Ceci réduit la précision de mesure, on ne peut considérer que la partie stable du nombre obtenu.

Lorsque l'on utilise des publications très anciennes pour évaluer un événement non reproductible (l'objet a disparu ou s'est altéré, ou bien il s'agit d'un événement unique), on doit parfois avoir recours à une échelle empirique, comme par exemple l'échelle de Mercalli ou de Rossi-Forel pour les séismes ou l'échelle de Mohs pour la dureté d'un matériau, l'évaluation de Δ1 devient alors difficile ; cela n'est possible que si l'on peut établir une correspondance avec une échelle « moderne » basée sur une mesure physique. Par exemple, on essaie d'établir une correspondance entre les dégâts d'un séisme décrits dans des écrits antiques et l'énergie des ondes sismiques.

De même, lorsque la mesure consiste à classifier un phénomène dans une catégorie (cas par exemple d'un sondage d'opinion ou du recensement des pathologies), il n'est pas possible de définir Δ1.

Dispersion statistique

Si l'on mesure plusieurs fois le même phénomène avec un appareil suffisamment précis, on obtiendra chaque fois un résultat différent xi. Ceci est dû à des phénomènes perturbateurs ou, pour les mesures extrêmement précises, à la nature aléatoire du phénomène (chaos, incertitude quantique).

Parmi les phénomènes perturbateurs, on peut dénombrer :

Sur un grand nombre de mesures, on peut considérer que l'on a une probabilité dont la distribution est gaussienne. Le résultat de la mesure sera alors la moyenne empirique Ê des résultats

\hat{E} = \bar{X} = \frac{1}{n} \cdot \sum_{i = 1}^n x_i

le carré de l'écart type σ² de la gaussienne peut s'évaluer avec la variance empirique corrigée \hat{\sigma}^2 :

\hat{\sigma}^2 = \frac{1}{n-1} \cdot \sum_{i = 1}^n (x_i - \bar{X})^2

L'erreur due à la dispersion statistique est alors estimée par

\Delta_2 = 3\cdot \hat{\sigma}

le chiffre 3 étant une constante statistique correspondant à un intervalle de confiance de 99,73 %, c'est-à-dire que 99,73 % des valeurs xi sont comprises entre Ê - Δx et Ê + Δx. Si l'on a peu d'échantillons, il faut utiliser un coefficient plus grand pour prendre en compte l'erreur faite sur la détermination de Ê et de \hat{\sigma} (voir la loi statistique de Student). On peut aussi volontairement choisir un intervalle de confiance plus grand ou plus petit, et donc prendre un coefficient plus grand ou plus petit. À titre d'exemple :

intervalle de confiance 5 mesures 10 mesures 20 mesures > 100 mesures
50 % 1,5·σ
90 % 4·σ 3·σ 2,5·σ 1,7·σ
95 % 2,6·σ 2,3·σ 2,1·σ 2·σ
99 % 2,6·σ

Note : les valeurs sont arrondies

Sur une gaussienne, la largeur à mi-hauteur (full width at half maximum, FWHM) représente un intervalle de confiance d'environ 67 % (soit 2/3) pour un grand nombre de mesures.

Dans le cas de mesures physiques ou chimiques, l'évaluation de la dispersion statistique se fait par des mesures de répétabilité et de reproductibilité, et éventuellement par des mesures croisées inter-laboratoires :

Si la précision de mesure est inférieure à la dispersion statistique, on mesure alors toujours le même résultat (aux erreurs de lecture ou d'utilisation près).

Erreur systématique

L'erreur systématique comprend des phénomènes comme l'erreur d'échantillonnage, l'erreur de préparation ; ces problèmes peuvent introduire une dispersion statistique (cf. ci-dessus) ou bien un décalage des résultats si l'erreur commise est toujours la même.

Les appareils dérivent avec le temps, ce qui rend nécessaire leur ré-étalonnage régulier. On peut avoir une très faible dispersion statistique, et avoir toutefois un résultat faux...

On peut aussi tout simplement... mesurer un paramètre qui ne représente pas de manière pertinente ce que l'on veut évaluer. Par exemple, en économie, le produit intérieur brut par habitant est un mauvais estimateur du développement d'un peuple. Dans un sondage d'opinion, la question peut orienter la réponse.

Propagation de l'erreur

Propagation des erreurs

Le résultat d'une mesure est fréquemment utilisé pour faire des calculs. Par exemple, dans le cas d'un radar routier (cinémomètre) on mesure un décalage de fréquence et ce décalage est utilisé pour calculer la vitesse du véhicule, avec la loi de Doppler-Fizeau. Il faut donc, à partir de l'erreur commise sur la mesure du décalage de fréquence, estimer l'erreur sur la vitesse.

D'une manière générale, on mesure une valeur x, et l'on calcule une valeur y = ƒ(x) ; on veut estimer Δy à partir de Δx. C'est le problème de la propagation de l'erreur.

Report des extrêmes dans le calcul

La première solution consiste à effectuer les calculs avec les extrêmes de l'intervalle d'erreur. Si la mesure a pour valeur

a ± Δa

alors la « valeur réelle » est supposée être dans l'intervalle [aa;aa]. On calcule donc ici

y1 = ƒ(aa)
y2 = ƒ(aa)

et, selon l'ordre de y1 et de y2, on prend [y1;y2] ou [y2;y1] comme intervalle d'erreur.

Cette méthode n'est valable que si la loi est uniforme (c'est-à-dire croissante ou décroissante) sur l'intervalle [aa;aa].

Estimation à partir de la dérivée

Une manière simple, utilisée fréquemment en physique, consiste à utiliser un développement limité du premier ordre, c'est-à-dire à remplacer la loi ƒ par sa « tangente » pour estimer l'erreur. On estime ainsi l'erreur avec une loi uniforme (linéaire) et simple.

On a  :

ƒ(x) = ƒ(a) + ƒ '(a)·(x-a) + o(x)

o(x) est une fonction qui « tend vite » vers 0. Si l'on remplace x par a + Δa, on a alors

ƒ(a + Δa) = ƒ(a) + ƒ '(a)·Δa + o(a + Δa)

On peut donc estimer

Δy ≈ ƒ '(a) · Δa

Cette erreur est sous-estimée si l'on a une loi convexe.

Utilisation des différentielles totale exacte

Une loi physique s'exprime par une relation algébrique entre un cerain nombre de grandeurs mesurables:

P =\frac{n \times R \times T}{V} exprime la pression en fonction de n,R,T et V.

écrivons sa différentielle:

dP =\frac{n \times R}{V} dT + \frac{n  \times T}{V} dR + \frac{ R \times T}{V}dn - \frac{n \times R \times T}{V^2}dV

\delta P =\frac{n \times R}{V}\delta T + \frac{n  \times T}{V}\delta R +\frac{ R \times T}{V}\delta n + \frac{n \times R \times T}{V^2}\delta V

donne l'erreur absolue sur P déduite du calcul de P à partir de la connaissance des erreurs sur T R n et V.

Autres exemples simples :

S = LletS + dS = (L + dL)(l + dl) = Ll + Ldl + ldL + dll

peut s'écrire dS = ((L + dL)(l + dl) − Ll) = Ldl + ldL + dLdl que l'on approxime par dS = Ldl + ldL

V(x + dx,y + dy,z + dz) = (x + dx)(y + dy)(z + dz) = xyz + dxyz + xdyz + xydz + xdydz + ydxdz + zdxdy + dxdydz peut s'écrire dV = yzdx + zxdy + xydz + dxdydz que l'on approxime par dV = yzdx + zxdy + xydz noter que

dV = yz dx +zx dy +  xy dz = \frac{\partial (xyz) }{\partial x}dx+\frac{\partial (xyz) }{\partial y}dy+\frac{\partial (xyz) }{\partial z}dz

rappel: \frac{\partial (xyz) }{\partial x}= yz ; \frac{\partial (xyz) }{\partial y}=xz ; \frac{\partial (xyz) }{\partial z}=xy

\frac{\partial f(x,y,z) }{\partial x}= dérivée partielle par rapport à x

d f(x,y,z)  = \frac{\partial  f(x,y,z) }{\partial x}dx+\frac{\partial f(x,y,z) }{\partial y}dy+\frac{\partial  f(x,y,z)}{\partial z}dz

Voir aussi

Liens externes

See also: Calcul d'erreur, Agronomie, Biologie, Chimie, Cinémomètre, Constante des gaz parfaits, Critères de dispersion, Dureté (métal), Développement humain