Calcul d'erreur
Le calcul d'erreur, ou calcul d'incertitudes est un ensemble de techniques permettant d'estimer l'erreur faite sur un résultat numérique, à partir des incertitudes ou des erreurs faites sur les mesures qui ont conduit à ce résultat. Ceci permet donc d'estimer la propagation des erreurs.
L'erreur de mesure détermine la sensibilité (capacité à sélectionner les bons « candidats ») et la sélectivité (capacité à éliminer les mauvais « candidats ») d'une méthode.
| Image manquante GonioX.jpg Cet article fait partie de la série Science |
| Disciplines scientifiques |
| Méthode scientifique |
| Recherche scientifique |
| Matière |
| Physique |
| Chimie |
| Nature |
| Sciences de la Terre |
| Agronomie |
| Écologie |
| Vie |
| Biologie |
| Médecine |
| Humaines |
| Sciences humaines |
| Sciences sociales |
| Méta |
| Page projet |
| Sommaire |
Erreur de mesure
Il faut considérer trois sources d'erreur (uncertainty en anglais) :
- la précision de la mesure Δ1, ou l'incertitude (resolution en anglais) ;
- la dispersion statistique Δ2 (precision en anglais) ;
- l'erreur systématique Δ3 (accuracy en anglais).
l'erreur totale étant
- Δ = Δ1 + Δ2 + Δ3
Si l'on fait la comparaison avec des flèches que l'on tire sur une cible :
- la précision de mesure (resolution) désigne la taille de la pointe de la flèche ;
- la dispersion statistique (precision) désigne le fait que les flèches sont proches les unes des autres, ou bien au contraire éparpillées sur la cible ;
- l'erreur systématique (accuracy) indique si les flèches visaient bien le centre, ou bien un autre point de la cible.
Image manquante
Incertitude_illustree_par_fleches_et_cible.png
Métaphore de l'incertitude de mesure : a) la dispersion statistique et l'erreur systématique sont faibles ; b) la dispersion statistique est forte mais l'erreur systématique est faible ; c) la dispersion statistique est faible mais l'erreur systématique est forte.
Métaphore de l'incertitude de mesure : a) la dispersion statistique et l'erreur systématique sont faibles ; b) la dispersion statistique est forte mais l'erreur systématique est faible ; c) la dispersion statistique est faible mais l'erreur systématique est forte.
Précision de mesure
Sur un appareil analogique, la première limitation est la distance séparant les graduations ; on peut améliorer ceci avec un vernier, comme sur un pied à coulisse ou certains goniomètres, ou bien avec une vis micrométrique comme sur un Palmer. Sur un appareil numérique, cette précision est donnée par le nombre de chiffres de l'affichage.
- Δ1 est l'espacement entre les graduations, ou bien la valeur d'une unité du dernier chiffre de l'affichage
Mais il se peut que le phénomène soit instable ou bien perturbé par un phénomène extérieur aléatoire. Alors, on verra l'aiguille osciller ou bien les derniers chiffres de l'affichage numérique changer. Ceci réduit la précision de mesure, on ne peut considérer que la partie stable du nombre obtenu.
Lorsque l'on utilise des publications très anciennes pour évaluer un événement non reproductible (l'objet a disparu ou s'est altéré, ou bien il s'agit d'un événement unique), on doit parfois avoir recours à une échelle empirique, comme par exemple l'échelle de Mercalli ou de Rossi-Forel pour les séismes ou l'échelle de Mohs pour la dureté d'un matériau, l'évaluation de Δ1 devient alors difficile ; cela n'est possible que si l'on peut établir une correspondance avec une échelle « moderne » basée sur une mesure physique. Par exemple, on essaie d'établir une correspondance entre les dégâts d'un séisme décrits dans des écrits antiques et l'énergie des ondes sismiques.
De même, lorsque la mesure consiste à classifier un phénomène dans une catégorie (cas par exemple d'un sondage d'opinion ou du recensement des pathologies), il n'est pas possible de définir Δ1.
Dispersion statistique
Si l'on mesure plusieurs fois le même phénomène avec un appareil suffisamment précis, on obtiendra chaque fois un résultat différent xi. Ceci est dû à des phénomènes perturbateurs ou, pour les mesures extrêmement précises, à la nature aléatoire du phénomène (chaos, incertitude quantique).
Parmi les phénomènes perturbateurs, on peut dénombrer :
- l'erreur d'échantillonnage : c'est lorsque l'on prélève un échantillon qui n'est pas représentatif de ce que l'on veut mesurer ; le résultat dépend alors de la manière dont on choisit l'échantillon ;
- l'erreur de préparation : c'est lorsque la préparation de l'échantillon introduit un biais ; l'échantillon s'altère pendant le transport, le stockage ou la manipulation (pollution, dégradation, transformation physique ou chimique) ;
- la stabilité de l'appareil : celui-ci peut être sensible aux variations de température, de tension d'alimentation électrique, aux vibrations, aux perturbations électromagnétiques des appareils environnants... ou bien présenter un défaut de conception ou une usure (bruit de fond électronique, pièce instable...)
Sur un grand nombre de mesures, on peut considérer que l'on a une probabilité dont la distribution est gaussienne. Le résultat de la mesure sera alors la moyenne empirique Ê des résultats
le carré de l'écart type σ² de la gaussienne peut s'évaluer avec la variance empirique corrigée
:
L'erreur due à la dispersion statistique est alors estimée par
le chiffre 3 étant une constante statistique correspondant à un intervalle de confiance de 99,73 %, c'est-à-dire que 99,73 % des valeurs xi sont comprises entre Ê - Δx et Ê + Δx. Si l'on a peu d'échantillons, il faut utiliser un coefficient plus grand pour prendre en compte l'erreur faite sur la détermination de Ê et de
(voir la loi statistique de Student). On peut aussi volontairement choisir un intervalle de confiance plus grand ou plus petit, et donc prendre un coefficient plus grand ou plus petit. À titre d'exemple :
| intervalle de confiance | 5 mesures | 10 mesures | 20 mesures | > 100 mesures |
|---|---|---|---|---|
| 50 % | 1,5·σ | |||
| 90 % | 4·σ | 3·σ | 2,5·σ | 1,7·σ |
| 95 % | 2,6·σ | 2,3·σ | 2,1·σ | 2·σ |
| 99 % | 2,6·σ |
Note : les valeurs sont arrondies
Sur une gaussienne, la largeur à mi-hauteur (full width at half maximum, FWHM) représente un intervalle de confiance d'environ 67 % (soit 2/3) pour un grand nombre de mesures.
Dans le cas de mesures physiques ou chimiques, l'évaluation de la dispersion statistique se fait par des mesures de répétabilité et de reproductibilité, et éventuellement par des mesures croisées inter-laboratoires :
- répétabilité : on mesure plusieurs fois le même échantillon, et l'on relève les résultats ; ceci permet d'évaluer la stabilité dans le temps de l'appareil et de l'échantillon (vieillissement dans l'appareil ou hors de l'appareil) ;
- reproductibilité : on mesure plusieurs fois le même matériau ou phénomène ; la différence avec la répétabilité est que l'on reprépare à chaque fois la mesure (par exemple prélèvement de l'échantillon et conditionnement pour la mesure, ou bien mise en place de l'appareil de mesure et réglage préalable) et que ceci est fait par différentes personnes ; ceci permet de prendre en compte la totalité de la chaîne de mesure et les erreurs humaines ;
- essais croisés inter-laboratoires : un échantillon inconnu est envoyé à plusieurs laboratoires et l'on compare les résultats, on prend ainsi en compte la diversité des appareils de mesure et les habitudes de travail.
Si la précision de mesure est inférieure à la dispersion statistique, on mesure alors toujours le même résultat (aux erreurs de lecture ou d'utilisation près).
Erreur systématique
L'erreur systématique comprend des phénomènes comme l'erreur d'échantillonnage, l'erreur de préparation ; ces problèmes peuvent introduire une dispersion statistique (cf. ci-dessus) ou bien un décalage des résultats si l'erreur commise est toujours la même.
Les appareils dérivent avec le temps, ce qui rend nécessaire leur ré-étalonnage régulier. On peut avoir une très faible dispersion statistique, et avoir toutefois un résultat faux...
On peut aussi tout simplement... mesurer un paramètre qui ne représente pas de manière pertinente ce que l'on veut évaluer. Par exemple, en économie, le produit intérieur brut par habitant est un mauvais estimateur du développement d'un peuple. Dans un sondage d'opinion, la question peut orienter la réponse.
Propagation de l'erreur
Le résultat d'une mesure est fréquemment utilisé pour faire des calculs. Par exemple, dans le cas d'un radar routier (cinémomètre) on mesure un décalage de fréquence et ce décalage est utilisé pour calculer la vitesse du véhicule, avec la loi de Doppler-Fizeau. Il faut donc, à partir de l'erreur commise sur la mesure du décalage de fréquence, estimer l'erreur sur la vitesse.
D'une manière générale, on mesure une valeur x, et l'on calcule une valeur y = ƒ(x) ; on veut estimer Δy à partir de Δx. C'est le problème de la propagation de l'erreur.
Report des extrêmes dans le calcul
La première solution consiste à effectuer les calculs avec les extrêmes de l'intervalle d'erreur. Si la mesure a pour valeur
- a ± Δa
alors la « valeur réelle » est supposée être dans l'intervalle [a-Δa;a+Δa]. On calcule donc ici
- y1 = ƒ(a-Δa)
- y2 = ƒ(a+Δa)
et, selon l'ordre de y1 et de y2, on prend [y1;y2] ou [y2;y1] comme intervalle d'erreur.
Cette méthode n'est valable que si la loi est uniforme (c'est-à-dire croissante ou décroissante) sur l'intervalle [a-Δa;a+Δa].
Estimation à partir de la dérivée
Une manière simple, utilisée fréquemment en physique, consiste à utiliser un développement limité du premier ordre, c'est-à-dire à remplacer la loi ƒ par sa « tangente » pour estimer l'erreur. On estime ainsi l'erreur avec une loi uniforme (linéaire) et simple.
On a :
- ƒ(x) = ƒ(a) + ƒ '(a)·(x-a) + o(x)
où o(x) est une fonction qui « tend vite » vers 0. Si l'on remplace x par a + Δa, on a alors
- ƒ(a + Δa) = ƒ(a) + ƒ '(a)·Δa + o(a + Δa)
On peut donc estimer
- Δy ≈ ƒ '(a) · Δa
Cette erreur est sous-estimée si l'on a une loi convexe.
Utilisation des différentielles totale exacte
Une loi physique s'exprime par une relation algébrique entre un cerain nombre de grandeurs mesurables:
- P : pression du gaz
- V : volume occupé par le gaz
- n : quantité de gaz en moles (1 mole = 6,022 1023 molécules)
- R : constante des gaz parfaits = 8,314 J.K-1.mol-1
- T : température absolue du gaz, en kelvin
exprime la pression en fonction de n,R,T et V.
écrivons sa différentielle:
donne l'erreur absolue sur P déduite du calcul de P à partir de la connaissance des erreurs sur T R n et V.
Autres exemples simples :
- le calcul de la surface d'un rectangle.
peut s'écrire dS = ((L + dL)(l + dl) − Ll) = Ldl + ldL + dLdl que l'on approxime par dS = Ldl + ldL
- le calcul d'un volume V=xyz.
V(x + dx,y + dy,z + dz) = (x + dx)(y + dy)(z + dz) = xyz + dxyz + xdyz + xydz + xdydz + ydxdz + zdxdy + dxdydz peut s'écrire dV = yzdx + zxdy + xydz + dxdydz que l'on approxime par dV = yzdx + zxdy + xydz noter que
rappel:
- et plus généralement pour le calcul de la variation d'une fonction f(x,y,z).
= dérivée partielle par rapport à x
Voir aussi
- Métrologie
- critères de dispersion
- Qualité métrologique des appareils de mesure
- écart type
- statistiques
- Les sources d'erreurs
Liens externes
- Bases de l'expression de l'incertitude, document du NIST (organisme de normalisation étatsunien, en anglais)
- http://www.ccdmd.qc.ca/chiffres/
- http://www.educnet.education.fr/phy/igen/erreurs.htm
- http://www.ujf-grenoble.fr/PHY/AGREGCAPES/AGREG/Docs/Modelisation.pdf
- http://www.colvir.net/prof/pierre.morin/NYAClic/Resumes/Resume_de_Mecanique(incert).html
- http://thunder1.cudenver.edu/chemistry/classes/chem4518/suppdata/data.html
- http://www.miramar.sdccd.cc.ca.us/faculty/fgarces/ChemComon/Tutorial/Excel/
