Variable aléatoire
| Sommaire |
Détails
- Dans son acception fréquentiste, une variable aléatoire peut être vue comme le résultat d'un mécanisme non-déterministe ou encore comme le résultat d'une expérience non-déterministe qui génère un résultat aléatoire. Une variable aléatoire ne prend pas forcément de valeurs numériques. On pensera par exemple au jet de dés dont le résultat peut prendre les valeurs 1, 2, 3, 4, 5, 6, au jeu de pile ou face dont le résultat est pile ou face, à la mesure de la taille d'un individu pris au hasard dans une population, dont le résultat est un nombre réel positif, etc.
- En mathématiques, et plus précisément en théorie des probabilités, une variable aléatoire est une fonction mesurable définie sur un espace de probabilités. La mesure image correspondante est appelée loi de la variable aléatoire. Ce type de fonction permet de modéliser un phénomène aléatoire, comme par exemple le résultat d'un jet de dés. Une propriété intéressante de l'intégrale de Lebesgue fait qu'un événement de probabilité strictement nulle n'est pas nécessairement impossible au sens strict du terme (ainsi, la probabilité qu'un réel tiré au hasard soit un entier est nulle, mais les entiers n'en existent pas moins dans l'ensemble des réels)
- En théorie de la décision bayésienne, une variable aléatoire traduit simplement un état de connaissance, que l'observation est susceptible de modifier à tout moment.
Les variables aléatoires sont très utilisées en probabilités, statistiques, morphologie mathématique (qui les généralise en fonctions aléatoires appelées dans d'autres domaines processus aléatoires ou processus stochastiques) et inférence bayésienne.
Quelques variables aléatoires
En guise d'introduction aux définitions concernant les variables aléatoires, il semble intéressant de présenter brièvement une famille de variables très utilisées.
Outre la variable certaine qui prend une valeur donnée avec une probabilité égale à 1, la variable aléatoire la plus simple est appelée variable de Bernoulli. Celle-ci peut prendre deux états, qu'il est toujours possible de coder 1 et 0, avec les probabilités p et 1-p. Une interprétation simple concerne un jeu de dé dans lequel on gagnerait un euro en tirant le six (p = 1/6). Sur une séquence de parties, la moyenne des gains tend vers p lorsque le nombre de parties tend vers l'infini.
Si on considère qu'une partie est constituée par n tirages au lieu d'un seul, le total des gains est une réalisation d'une variable binomiale qui peut prendre toutes les valeurs entières de 0 à n. Cette variable a pour moyenne le produit np. On obtient un exemple moins futile en considérant le score d'un candidat dans un sondage électoral.
Si n est assez grand et p pas trop petit, on peut trouver une approximation convenable en utilisant la variable de Gauss. Dans les sondages cela permet d'associer un intervalle de confiance au résultat brut. Ainsi, il y a 95 chances sur 100 pour qu'une enquête portant sur 1000 personnes donne un résultat correct à ± 3 % près.
Toujours avec n grand, l'approximation de Poisson est préférable si p est assez petit pour que la moyenne np ne soit pas trop grande, de l'ordre de quelques unités. Dans un sondage ce serait la loi applicable aux « petits » candidats. C'est surtout la loi utilisée dans des problèmes de files d'attente.
La somme des carrés de ν variables de Gauss indépendantes est une variable de χ2 à ν degrés de liberté (la variable exponentielle en est un cas particulier). Le test du χ2 est utilisé pour apprécier la valeur de l'adéquation d'une loi de probabilité sur une distribution empirique.
Si on divise une variable de Gauss par une variable de χ (racine carrée de la précédente), on obtient une variable de Student. Le rapport de deux variables de χ2 indépendantes définit une variable de Snedecor. Ces deux lois sont utilisées dans l'analyse de populations supposées gaussiennes.
Notions de base
Fonction de répartition
Il serait possible d'introduire cette notion à partir de l'une quelconque des variables précédemment considérées mais il paraît plus clair d'étudier le cas du dé sous un angle différent. En effet, il définit une variable aléatoire X qui prend avec la même probabilité d'apparition (1/6) des valeurs dans l'ensemble {1,2,3,4,5,6}. On peut alors associer à toute valeur réelle x la probabilité d'obtenir un tirage inférieur à x, ce qui définit une courbe en escalier dont les marches ont une hauteur égale à 1/6.
Formellement, cela conduit à une fonction de répartition

Dans celle-ci, la majuscule X représente la variable aléatoire, ensemble de valeurs numériques, et la minuscule x représente la variable d'état, variable au sens usuel du terme.
Fonction_de_répartition_36_numéros.png
Si les événements ne sont plus équiprobables, cela ne fait que déformer la courbe. Pour introduire une notion nouvelle, on peut commencer par remplacer le dé par une roulette à six numéros, ce qui conduit à un problème rigoureusement identique. Ensuite, on ne change rien de fondamental si on remplace les six nombres entiers par les repères descentres d'arcs de 60 degrés. À partir de là il est possible d'augmenter le nombre de secteurs en réduisant leur taille : les échelons deviendront de plus en plus petits jusqu'à être indiscernables sur un dessin. Le passage à la limite remplace la variable discrète par une variable continue qui prend toutes les valeurs réelles dans l'intervalle ]0,360] : c'est une variable uniforme.
Finalement toute fonction définie et non décroissante entre 0 (l'impossibilité) et 1 (la certitude) sur l'intervalle ]-∞,+∞[ peut être considérée comme fonction de répartition d'une variable aléatoire.
Fonction_de_répartition_variable_continue.png
L'intérêt de la fonction de répartition réside dans le fait qu'elle est valable aussi bien pour les variables continues définies sur un ensemble continu que pour les variables discrètes définies sur un ensemble dénombrable (dans la plupart des cas pratiques il se réduit à un ensemble de valeurs équidistantes que l'on peut ramener à un ensemble d'entiers). Le remplacement progressif de courbes en escaliers par des courbes continues permet de voir intuitivement comment une variable continue peut fournir une approximation souvent plus facile à manipuler que la variable discrète originale.
Malheureusement ces avantages de la fonction de répartition, intéressants pour la visualisation des phénomènes, disparaissent dès que l'on veut approfondir les problèmes. Dans ce cas, il est généralement plus commode d'utiliser les notions décrites dans les paragraphes suivants.
Fonction de probabilité d'une variable discrète
Une variable discrète est décrite tout simplement par l'ensemble de ses probabilités. Si on suppose qu'elle prend des valeurs entières, cela s'écrit

On reconstruit la fonction de répartition par
Si
alors
qui tend vers 1 lorsque x tend vers l'infini.
Densité de probabilité d'une variable continue
Une variable continue possède en général une fonction de répartition dérivable par morceaux. Il est alors commode de la dériver pour obtenir la densité de probabilité.

qui est définie et non-négative de
à
.
Image manquante
Densité_de_probabilité_variable_continue.png
Image:Densité de probabilité variable continue.png
On reconstruit la fonction de répartition par

qui tend vers 1 lorsque x tend vers l'infini.
Dans les raisonnements généraux il est souvent commode d'écrire ces formules sous forme différentielle :

Si on effectue un changement de variable selon la formule
, la nouvelle densité de probabilité se calcule par

Espérances mathématiques
Définition
L'espérance mathématique d'une variable aléatoire se définit comme les valeurs prises par cette variable pondérées par leurs probabilités. Dans le cas d'une variable discrète que l'on suppose prendre les valeurs entières, elle se définit simplement par
![E[X] = \sum_{k=-\infty}^\infty k\ P_X(k)](/img/math/bf602aabd8921346b211901134891a79.png)
Pour une variable continue, la formule différentielle donnée précédemment s'intègre en
![E[X] = \int_{-\infty}^{\infty} x\ p_X(x)\ dx](/img/math/2ad21c9877afe365c2022f43bce3c01b.png)
Généralisation
X étant une variable aléatoire, une fonction f supposée régulière définit une nouvelle variable aléatoire f(X) dont l'espérance s'écrit en remplaçant x par f(x) dans les formules précédentes.
En particulier, il est intéressant de considérer la fonction à valeurs complexes
dont l'espérance mathématique définit la transformée de Fourier inverse de la densité de probabilité :
![\phi_X(\theta) = E[e^{i \theta X}]\,](/img/math/ffde77b79e43b6d4112afe42232d93cd.png)
Si la densité de probabilité est une fonction suffisamment régulière, l'exponentielle se développe en série :
![\phi_X(\theta) = E[\sum_{k=0}^\infty {(i \theta X)^k \over {k !}}]](/img/math/ee45cfc8d2f1ecd57144ce3c163a04ef.png)
ou :
![\phi_X(\theta) = \sum_{k=0}^\infty {(i \theta)^k \over {k !}}E[X^k]](/img/math/0828cfc935473ace4e58832a852f6987.png)
Les
définissent les moments de la variable aléatoire. S'ils existent, on constate que celle-ci peut être caractérisée par sa fonction de répartition, sa densité de probabilité (ou sa fonction de probabilité), sa fonction caractéristique ou la suite de ses moments.
Moments centrés
Le moment d'ordre 1,
noté
représente la moyenne, valeur centrale.
En ce qui concerne les moments d'ordre supérieur il est généralement plus commode d'utiliser les moments centrés :
![E[(X-\overline X)^k]](/img/math/a9461040330e1bcabdafe11c4039b128.png)
Le plus utile est la variance, valeur de dispersion :
![\sigma_X^2 = E[(X-\overline X)^2] = E[X^2] - (E[X])^2 = \overline {X^2} -(\overline X)^2](/img/math/8d12e448c47fc04436a1447f5414830c.png)
Pour obtenir une grandeur homogène à la grandeur de base et à la moyenne, on considère l'écart-type σX.
Médiane
On appelle médiane d'une variable aléatoire X, un réel m tel que
Dans le cas d'une variable aléatoire discrète, cette définition est peu intéressante car elle permet l'existence de plusieurs médianes
- si X est le numéro apparaissant sur la face supérieure d'un dé à 6 faces parfaitement équilibré, pour tout réel m strictement compris entre 3 et 4, on a :
ou bien l'existence d'une médiane qui ne donne pas une probabilité de 0,5
- Si X est la somme obtenue en lançant deux dés à 6 faces parfaitement équilibré. X ne possède qu'une seule médiane 7 mais
Dans le cas d'une variable continue, dont la fonction de répartition est strictement croissante, la définition est équivalente à la suivante :
- m est la médiane de X ssi
Le fait que la fonction de répartition soit une fonction continue, strictement croissante, à valeurs dans [0 ; 1] assure l'existence et l'unicité de la médiane.
