Variables aléatoires discrètes
Définition
Soit $(\Omega,\mathcal{A})$ un espace probabilisable.
- On appelle variable aléatoire réelle sur cet espace probabilisable, tout application $X$ définie sur $\Omega$ à valeurs dans $\R$ telle que, pour tout réel $x$, l'ensemble $\left\{ \omega\in\Omega\mid X(\omega)\leqslant x\right\}$ est un élément de la tribu $\mathcal{A}$ que l'on note $\left[X\leqslant x\right]$ (mêmes notations avec $=,\geqslant,<,>$).
- Une variable aléatoire $X$ est dite discrète lorsque son univers-image $X(\Omega)$, encore appelé support (c'est l'ensemble des valeurs possibles prises par la variable $X$), est discret, c'est à dire qu'il est ou bien fini :
$$X(\Omega)=\left\{ x_{1},\dots,x_{n}\right\}$$ou bien infini dénombrable et discret, donc de l'une des trois formes :
$$\ds X(\Omega)=\left\{ x_{n}\mid n\in\N,\; x_{0}<x_{1}<\dots,\;\lim_{n\to+\infty}{x_{n}}=+\infty\right\}$$ $$\ds X(\Omega)=\left\{ x_{n}\mid n\in\N,\; x_{0}>x_{1}>\dots,\;\lim_{n\to+\infty}{x_{n}}=-\infty\right\}$$ $$\ds X(\Omega)=\left\{ x_{n}\mid n\in\Z,\;\dots<x_{-1}<x_{0}<x_{1}<\dots,\;\lim_{n\to-\infty}{x_{n}}=-\infty,\;\lim_{n\to+\infty}{x_{n}}=+\infty\right\}$$
Remarques
- La variable aléatoire qui prend l'unique valeur $a\in\R$ est l'application $a1\!\!1_{\Omega}$.
- Si $A$ est un événement alors la fonction indicatrice de $A$ (l'application $1\!\!1_{A}$) est la variable aléatoire qui prend la valeur 1 sur les éventualités de $A$ et 0 sinon.
- On s'autorisera à écrire $\mathbb{P}(X=x)$ à la place de $\mathbb{P}([X=x])$ pour désigner la probabilité de l'événement $[X=x]$. Par contre, la probabilité de l'événement $[X=x]\cap[Y=y]$ s'écrira encore $\mathbb{P}([X=x]\cap[Y=y])$ sinon il y a difficulté d'interprétation des notations (on trouve aussi $\mathbb{P}(X=x,Y=y)$ comme notation).
- Pour une variable aléatoire discrète infinie, on écrira toujours les définitions et théorème avec un support de la première forme ci-dessus.
Théorème
Soit $(\Omega,\mathcal{A})$ un espace probabilisable. Soit $X$ une variable aléatoire discrète.
- La famille $([X=x])_{x\in X(\Omega)}$ est un système complet d'événements.
- L'ensemble $\mathcal{A}_{X}=\{[X\in A]\,\mid\, A\subset X(\Omega)\}$ est une tribu appelée tribu associée à $X$.
Définition
Soit $(\Omega,\mathcal{A},\mathbb{P})$ un espace probabilisé et $X$ une variable aléatoire discrète.
- On appelle loi de probabilité (ou loi) de la variable aléatoire $X$ l'ensemble des couples :
$$\ds\left\{ \left(x,\mathbb{P}(X=x)\right)\;\mid\; x\in X(\Omega)\right\}$$ - Soit $A$ un événement de probabilité non nulle. On appelle loi conditionnelle de la variable aléatoire $X$ la loi de $X$ pour la probabilité $\mathbb{P}_{A}$, c'est à dire :
$$\ds\left\{ \left(x,\mathbb{P}_{A}(X=x)\right)\;\mid\; x\in X(\Omega)\right\}$$
Théorème : Caractérisation d'une loi de probabilité
Soit $(\Omega,\mathcal{A},\mathbb{P})$ un espace probabilisé.
- Soit $X$ une variable aléatoire discrète infinie.
- Alors, la série $\ds\sum_{n\geqslant0}{\mathbb{P}(X=x_{n})}$ converge (absolument) et sa somme vaut 1.
- De plus, on peut « éliminer » du système complet $([X=x_{n}])_{n\geqslant0}$ les événements négligeables et donc éliminer de $X(\Omega)$ les $x_{n}$ correspondants.
- La famille d'événements qui reste est alors un système presque complet et on considère que « l'application », notée encore $X$, ainsi obtenue est encore une variable aléatoire.
- Soit $(y_{n})_{n\geqslant0}$ une suite de réels deux à deux distincts et de limite $+\infty$. Soit $(p_{n})_{n\geqslant0}$ une suite de réels positifs (ou nuls) telle que la série $\ds\sum_{n\geqslant0}{p_{n}}$ converge (absolument) et sa somme vaut 1. Alors, il existe une variable aléatoire discrète $Y$ telle que :
$$\ds\forall n\in\N,\;\mathbb{P}(Y=y_{n})=p_{n}$$
Exemples
- Montrer que les réels $\ds p_{n}=\frac{1}{n(n+1)}$ pour tout $n\in\N^{*}$ sont les probabilités associées à une variable aléatoire discrète.
- On lance une infinité de fois une pièce pour laquelle pile a pour probabilité d'apparition le réel $p\in\left]0,1\right[$. On pose: $q=1-p$. On note $Z$ le rang du lancer pour lequel on obtient pour la première fois deux pile consécutifs et on considère que $Z$ prend la valeur 0 si l'on n'obtient jamais deux pile consécutifs.
- Préciser $Z(\Omega)$.
- Montrer que, pour tout $n\geqslant2$, on a: $\mathbb{P}(Z=n+2)=q\mathbb{P}(Z=n+1)+pq\mathbb{P}(Z=n)$.
- En déduire l'expression de $\mathbb{P}(Z=n)$ pour tout $n\geqslant2$ puis calculer $\ds\sum_{n=2}^{+\infty}{\mathbb{P}(Z=n)}$.
- Vérifier que $Z$ est bien une variable aléatoire discrète et préciser la probabilité d'obtenir deux pile consécutifs.
Définition
Soit $(\Omega,\mathcal{A},\mathbb{P})$ un espace probabilisé. On appelle fonction de répartition d'une variable aléatoire réelle $X$ la fonction $F_{X}$ définie sur $\R$ par: $\forall x\in\R,\;F_{X}(x)=\mathbb{P}(X\leqslant x)$.
Théorème : Caractérisation de la fonction de répartition
Soit $(\Omega,\mathcal{A},\mathbb{P})$ un espace probabilisé. Une application $F\colon\R\to\R$ est la fonction de répartition d'une variable aléatoire discrète $X$ si et seulement si :
- $F$ est croissante sur $\R$,
- $F$ est continue sur $\R$ sauf en un nombre fini ou dénombrable discret de points $x_{i}$ en lesquels on a seulement la continuité à droite :
$$\ds\forall i,\;\lim_{x\to x_{i}^{-}}{F(x)}<F(x_{i})=\lim_{x\to x_{i}^{+}}{F(x)}$$ - $\ds\lim_{x\to-\infty}{F(x)}=0$ et $\ds\lim_{x\to+\infty}{F(x)}=1$.
Dans ce cas, la loi de $X$ est alors donnée par $X(\Omega)=\{x_{1},\dots,x_{n}\}$ ou $X(\Omega)=\{x_{0},x_{1},\dots,x_{n},\dots\}$ et :
$$\ds\forall x\in X(\Omega),\;\mathbb{P}(X=x)=F(x)-\lim_{t\to x^{-}}{F(t)}$$et on a aussi :
$$\ds\forall x\in\R,\; F(x)=\sum_{\substack{z\in X(\Omega)\\
z\leqslant x
}
}{\mathbb{P}(X=z)}$$
Remarques
- On utilise systématiquement la fonction de répartition (resp. « anti-répartition ») lorsqu'on détermine la loi d'un maximum (resp. minimum).
- Si $X(\Omega)=\{x_{1},\dots,x_{n}\}$ avec $x_{1}<\dots<x_{n}$, si $p_{k}=\mathbb{P}(X=x_{k})$ et si $q_{k}=p_{1}+\dots+p_{k}$ alors :
$$\ds F_{X}=q_{1}1\!\!1_{[x_{1},x_{2}[}+q_{2}1\!\!1_{[x_{2},x_{3}[}+\dots+q_{n-1}1\!\!1_{[x_{n-1},x_{n}[}+q_{n}1\!\!1_{[x_{n},+\infty[}$$égalité qui est à la base d'une technique utilisée pour simuler informatiquement une variable aléatoire discrète pour laquelle on ne dispose pas de modèle expérimental.
Théorème : Théorème de transfert (1ère partie)
Soit $X$ une variable aléatoire discrète et $f\colon I\to\R$ où $I$ est un intervalle de $\R$ contenant $X(\Omega)$. On pose $Y=f\circ X$ (noté aussi $f(X)$). Alors, la loi de $Y$ est donnée par : $Y(\Omega)=f(X(\Omega))$ (avec éventuellement des répétitions) et :
$$\ds\forall y\in Y(\Omega),\;\mathbb{P}(Y=y)=\sum_{x\in I\,/\, f(x)=y}{\mathbb{P}(X=x)}$$