Généralités sur les variables à densité
Première situation : Soit la courbe d'une fonction $F$ :
function y=F(x) if x<-0.5 y=0.25*exp(x+0.5) elseif x<0.5 y=0.25 elseif x<2.5 y=0.25+sqrt(0.25-0.0625*(x-2.5).^2) else y=1-0.25*exp(2.5-x) end endfunction // paramètres du graphique a=get("current_axes") a.x_location="origin" a.y_location="origin" a.box="off" a.data_bounds=[-2,-0;5,1] // la fonction de répartition x=[-2:0.01:5] ; y=feval(x,F) ; plot2d(x,y,5) // asymptote plot2d([0,5],[1,1],2) // tangentes plot2d([-0.5,-1],[0.25,0.25-0.5/4],3) plot2d([0.5,0.5],[0.25,0.45],3) plot2d([2.5,2.0],[0.75,0.75],3) plot2d([2.5,3],[0.75,0.75+0.5/4],3)
- Justifier que la fonction $F$ présente les caractéristiques d'une fonction de répartition.
- Justifier que $F$ est de classe $\mathcal{C}^{1}$ sur $\R$ sauf en quelques points que l'on précisera.
- Représenter alors l'allure de la fonction $f=F'$.
- Soit $X$ une variable aléatoire admettant $F$ pour fonction de répartition. Soit $(a,b)$ un couple de réels tels que $a<b$. Exprimer $\mathbb{P}(a<X\leqslant b)$ en fonction de $F$ puis de $f$ et représenter cette probabilité sur chacun des deux graphiques.
Seconde situation : Soit $f\colon\R\to\R$ une fonction positive sur $\R$, continue sur $\R$ sauf éventuellement en un nombre fini de réels $a_{1}<\dots<a_{n}$ et telle que $\ds\int_{-\infty}^{+\infty}{f(t)\mathrm{d} t}$ converge et vaut 1. Soit $\ds F\colon\R\to\R,\; x\mapsto\int_{-\infty}^{x}{f(t)\mathrm{d} t}$.
function y=f(x) if x<-1 y=0 elseif x<=0 y=3/8*sqrt(1+x) elseif x<=1 y=1/8/sqrt(x) elseif x<2 y=1/4 else y=(x-2)^2*exp(2-x)/8 end endfunction x=[-5,-1] ; y=feval(x,f) ; plot2d(x,y,5) x=[-1:0.01:0] ; y=feval(x,f) ; plot2d(x,y,5) x=[0.01:0.01:1] ; y=feval(x,f) ; plot2d(x,y,5) x=[1.01,1.99] ; y=feval(x,f) ; plot2d(x,y,5) x=[2:0.01:10] ; y=feval(x,f) ; plot2d(x,y,5) plot2d([0;1],[0.125,0.25;0.125,0.25]) plot2d([1,1],[0,0.25]) ; plot2d([2,2],[0,0.25])
- Justifier que $F$ est de classe $\mathcal{C}^1$ sur les intervalles $\left]-\infty,a_{1}\right[$, $\left]a_{1},a_{2}\right[$, …,$\left]a_{n-1},a_{n}\right[,\left]a_{n},+\infty\right[$.
- Justifier que $F$ est la fonction de répartition d'une variable aléatoire $X$.
- Soit $x\in\R$. En utilisant la famille d'événements $\ds\left(\left[x-\frac{1}{n}<X\leqslant x\right]\right)_{n\in\N^{*}}$, calculer $\mathbb{P}(X=x)$.
- Soit $x<y$ deux réels. Exprimer $\mathbb{P}(x\leqslant X\leqslant y)$ à l'aide d'une intégrale. Interpréter graphiquement.
Définition
On dit que $X$ est une variable aléatoire à densité si et seulement si sa fonction de répartition $F_{X}$ est continue sur $\R$ et de classe $\mathcal{C}^{1}$ sur $\R$ sauf éventuellement en un nombre fini de points. De plus, toute fonction $f\colon\R\to\R$ positive sur $\R$ et telle que $f(x)=F_{X}'(x)$ pour tout réel $x$ sauf éventuellement en un nombre fini de points est appelée densité de probabilité de la variable aléatoire $X$.
Exemples
- Soit $\ds f\colon t\mapsto\begin{cases} \ds\frac{1}{2}\mathrm{e}^{t} & \text{si}\; t\leqslant0\\ \ds\frac{1}{2}t\mathrm{e}^{-t} & \text{si}\; t>0 \end{cases}$ et $g\colon t\mapsto\begin{cases} \ds\frac{1}{2}\mathrm{e}^{t} & \text{si}\; t<0\\ \ds\frac{1}{2}t\mathrm{e}^{-t} & \text{si}\; t\geqslant0 \end{cases}$.
- Montrer que $f$ et $g$ sont des fonctions de densité. Représenter $C_{f}$ et $C_{g}$.
- Montrer qu'elles correspondent à la même fonction de répartition $F$ que l'on déterminera puis représentera.
- Soit $\lambda\in\R$ et $\ds f\colon t\mapsto\frac{\lambda}{1+t^{2}}$.
- Déterminer la valeur de $\lambda$ pour que $f$ satisfasse aux conditions de la seconde situation. Représenter $C_{f}$.
- Déterminer l'expression de $F(x)$ pour tout réel $x$. Représenter $C_{F}$.
- Soit $X$ une variable aléatoire de fonction de répartition $F$. Calculer et interpréter graphiquement les probabilités :
$$\ds\mathbb{P}(X\leqslant-1)\quad\mathbb{P}(X=-1)\quad\mathbb{P}(-1\leqslant X\leqslant1)\quad\mathbb{P}X\geqslant1)$$
- Vérifier que les fonctions $f$ qui précèdent sont des densités de probabilité.
On peut changer la valeur de $f$ en un ou plusieurs points (avec une valeur positive) tout en conservant la même fonction de répartition. - Vérifier que la fonction $F\colon x\mapsto\left\{ \begin{array}{ll} 0 & \text{si}\; x< -1\\ \ds\frac{(1+x)^{2}}{2} & \text{si}\;-1\leqslant x<0\\ \ds 1-\frac{(1-x)^{2}}{2} & \text{si}\;0\leqslant x\leqslant1\\ 1 & \text{si}\; x>1 \end{array}\right.$ est la fonction de répartition d'une variable aléatoire à densité $X$ et en préciser une densité $f$. Représenter ces deux fonctions.
- Soit $p\in\left]0,\frac{1}{2}\right[$. Soit $F\colon x\mapsto\left\{ \begin{array}{ll} p\mathrm{e}^{x} & \text{si}\; x<0\\ 1-p\mathrm{e}^{-x} & \text{si}\; x\geqslant0 \end{array}\right.$.
- Justifier que $F$ est la fonction de répartition d'une variable aléatoire $X$.
- Cette variable aléatoire $X$ est-elle à densité ? est-elle discrète ?
Remarques
Soit $X$ une variable aléatoire à densité.
- Il n'y a pas unicité d'une fonction densité.
- $F_{X}$ peut ne pas être dérivable en un nombre fini de points.
- $F_{X}$ peut être dérivable sur $\R$ mais $F_{X}'$ peut ne pas être continue en un nombre fini de points.
- $F_{X}$ peut être de classe $\mathcal{C}^{1}$ sur $\R$.
- Déterminer la loi d'une variable aléatoire à densité consiste à déterminer sa fonction de répartition.
Théorème
Soit $X$ une variable aléatoire à densité dont on note $f$ une densité et $F_X$ sa répartition.
- On a : $\ds\forall x\in\R,\;\mathbb{P}(X=x)=0$.
Ainsi :
$$\ds\forall x\in\R,\;\mathbb{P}(X<x)=\mathbb{P}(X\leqslant x),\;\mathbb{P}(X>x)=\mathbb{P}(X\geqslant x)$$ - On a : $\ds\forall x\in\R,\;F_{X}(x)=\mathbb{P}(X\leqslant x)=\int_{-\infty}^{x}{f(t)\mathrm{d} t}$.
En conséquences :- $\ds\int_{-\infty}^{+\infty}{f(t)\mathrm{d} t}=1$
- $\ds\forall x\in\R,\;\mathbb{P}(X\geqslant x)=\int_{x}^{+\infty}{f(t)\mathrm{d} t}$
- $\ds\forall(x,y)\in\R^{2},\; x\leqslant y\;\implies\;\mathbb{P}(x\leqslant X\leqslant y)=\int_{x}^{y}{f(t)\mathrm{d} t}=F_{X}(y)-F_{X}(x)$
- $X(\Omega)\subset\left]a,b\right[$ si et seulement si on a presque sûrement : $\ds\forall x\in\R\setminus\left]a,b\right[,\; f(x)=0$
Théorème
Soit $f\colon\R\to\R$. Alors, $f$ est une densité d'une variable aléatoire si et seulement si :
- $f$ est positive sur $\R$,
- $f$ est continue sur $\R$ sauf éventuellement en un nombre fini de réels,
- $\ds\int_{-\infty}^{+\infty}{f(t)\mathrm{d} t}$ converge et vaut 1.
Exemple
Soit $\lambda$ un réel. Pour tout réel $x$, on pose :
$$f(x)=\left\{ \begin{array}{ll} 0 & \text{si}\; x\leqslant0\\ \ds\frac{\lambda}{\sqrt{x}} & \text{si}\;0<x<1\\ \ds\frac{\lambda}{x^{2}\sqrt{x}} & \text{si}\; x\geqslant1 \end{array}\right.$$
- Déterminer la valeur du réel $\lambda$ pour que $f$ soit une densité d'une variable aléatoire $X$. Représenter la courbe de $f$.
- Déterminer l'expression de $F_{X}(x)$ pour tout réel $x$. Représenter la courbe de $F_{X}$.
- Calculer les probabilités suivantes : $\ds\mathbb{P}\left(\frac{1}{2}\leqslant X\leqslant2\right)$ et $\ds\mathbb{P}\left(X\geqslant\frac{2}{3}\right)$.
- Déterminer le réel $m$ tel que $\ds\mathbb{P}(X\leqslant m)=\frac{1}{2}$.
Quel nom pourrait-on donner à ce réel ?