Covariance
Définition
Soit $(X,Y)$ un couple de variables aléatoires discrètes définies sur un espace probabilisé $(\Omega,\mathcal{A},\mathbb{P})$ admettant chacune une espérance.
- On appelle covariance des deux variables aléatoires l'espérance, si elle existe, de la variable aléatoire $(X-\mathbb{E}(X))(Y-\mathbb{E}(Y))$. Notation :
$$\mathrm{Cov}(X,Y)=\mathbb{E}\big((X-\mathbb{E}(X))(Y-\mathbb{E}(Y))\big)$$ - Les deux variables aléatoires $X$ et $Y$ sont dites non corrélées si et seulement si la covariance du couple $(X,Y)$ existe et $\mathrm{Cov}(X,Y)=0$.
Exemple
Soit $(X,Y)$ un couple de variables aléatoires de Bernoulli. Montrer que :
$$\ds\mathrm{Cov}(X,Y)=\mathbb{P}([X=1]\cap[Y=1])-\mathbb{P}(X=1)\mathbb{P}(Y=1)$$
Théorème : Conditions d'existence de la covariance
- Formule de Koenig-Huygens. Soit $(X,Y)$ un couple de variables aléatoires discrètes définies sur un espace probabilisé $(\Omega,\mathcal{A},\mathbb{P})$ admettant chacune une espérance. Alors le couple aléatoire $(X,Y)$ admet une covariance si et seulement si la variable aléatoire XY admet une espérance et on a :
$$\ds\mathrm{Cov}(X,Y)=\mathbb{E}(XY)-\mathbb{E}(X)\mathbb{E}(Y)$$ - Si les variables aléatoires discrètes $X$ et $Y$ admettent une variance alors le couple aléatoire $(X,Y)$ admet une covariance
Théorème : Lien entre corrélation et indépendance
Si deux variables aléatoires sont indépendantes et admettent chacune une variance alors elles sont non corrélées (la réciproque est fausse).
Exemple classique et contre-exemple
- Deux variables aléatoires de Bernoulli sont indépendantes si et seulement si elles sont non corrélées.
- Si $X$ et $Y$ ont même variance alors $X+Y$ et $X-Y$ ne sont pas corrélées. Pour autant, si $X$ et $Y$ sont indépendantes et de même loi de Bernoulli $\mathcal{B}(1,p)$ alors $X+Y$ et $X-Y$ ne sont pas indépendantes.
Théorème : Propriétés de la covariance
Toutes les variables aléatoires considérées dans ce théorème sont supposées discrètes et admettent une variance.
- Symétrie.
$$\mathrm{Cov}(Y,X)=\mathrm{Cov}(X,Y)$$ - Bilinéarité. Pour toute famille $(\alpha_{1},\alpha_{2},\beta_{1},\beta_{2})$ de réels, le couple $\left(\alpha_{1}X_{1}+\alpha_{2}X_{2},\beta_{1}Y_{1}+\beta_{2}Y_{2}\right)$ admet une covariance et on a : $$\ds\mathrm{Cov}\left(\alpha_{1}X_{1}+\alpha_{2}X_{2},\beta_{1}Y_{1}+\beta_{2}Y_{2}\right)=\sum_{i=1}^{2}{\sum_{j=1}^{2}{\alpha_{i}\beta_{j}\mathrm{Cov}(X_{i},Y_{j})}}$$
- Positivité.
$$\ds\mathrm{Cov}(X,X)=\mathbb{V}(X)\geqslant0$$ - “Relation d'Al-Kashi”. La variable aléatoire X+Y admet une variance et :
$$\mathbb{V}(X+Y)=\mathbb{V}(X)+\mathbb{V}(Y)+2\mathrm{Cov}(X,Y)$$ Dans le cas où $X$ et $Y$ sont indépendantes (ou seulement non corrélées), on a :
$$\mathbb{V}(X+Y)=\mathbb{V}(X)+\mathbb{V}(Y)$$ - Inégalité de Cauchy-Schwarz. $$\ds\mathrm{Cov}(X,Y)^{2}\leqslant\mathbb{V}(X)\mathbb{V}(Y)$$ $$\ds|\mathrm{Cov}(X,Y)|\leqslant\sigma(X)\sigma(Y)$$ De plus, lorsque $\mathbb{V}(X)\ne0$, cette inégalité est une égalité si et seulement si : $$\ds\exists(a,b)\in\R^{2}\;/\;\mathbb{P}(Y=aX+b)=1$$ et plus précisément : $$\mathbb{P}\left(Y=\frac{\cov(X,Y)}{\V(X)}X+\frac{\E(Y)\V(X)-\E(X)\cov(X,Y)}{\V(X)}\right)=1$$ ou encore $$\pr(Y^*=\alpha X^*)=1$$où $\alpha\in\{-1,0,1\}$ selon que la covariance $\cov(X,Y)$ est strictement négative, nulle, strictement positive.
Remarque
Il n'y a pas de propriété de non dégénérescence puisque $\V(X)=0$ n'implique pas que $X=0 1\!\!1_{\Omega}$.
Définition
Lorsque $X$ et $Y$ admettent une variance non nulle, on appelle coefficient de corrélation de ces deux variables aléatoires le réel : $$\rho(X,Y)=\dfrac{\mathrm{Cov}(X,Y)}{\sigma(X)\sigma(Y)}$$
Remarque
D'après l'inégalité de Cauchy-Schwarz, on a : $\left|\rho(X,Y)\right|\leqslant1$.
Exemple
Une urne contient $r$ boules rouges, $v$ boules vertes et $b$ boules bleues. On tire $n$ boules dans l'urne ($n\leqslant r+v+b$). On note $R$ (resp. $V$, $B$) la variable aléatoire égale au nombre de boules rouges (resp. vertes, bleues) tirées.
- Les tirages sont supposés successifs et avec remise. Reconnaître les lois de $R$, $V$, $B$ puis calculer $\mathrm{Cov}(R,V)$.
- Les tirages sont simultanés. Déterminer les lois de $R$, $V$, $B$ puis calculer $\mathrm{Cov}(R,V)$.