Outils pour utilisateurs

Outils du site


math:2:covariance

Covariance

Définition

Soit $(X,Y)$ un couple de variables aléatoires discrètes définies sur un espace probabilisé $(\Omega,\mathcal{A},\mathbb{P})$ admettant chacune une espérance.

  • On appelle covariance des deux variables aléatoires l'espérance, si elle existe, de la variable aléatoire $(X-\mathbb{E}(X))(Y-\mathbb{E}(Y))$. Notation :
    $$\mathrm{Cov}(X,Y)=\mathbb{E}\big((X-\mathbb{E}(X))(Y-\mathbb{E}(Y))\big)$$
  • Les deux variables aléatoires $X$ et $Y$ sont dites non corrélées si et seulement si la covariance du couple $(X,Y)$ existe et $\mathrm{Cov}(X,Y)=0$.

Exemple

Soit $(X,Y)$ un couple de variables aléatoires de Bernoulli. Montrer que :
$$\ds\mathrm{Cov}(X,Y)=\mathbb{P}([X=1]\cap[Y=1])-\mathbb{P}(X=1)\mathbb{P}(Y=1)$$

Théorème : Conditions d'existence de la covariance

  • Formule de Koenig-Huygens. Soit $(X,Y)$ un couple de variables aléatoires discrètes définies sur un espace probabilisé $(\Omega,\mathcal{A},\mathbb{P})$ admettant chacune une espérance. Alors le couple aléatoire $(X,Y)$ admet une covariance si et seulement si la variable aléatoire XY admet une espérance et on a :
    $$\ds\mathrm{Cov}(X,Y)=\mathbb{E}(XY)-\mathbb{E}(X)\mathbb{E}(Y)$$
  • Si les variables aléatoires discrètes $X$ et $Y$ admettent une variance alors le couple aléatoire $(X,Y)$ admet une covariance

Théorème : Lien entre corrélation et indépendance

Si deux variables aléatoires sont indépendantes et admettent chacune une variance alors elles sont non corrélées (la réciproque est fausse).

Exemple classique et contre-exemple

  1. Deux variables aléatoires de Bernoulli sont indépendantes si et seulement si elles sont non corrélées.
  2. Si $X$ et $Y$ ont même variance alors $X+Y$ et $X-Y$ ne sont pas corrélées. Pour autant, si $X$ et $Y$ sont indépendantes et de même loi de Bernoulli $\mathcal{B}(1,p)$ alors $X+Y$ et $X-Y$ ne sont pas indépendantes.

Théorème : Propriétés de la covariance

Toutes les variables aléatoires considérées dans ce théorème sont supposées discrètes et admettent une variance.

  • Symétrie.
    $$\mathrm{Cov}(Y,X)=\mathrm{Cov}(X,Y)$$
  • Bilinéarité. Pour toute famille $(\alpha_{1},\alpha_{2},\beta_{1},\beta_{2})$ de réels, le couple $\left(\alpha_{1}X_{1}+\alpha_{2}X_{2},\beta_{1}Y_{1}+\beta_{2}Y_{2}\right)$ admet une covariance et on a : $$\ds\mathrm{Cov}\left(\alpha_{1}X_{1}+\alpha_{2}X_{2},\beta_{1}Y_{1}+\beta_{2}Y_{2}\right)=\sum_{i=1}^{2}{\sum_{j=1}^{2}{\alpha_{i}\beta_{j}\mathrm{Cov}(X_{i},Y_{j})}}$$
  • Positivité.
    $$\ds\mathrm{Cov}(X,X)=\mathbb{V}(X)\geqslant0$$
  • Relation d'Al-Kashi”. La variable aléatoire X+Y admet une variance et :
    $$\mathbb{V}(X+Y)=\mathbb{V}(X)+\mathbb{V}(Y)+2\mathrm{Cov}(X,Y)$$ Dans le cas où $X$ et $Y$ sont indépendantes (ou seulement non corrélées), on a :
    $$\mathbb{V}(X+Y)=\mathbb{V}(X)+\mathbb{V}(Y)$$
  • Inégalité de Cauchy-Schwarz. $$\ds\mathrm{Cov}(X,Y)^{2}\leqslant\mathbb{V}(X)\mathbb{V}(Y)$$ $$\ds|\mathrm{Cov}(X,Y)|\leqslant\sigma(X)\sigma(Y)$$ De plus, lorsque $\mathbb{V}(X)\ne0$, cette inégalité est une égalité si et seulement si : $$\ds\exists(a,b)\in\R^{2}\;/\;\mathbb{P}(Y=aX+b)=1$$ et plus précisément : $$\mathbb{P}\left(Y=\frac{\cov(X,Y)}{\V(X)}X+\frac{\E(Y)\V(X)-\E(X)\cov(X,Y)}{\V(X)}\right)=1$$ ou encore $$\pr(Y^*=\alpha X^*)=1$$où $\alpha\in\{-1,0,1\}$ selon que la covariance $\cov(X,Y)$ est strictement négative, nulle, strictement positive.

Remarque

Il n'y a pas de propriété de non dégénérescence puisque $\V(X)=0$ n'implique pas que $X=0 1\!\!1_{\Omega}$.

Définition

Lorsque $X$ et $Y$ admettent une variance non nulle, on appelle coefficient de corrélation de ces deux variables aléatoires le réel : $$\rho(X,Y)=\dfrac{\mathrm{Cov}(X,Y)}{\sigma(X)\sigma(Y)}$$

Remarque

D'après l'inégalité de Cauchy-Schwarz, on a : $\left|\rho(X,Y)\right|\leqslant1$.

Exemple

Une urne contient $r$ boules rouges, $v$ boules vertes et $b$ boules bleues. On tire $n$ boules dans l'urne ($n\leqslant r+v+b$). On note $R$ (resp. $V$, $B$) la variable aléatoire égale au nombre de boules rouges (resp. vertes, bleues) tirées.

  1. Les tirages sont supposés successifs et avec remise. Reconnaître les lois de $R$, $V$, $B$ puis calculer $\mathrm{Cov}(R,V)$.
  2. Les tirages sont simultanés. Déterminer les lois de $R$, $V$, $B$ puis calculer $\mathrm{Cov}(R,V)$.
math/2/covariance.txt · Dernière modification : 2020/10/10 22:40 de Alain Guichet