Covariància

De Viquipèdia
Dreceres ràpides: navegació, cerca

Dins l'entorn de l'estadística la covariància és una mesura de dispersió conjunta de dues variables estadístiques.

Definició[modifica | modifica el codi]

La covariància  S (X, Y) de dues variables aleatòries  X i  Y (de vegades també expressada  Cov (X, Y) ) es defineix com:

 S_{XY}={\operatorname{Y}([X - \operatorname{Y}(X)] [Y - \operatorname{Y}(Y )])},

on  \operatorname{Y}(\cdot) és l'operador esperança. Per a distribucions discretes la fórmula anterior es concreta en:

 S_{xy}= \frac 1n \sum_{i = 1}^n{(x_i - \overline{x}) (y_i - \overline{y})}={1 \over n}\sum_{i, j}^n{x_{i.}y_{. j}n_{ij}}- \overline{x}\overline{y}

Quan les variables aleatòries  X i  Y són n-dimensionals, és a dir,  X = (X_1, \ldots, x_n)^t i  Y = (i_1, \ldots, Y_n)^t , la seva matriu de covariàncies  \sigma_{XY} és:

 \sigma_{XY}={\operatorname{Y}([X - \operatorname{Y}(X)] [Y - \operatorname{Y}(Y)]^t)}

on  \operatorname{Y}(\cdot) és l'operador esperança.

Propietats[modifica | modifica el codi]

Les propietats de la covariància són les següents:

  1. Si tots els valors de la variable x, els sumem una constant kya tots els valors de la variable i, els sumem una constant k ', la covariància no varia.
  2. Si tots els valors d'una variable x els multipliquem per una constant kya tots els valors de la variable i, els multipliquem per una constant k ', el seu covariància queda multiplicada pel producte de les constants.
  3. A partir de les anteriors: si tenim dos variable SX, i amb la covariància  s_{xi}, i transformacions lineals de les variables de la forma z = ax+b, it = ci+d, la nova covariància es relaciona amb l'anterior de la forma:  s_{ZT}= acS_{xi}.
  4.  Cov (x, y) = Cov (i, x)

Si X , Y , W , i V són variables aleatòries de valors reals i a , b , c , d són constants ("constant" en aquest context significa no aleatori), després les següents veritats són conseqüència de la definició de covariància:

 \operatorname{Cov}(X, a) = 0 \,
 \operatorname{Cov}(X, X) = \operatorname{Var}(X) \,
 \operatorname{Cov}(X, Y) = \operatorname{Cov}(Y, X) \,
 \operatorname{Cov}(AX, BY) = ab \, \operatorname{Cov}(X, Y) \,
 \operatorname{Cov}(X+a, Y+b) = \operatorname{Cov}(X, Y) \,
 \operatorname{Cov}(ax+by, CW+dV) = ac \, \operatorname{Cov}(X, W)+ad \, \operatorname{Cov}(X, V)+bc \, \operatorname{Cov}(Y, W)+bd \, \operatorname{Cov}(Y, V) \,

Càlcul incremental[modifica | modifica el codi]

La covariància es pot calcular de forma eficient incrementant els valors disponibles utilitzant una generalització de la fórmula per al càlcul de la variància:

 \operatorname{Cov}(X_i, X_j) = \operatorname{E}\left ((X_i-\operatorname{E}(X_i)) (X_j-\operatorname{E}(X_j)) \right) = \operatorname{E}(X_iX_j) - \operatorname{E}(X_i) \operatorname{E}(X_j)

No correlació i independència[modifica | modifica el codi]

Si X i Y són independents, llavors la seva covariància és zero. Això passa per la propietat d'independència,

 \operatorname{E}(X \cdot Y) = E (X) \cdot E (Y).

El contrari, però, generalment no és cert: Alguns parells de variables aleatòries tenen covariància zero tot i que no són independents. Sota algunes hipòtesis addicionals, la covariància de valor zero implica independència, com per exemple en el cas de la distribució normal multivariant.

Relació amb el producte interior[modifica | modifica el codi]

La majoria de les propietats de la covariància poden extreure dels seus similituds que comparteixen amb les del producte interior:

  1. Bilinealitat: per a les constants a i b , i les variables aleatòries X , Y , i U , Cov ( aX + BY , U ) = a Cov ( X , U )+ b Cov ( Y , U )
  2. Simètriques: Cov ( X , Y ) = Cov ( Y , X )
  3. Positiu definit: Var ( X ) = Cov ( X , X ) ≥ 0, i Cov ( X , X ) = 0 impliquen que X és una variable aleatòria constant ( K ).

Pot demostrar-se que la covariància és un producte interior sobre alguns subespais dels espais vectorials de variables aleatòries de moments finits.

Vegeu també[modifica | modifica el codi]