Anàlisi de la covariància

De Viquipèdia
Dreceres ràpides: navegació, cerca

L' anàlisi de la covariància o ANCOVA , acrònim de l'anglès an alysis of cova riance , és un model lineal general amb una variable quantitativa i un o més factors. El ANCOVA és una fusió del ANOVA i de la regressió lineal múltiple. És un procediment estadístic que permet eliminar l'heterogeneïtat causada en la variable d'interès (variable dependent) per la influència d'una o més variables quantitatives (covariables). Bàsicament, el fonament del ANCOVA és un ANOVA a qui a la variable dependent se li ha eliminat l'efecte predit per una o més covariables per regressió lineal múltiple. La inclusió de covariables pot augmentar la potència estadística perquè sovint redueix la variabilitat.

Equacions[modifica | modifica el codi]

ANCOVA d'un factor[modifica | modifica el codi]

L'anàlisi d'un factor és apropiat quan es disposa de tres o més grups; k grups. El factor (variable categòrica) té k nivells. En els dissenys equilibrats, cada grup té el mateix nombre de dades (individus), els quals idealment han estat assignats a l'atzar a cada grup a partir d'una mostra original preferiblement homogènia.

Calculant la suma de les desviacions al quadrat per a la variable independent X i la variable dependent Y [modifica | modifica el codi]

La suma de les desviacions al quadrat (SS):  SST_y ,  SSTr_y , i  SSE_y ha de ser calculada usant les següents equacions per a la variable dependent, Y . La SS per la covariància també ha de ser calculada, els dos valors necessaris són  SST_x i  SSE_x .

La suma de quadrats total defineix una la variabilitat del total d'individus  n_T :

 SST_y = \sum_{i = 1}^n \sum_{j = 1}^kY_{ij}^2 - \frac{ \left (\sum_{i = 1}^n \sum_{j = 1}^kY_{ij}\right)^2}{n_T}

La suma de quadrats per als tractaments defineix la variabilitat entre les poblacions o grups.  n_k representa el nombre de grups.

 SSTr_y = \sum_{i = 1}^n \left (\frac{\sum_{j = 1}^kY_{ij}^2}{n_k}\right) - \frac{ \left (\sum_{i = 1}^n \sum_{j = 1}^kY_{ij}\right)^2}{n_T}

La suma de quadrats de l'error defineix la variabilitat residual dins de cada grup.  n_n representa el nombre d'individus en un grup donat:

 SSE_y = \sum_{i = 1}^n \sum_{j = 1}^kY_{ij}^2 - \sum_{i = 1}^n \left (\frac{\sum_{j = 1}^kY_{ij}^2}{n_k}\right)

La suma de quadrats total és igual a la suma de quadrats dels tractaments i la suma de quadrats de l'error (propietat de additivitat de les sumes de quadrats i dels graus de llibertat, característica de l'ANOVA).

 SST_y = SSTr_y+SSE_y. \,

Càlcul de la covariància de X i Y [modifica | modifica el codi]

La suma de les covariàncies defineix la covariància de X i Y .

 SCT = \sum_{i = 1}^n \sum_{j = 1}^kX_{ij}Y_{ij}- \frac{ \left (\sum_{i = 1}^n \sum_{j = 1}^kX_{ij}\right) \left (\sum_{i = 1}^n \sum_{j = 1}^kY_{ij}\right)}{n_T}
 SCE = \sum_{j = 1}^k \left (\sum_{i = 1}^nX_{ij}Y_{ij}- \frac{\sum_{i = 1}^n (x_{ij}Y_{ij})}{n_n}\right)

Ajust de SST i [modifica | modifica el codi]

La correlació entre X i Y és  r_T^2 .

 R_T^2 = \frac{SCT^2}{SST_xSST_y}
 R_n^2 = \frac{SCE^2}{SSE_xSSE_y}

La proporció de covariància és sostreta de la dependent, valors de  SS_y :

 SST_{yadj}= SST_y-r_T^2 \,
 SSE_{yadj}= SSE_y-r_n^2 \,
 SSTr_{yadj}= SST_{yadj}-SSE_{yadj}\,

Ajust de les mitjanes de cada grup k [modifica | modifica el codi]

La mitjana de cada grup és ajustada de la manera següent:

 M_{y_iadj}= m_{y_i}- \frac{SCE_y}{SCE_x}(m_{x_i}-m_{x_T})

Anàlisi usant els valors de la suma de quadrats[modifica | modifica el codi]

Finalment obtenim la variància dels tractaments lliure de la covariància, on  df_{Tr} (graus de llibertat) és igual a  N_T-k-1 . Pot apreciar que cada covariable elimina un grau de llibertat.

 MSTr = \frac{SSTr}{df_{Tr}}
 MSE = \frac{SSE}{df_E}

E estadístic F és:

 F_{df_E, df_ \mathrm{Tr}}= \frac{\mathrm{MSTr}}{\mathrm{MSE}}.

Enllaços externs (anglès)[modifica | modifica el codi]