Anàlisi de la variància

De Viquipèdia
Dreceres ràpides: navegació, cerca

En estadística, l' anàlisi de la variància o anàlisi de variància ( ANOVA , segons terminologia anglesa) és un conjunt de models estadístics i els seus procediments associats, en el qual la variància aquesta partició en certs components deguts a diferents variables explicatives. Les tècniques inicials de l'anàlisi de variància van ser desenvolupades pel estadístic i genetista R. A. Fisher en els anys 1920 i 1930 i és algunes vegades conegut com a Anova de Fisher o anàlisi de variància de Fisher , a causa de l'ús de la distribució F de Fisher com a part del contrast d'hipòtesis.

L'anàlisi de variància serveix per comparar si els valors d'un conjunt de dades numèriques són significativament diferents dels valors d'un altre o més conjunts de dades. El procediment per comparar aquests valors es basa en la variància global observada en els grups de dades numèriques a comparar. Típicament, l'anàlisi de variància s'utilitza per associar una probabilitat a la conclusió que la mitjana d'un grup de puntuacions és diferent de la mitjana d'un altre grup de puntuacions.

Descripció general[modifica | modifica el codi]

Hi ha tres classes conceptuals d'aquests models:

  1. El Model d'efectes fixos assumeix que les dades provenen de poblacions normals les quals podrien diferir únicament en les seves mitjanes. (Model 1)
  2. El Model d'efectes aleatoris assumeix que les dades descriuen una jerarquia de diferents poblacions les diferències queden restringides per la jerarquia. Exemple: L'experimentador ha après i ha considerat en l'experiment només tres de molts més mètodes possibles, el mètode d'ensenyament és un factor aleatori en l'experiment. (Model 2)
  3. El Model d'efectes mixtes descriuen situacions que aquest pot prendre. Exemple: Si el mètode d'ensenyament és analitzat com un factor que pot influir on estan presents els dos tipus de factors: fixos i aleatoris. (Model 3)

Supòsits previs[modifica | modifica el codi]

L'ANOVA parteix d'alguns supòsits que s'han de complir:

  • La variable dependent s'ha de mesurar com a mínim a nivell d'interval.
  • Independència de les observacions.
  • La distribució dels residuals ha de ser normal.
  • Homoscedasticidad: homogeneïtat de les variàncies.

La tècnica fonamental consisteix en la separació de la suma de quadrats (SS, 'sum of squares') en components relatius als factors previstos en el model. Com a exemple, mostrem el model per a un ANOVA simplificat amb un tipus de factors en diferents nivells. Si els nivells són quantitatius i els efectes són lineals, pot resultar apropiat una anàlisi de regressió lineal.

 SS_{\hbox{Total}}= SS_{\hbox{Error}}+SS_{\hbox{Factors}}

El nombre de graus de llibertat (gl) pot separar-se de forma similar i es correspon amb la forma en què la distribució khi quadrat descriu la suma de quadrats associada.

 Gl_{\hbox{Total}}= gl_{\hbox{Error}}+gl_{\hbox{Factors}}

Model d'efectes fixos[modifica | modifica el codi]

El model de efectes fixos d'anàlisi de la variància s'aplica a situacions en què l'experimentador ha sotmès al grup o material analitzat a diversos factors, cadascun dels quals l'afecta només a la mitjana, romanent la "variable resposta" amb una distribució normal.

Model d'efectes aleatoris[modifica | modifica el codi]

Els models de efectes aleatoris s'usen per descriure situacions en què ocorren diferències incomparables en el material o grup experimental. L'exemple més simple és el d'estimar la mitjana desconeguda d'una població composta d'individus diferents i en el que aquestes diferències es barregen amb els errors de l'instrument de mesura.

Graus de llibertat[modifica | modifica el codi]

Per graus de llibertat "degrees of freedom" entenem el nombre efectiu d'observacions que contribueixen a la suma de quadrats en un ANOVA, és a dir, el nombre total d'observacions menys el nombre de dades que siguin combinació lineal d'altres.

Proves de significació[modifica | modifica el codi]

L'anàlisi de variància porta a la realització de proves de significació estadística, utilitzant l'anomenada distribució F de Snedecor.

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Anàlisi de la variància Modifica l'enllaç a Wikidata