Error quadràtic mig

De Viquipèdia
Jump to navigation Jump to search

En estadística, l'error quadràtic mig (EQM), conegut també en anglès per Mean Squared Error (MSE), d'un estimador mesura la mitjana dels errors al quadrat, és a dir, la diferència entre l'estimador i el que s'estima. El EQM és una funció de risc, corresponent al valor esperat de la pèrdua de l'error al quadrat o pèrdua quadràtica. La diferència es produeix a causa de la aleatoriedad o perquè l'estimador no té en compte la informació que podria produir una estimació més precisa.[1]

El EQM és el segon moment estadístic de l'error, i per tant incorpora tant la variància de l'estimador així com el seu biaix. Per a un estimador insesgado, el EQM és la variància de l'estimador. Igual que la variància, el EQM té les mateixes unitats de mesura que el quadrat de la quantitat que s'estima. En una analogia amb la desviació estàndard, prenent l'arrel quadrada del EQM produeix l'error de l'arrel quadrada de la mitjana o la desviació de l'arrel quadrada mitjana (RMSE o RMSD), que té les mateixes unitats que la quantitat que s'estima; per a un estimador no esbiaixat, el RMSE és l'arrel quadrada de la variància, coneguda com a desviació estàndard.

Definició i propietats bàsiques[modifica]

Si és un vector de n prediccions i és el vector dels veritables valors, llavors el EQM del predictor és:

Aquesta és una quantitat coneguda, calculat donada una mostra particular (i per tant és depenent de la mostra).

El MSE d'un estimador pel que fa al paràmetre desconegut es defineix com


Aquesta definició depèn del paràmetre desconegut, i el MSE en aquest sentit és una propietat d'un estimador (d'un mètode d'obtenció d'una estimació).

El MSE és igual a la suma de la variància i el quadrat biaix de l'estimador o de les prediccions. En el cas de la MSE d'un estimador,[2]

Així doncs, el EQM avalua la qualitat d'un estimador o conjunt de prediccions quant a la seva variació i el grau de biaix.

Des de MSE és una expectativa, no és tècnicament una variable aleatòria, però va a estar subjecte a error d'estimació quan es calcula per a un estimador particular de amb valor veritable desconegut. Per tant, qualsevol estimació de la MSE sobre la base d'un paràmetre benvolgut és de fet una variable aleatòria.

Exemples[modifica]

Mitjana[modifica]

Suposem que tenim una mostra aleatòria de grandària n d'una població,. Suposem que les unitats de mostra es van triar amb el reemplaçament. És a dir, les n unitats se seleccionen un alhora, i les unitats prèviament seleccionades segueixen sent elegibles per ser seleccionats per a tot n empatis. L'estimador usual de la mitjana és la mitjana de la mostra

el qual té un valor esperat igual a la mitjana real μ (pel que és imparcial) i un error quadràtic mig de

on és la variància de la població.

Per a una distribució gaussiana est és el millor estimador no esbiaixat (és a dir, que té el EQM més baix entre tots els estimadors no esbiaxiats), però no, per exemple, per una distribució uniforme.

Referències[modifica]

  1. Lehmann, E. L.; Casella, George. Theory of Point Estimation. 2nd. New York: Springer, 1998. ISBN 0-387-98502-6. 
  2. Lehmann, E. L.; Casella, George. Theory of Point Estimation. 2nd. New York: Springer, 1998. ISBN 0-387-98502-6.