Regressió del nucli

De la Viquipèdia, l'enciclopèdia lliure
Regressió del nucli gaussià

En estadística, la regressió del nucli és una tècnica no paramètrica per estimar l'expectativa condicional d'una variable aleatòria. L'objectiu és trobar una relació no lineal entre un parell de variables aleatòries X i Y.

En qualsevol regressió no paramètrica, l'expectativa condicional d'una variable relatiu a una variable es pot escriure:

on és una funció desconeguda.

Regressió del nucli de Nadaraya-Watson[modifica]

Nadaraya i Watson, tots dos en 1964, van proposar estimar com a mitjana ponderada localment, utilitzant un nucli com a funció de ponderació.[1][2][3] L'estimador de Nadaraya-Watson és:


on és un nucli amb una amplada de banda de tal manera que és d'ordre almenys 1, és a dir .

Exemple[modifica]

Aquest exemple es basa en dades de salaris transversals canadencs que consisteixen en una mostra aleatòria presa de les cintes d'ús públic del cens canadenc de 1971 per a individus masculins amb educació comuna (grau 13). Hi ha 205 observacions en total.

La figura de la dreta mostra la funció de regressió estimada utilitzant un nucli gaussià de segon ordre juntament amb límits de variabilitat asimptòtica.

Implementació estadística[modifica]

Referències[modifica]

  1. Nadaraya, E. A. Theory of Probability and Its Applications, 9, 1, 1964, pàg. 141–2. DOI: 10.1137/1109020.
  2. Watson, G. S. Sankhyā: The Indian Journal of Statistics, Series A, 26, 4, 1964, pàg. 359–372. JSTOR: 25049340.
  3. Bierens, Herman J. «The Nadaraya–Watson kernel regression function estimator». A: Topics in Advanced Econometrics (en anglès). New York: Cambridge University Press, 1994, p. 212–247. ISBN 0-521-41900-X. 
  4. Horová, I. Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing (en anglès). Singapore: World Scientific Publishing, 2012. ISBN 978-981-4405-48-5. 
  5. Kloke, John. Nonparametric Statistical Methods Using R (en anglès). CRC Press, 2014, p. 98–106. ISBN 978-1-4398-7343-4.