Teoria de l'aprenentatge estadístic

De la Viquipèdia, l'enciclopèdia lliure

La teoria de l'aprenentatge estadístic és un marc per a l'aprenentatge automàtic que es basa en els camps de l'estadística i l'anàlisi funcional.[1][2][3] La teoria de l'aprenentatge estadístic tracta el problema d'inferència estadística de trobar una funció predictiva basada en dades. La teoria de l'aprenentatge estadístic ha donat lloc a aplicacions reeixides en camps com la visió per ordinador, el reconeixement de la parla i la bioinformàtica.

Els objectius de l'aprenentatge són la comprensió i la predicció. L'aprenentatge es divideix en moltes categories, com ara l'aprenentatge supervisat, l'aprenentatge no supervisat, l'aprenentatge en línia i l'aprenentatge de reforç. Des de la perspectiva de la teoria de l'aprenentatge estadístic, l'aprenentatge supervisat s'entén millor.[4] L'aprenentatge supervisat implica l'aprenentatge d'un conjunt de dades d'entrenament. Cada punt de l'entrenament és un parell d'entrada-sortida, on l'entrada s'associa a una sortida. El problema d'aprenentatge consisteix a inferir la funció que mapeja entre l'entrada i la sortida, de manera que la funció apresa es pot utilitzar per predir la sortida a partir d'una entrada futura.[5]

Segons el tipus de sortida, els problemes d'aprenentatge supervisat són problemes de regressió o problemes de classificació. Si la sortida pren un rang continu de valors, és un problema de regressió. Utilitzant la llei d'Ohm com a exemple, es podria realitzar una regressió amb voltatge com a entrada i corrent com a sortida. La regressió trobaria la relació funcional entre voltatge i corrent , de tal manera que

Els problemes de classificació són aquells per als quals la sortida serà un element d'un conjunt discret d'etiquetes. La classificació és molt habitual per a aplicacions d'aprenentatge automàtic. En el reconeixement facial, per exemple, una imatge de la cara d'una persona seria l'entrada i l'etiqueta de sortida seria el nom d'aquesta persona. L'entrada estaria representada per un gran vector multidimensional els elements del qual representen píxels a la imatge.

Després d'aprendre una funció basada en les dades del conjunt d'entrenament, aquesta funció es valida en un conjunt de dades de prova, dades que no apareixien al conjunt d'entrenament.

Referències[modifica]

  1. Vladimir Vapnik (1995) The Nature of Statistical Learning Theory, Springer New York ISBN 978-1-475-72440-0.
  2. Trevor Hastie, Robert Tibshirani, Jerome Friedman (2009) The Elements of Statistical Learning, Springer-Verlag ISBN 978-0-387-84857-0.
  3. [enllaç sense format] https://www.sciencedirect.com/topics/computer-science/statistical-learning-theory
  4. Tomaso Poggio, Lorenzo Rosasco, et al. Statistical Learning Theory and Applications, 2012, Class 1
  5. Gimpel, Jon. «Statistical Learning Theory» (en anglès). https://towardsdatascience.com,+26-07-2022.+[Consulta: 2 abril 2023].