Aprenentatge mandrós

De la Viquipèdia, l'enciclopèdia lliure

En l'aprenentatge automàtic, l'aprenentatge mandrós és un mètode d'aprenentatge en què la generalització de les dades d'entrenament es retarda, en teoria, fins que es fa una consulta al sistema, a diferència de l'aprenentatge amb ganes, on el sistema intenta generalitzar les dades d'entrenament abans de rebre consultes.[1]

La principal motivació per emprar l'aprenentatge gandul, com en l'algoritme K-nearest neighbors, utilitzat pels sistemes de recomanació en línia ("persones que van veure/comprar/escoltar aquesta pel·lícula/element/melodia també...") és que el conjunt de dades és s'actualitza contínuament amb noves entrades (per exemple, nous articles a la venda a Amazon, noves pel·lícules per veure a Netflix, nous clips a YouTube, nova música a Spotify o Pandora). A causa de l'actualització contínua, les "dades de formació" quedarien obsoletes en un temps relativament curt, especialment en àrees com ara llibres i pel·lícules, on es publiquen/estrenen contínuament nous best-sellers o pel·lícules/música d'èxit. Per tant, no es pot parlar realment d'una "fase de formació".

Els classificadors mandrosos són més útils per a conjunts de dades grans i que canvien contínuament amb pocs atributs que es consulten habitualment. Concretament, fins i tot si existeix un gran conjunt d'atributs (per exemple, els llibres tenen un any de publicació, autor/s, editor, títol, edició, ISBN, preu de venda, etc.), les consultes de recomanació es basen en molts menys atributs, com ara la compra. o visualització de dades de co-ocurrència i puntuacions dels usuaris dels articles comprats/visualitzats.

El principal avantatge obtingut en l'ús d'un mètode d'aprenentatge mandros és que la funció objectiu s'aproximarà localment, com en l'algorisme de k-veïn més proper. Com que la funció objectiu s'aproxima localment per a cada consulta al sistema, els sistemes d'aprenentatge mandrosos poden resoldre simultàniament diversos problemes i tractar amb èxit els canvis en el domini del problema. Al mateix temps, poden reutilitzar molts resultats teòrics i aplicats del modelatge de regressió lineal (sobretot PRESS statistic) i control.[2] Es diu que l'avantatge d'aquest sistema s'aconsegueix si les prediccions utilitzant un únic conjunt d'entrenament només es desenvolupen per a pocs objectes.[3] Això es pot demostrar en el cas de la tècnica k-NN, que es basa en instàncies i la funció només s'estima localment.[4]

Exemples de mètodes d'aprenentatge mandrosos:

  • K-nearest neighbors, que és un cas especial d'aprenentatge basat en instàncies.
  • Regressió local.
  • Regles de Bayes ingènues i mandrosos, que s'utilitzen àmpliament en el programari comercial de detecció de correu brossa. Aquí, els emissors de correu brossa segueixen sent més intel·ligents i revisant les seves estratègies de correu brossa i, per tant, les regles d'aprenentatge també s'han d'actualitzar contínuament.

Referències[modifica]

  1. Aha, David. Lazy Learning. illustrated. Springer Science & Business Media, 2013, 29 June 2013, p. 424. ISBN 978-9401720533. 
  2. Bontempi, Gianluca; Birattari, Mauro; Bersini, Hugues International Journal of Control, 72, 7–8, 01-01-1999, pàg. 643–658. DOI: 10.1080/002071799220830.
  3. Sammut, Claude. Encyclopedia of Machine Learning. New York: Springer Science & Business Media, 2011, p. 572. ISBN 9780387307688. 
  4. Pal, Saurabh. Data Mining Applications. A Comparative Study for Predicting Student's Performance (en anglès). GRIN Verlag, 2017-11-02. ISBN 9783668561458.