Aprenentatge per transferència

De la Viquipèdia, l'enciclopèdia lliure

L'aprenentatge per transferència (amb acrònim anglès TL) és un problema d'investigació en aprenentatge automàtic (ML) que se centra a emmagatzemar el coneixement adquirit mentre es resol un problema i l'aplica a un problema diferent però relacionat.[1] Per exemple, els coneixements adquirits en aprendre a reconèixer els cotxes es podrien aplicar quan s'intenta reconèixer els camions. Aquesta àrea de recerca guarda certa relació amb la llarga història de la literatura psicològica sobre transferència de l'aprenentatge, encara que els vincles pràctics entre ambdós camps són limitats. Des del punt de vista pràctic, reutilitzar o transferir informació de tasques apreses prèviament per a l'aprenentatge de noves tasques té el potencial de millorar significativament l'eficiència de la mostra d'un agent d'aprenentatge de reforç.[2]

El 1976, Stevo Bozinovski i Ante Fulgosi van publicar un article que abordava explícitament l'aprenentatge de transferència en l'entrenament de xarxes neuronals.[3][4] El document ofereix un model matemàtic i geomètric d'aprenentatge per transferència. El 1981 es va presentar un informe sobre l'aplicació de l'aprenentatge de transferència en l'entrenament d'una xarxa neuronal en un conjunt de dades d'imatges que representaven lletres de terminals d'ordinador. Es va demostrar experimentalment l'aprenentatge de transferència tant positiu com negatiu.[5]

La definició de transferència d'aprenentatge es dóna en termes de dominis i tasques. Un domini consta de: un espai de característiques i una distribució de probabilitat marginal , on . Donat un domini específic, , una tasca consta de dos components: un espai d'etiquetes i una funció predictiva objectiva . La funció s'utilitza per predir l'etiqueta corresponent d'una nova instància . Aquesta tasca, denotada per , s'aprèn a partir de les dades d'entrenament que consisteixen en parelles , on i .[6]

Donat un domini d'origen i tasca d'aprenentatge , un domini objectiu i tasca d'aprenentatge , on , o , l'aprenentatge de transferència pretén ajudar a millorar l'aprenentatge de la funció predictiva objectiu en utilitzant el coneixement en i .[7]

Hi ha algorismes disponibles per a l'aprenentatge de transferència en xarxes lògiques de Markov [8] i xarxes bayesianes.[9] L'aprenentatge de transferència també s'ha aplicat al descobriment de subtipus de càncer,[10] utilització d'edificis,[11][12] jocs generals,[13] classificació de text,[14][15] reconeixement de dígits,[16] imatges mèdiques i filtratge de correu brossa.[17]

L'any 2020 es va descobrir que, a causa de la seva naturalesa física semblant, és possible l'aprenentatge de transferència entre senyals electromiogràfics (EMG) dels músculs i classificant els comportaments de les ones cerebrals electroencefalogràfiques (EEG), des del domini de reconeixement de gestos fins al domini de reconeixement de l'estat mental. També es va assenyalar que aquesta relació funcionava a l'inrevés, demostrant que l'EEG també es pot utilitzar per classificar l'EMG.[18] Els experiments van assenyalar que la precisió de les xarxes neuronals i les xarxes neuronals convolucionals es va millorar [19] mitjançant l'aprenentatge de transferència tant a la primera època (abans de qualsevol aprenentatge, és a dir, en comparació amb la distribució de pes aleatòria estàndard) com a l'asimptota (el final de l'aprenentatge). procés). És a dir, els algorismes es milloren amb l'exposició a un altre domini. A més, l'usuari final d'un model pre-entrenat pot canviar l'estructura de les capes completament connectades per aconseguir un rendiment superior.[20]

Referències[modifica]

  1. West, Jeremy. «Spring Research Presentation: A Theoretical Foundation for Inductive Transfer» (en anglès). Brigham Young University, College of Physical and Mathematical Sciences. Arxivat de l'original el 2007-08-01. [Consulta: 5 agost 2007].
  2. George Karimpanal, Thommen; Bouffanais, Roland Adaptive Behavior, 27, 2, 2019, pàg. 111–126. arXiv: 1811.08318. DOI: 10.1177/1059712318818568. ISSN: 1059-7123.
  3. Stevo. Bozinovski and Ante Fulgosi (1976). "The influence of pattern similarity and transfer learning upon the training of a base perceptron B2." (original in Croatian) Proceedings of Symposium Informatica 3-121-5, Bled.
  4. Stevo Bozinovski (2020) "Reminder of the first paper on transfer learning in neural networks, 1976". Informatica 44: 291–302.
  5. S. Bozinovski (1981). "Teaching space: A representation concept for adaptive pattern classification." COINS Technical Report, the University of Massachusetts at Amherst, No 81-28 [available online: UM-CS-1981-028.pdf]
  6. Lin, Yuan-Pin; Jung, Tzyy-Ping Frontiers in Human Neuroscience, 11, 27-06-2017, pàg. 334. DOI: 10.3389/fnhum.2017.00334. PMC: 5486154. PMID: 28701938 [Consulta: free]. Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  7. Lin, Yuan-Pin; Jung, Tzyy-Ping Frontiers in Human Neuroscience, 11, 27-06-2017, pàg. 334. DOI: 10.3389/fnhum.2017.00334. PMC: 5486154. PMID: 28701938 [Consulta: free]. Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  8. Mihalkova, Lilyana & Huynh, Tuyen (July 2007), Learning Proceedings of the 22nd AAAI Conference on Artificial Intelligence (AAAI-2007), pàg. 608–614
  9. Niculescu-Mizil, Alexandru & Caruana, Rich (March 21–24, 2007), Proceedings of the Eleventh International Conference on Artificial Intelligence and Statistics (AISTATS 2007)
  10. Hajiramezanali, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zhou, Z. & Qian, X. Bayesian multi-domain learning for cancer subtype discovery from next-generation sequencing count data. 32nd Conference on Neural Information Processing Systems (NeurIPS 2018), Montréal, Canada. arΧiv:1810.09433
  11. (2017-11-08) "DA-HOC: semi-supervised domain adaptation for room occupancy prediction using CO2 sensor data" a 4th ACM International Conference on Systems for Energy-Efficient Built Environments (BuildSys). : 1–10. DOI:10.1145/3137133.3137146 
  12. Arief-Ang, I.B.; Hamilton, M.; Salim, F.D. ACM Transactions on Sensor Networks, 14, 3–4, 01-12-2018, pàg. 21:1–21:28. DOI: 10.1145/3217214.
  13. Banerjee, Bikramjit, and Peter Stone. "General Game Learning Using Knowledge Transfer Arxivat 2021-05-01 a Wayback Machine.." IJCAI. 2007.
  14. "Neural Information Processing Systems Foundation, NIPS*2005".  
  15. "Twenty-third International Conference on Machine Learning".  
  16. Maitra, D. S.; Bhattacharya, U.; Parui, S. K. 2015 13th International Conference on Document Analysis and Recognition (ICDAR), August 2015, pàg. 1021–1025. DOI: 10.1109/ICDAR.2015.7333916.
  17. "ECML-PKDD Discovery Challenge Workshop".  
  18. Bird, Jordan J.; Kobylarz, Jhonatan; Faria, Diego R.; Ekart, Aniko; Ribeiro, Eduardo P. IEEE Access, 8, 2020, pàg. 54789–54801. DOI: 10.1109/access.2020.2979074. ISSN: 2169-3536 [Consulta: free].
  19. Maitra, Durjoy Sen; Bhattacharya, Ujjwal; Parui, Swapan K. 2015 13th International Conference on Document Analysis and Recognition (ICDAR), August 2015, pàg. 1021–1025. DOI: 10.1109/ICDAR.2015.7333916.
  20. Kabir, H. M. Dipu; Abdar, Moloud; Jalali, Seyed Mohammad Jafar; Khosravi, Abbas; Atiya, Amir F. IEEE Transactions on Artificial Intelligence, January 7, 2022, pàg. 1–13. arXiv: 2007.03347. DOI: 10.1109/TAI.2022.3185179.