Aprenentatge de característiques

En l'aprenentatge automàtic, l'aprenentatge de característiques o l'aprenentatge de representacions ^[2] és un conjunt de tècniques que permeten a un sistema descobrir automàticament les representacions necessàries per a la detecció o classificació de característiques a partir de dades en brut. Això substitueix l'enginyeria manual de funcions i permet que una màquina aprengui les funcions i les utilitzi per realitzar una tasca específica.

L'aprenentatge de característiques està motivat pel fet que les tasques d'aprenentatge automàtic, com ara la classificació, sovint requereixen una entrada que sigui matemàtica i computacionalment convenient de processar. Tanmateix, les dades del món real, com ara imatges, vídeo i dades de sensors, no han cedit als intents de definir algorítmicament característiques específiques. Una alternativa és descobrir aquestes característiques o representacions mitjançant l'examen, sense dependre d'algorismes explícits.

L'aprenentatge de funcions pot ser supervisat, no supervisat o autosupervisat.

En l'aprenentatge de funcions supervisat, les funcions s'aprenen mitjançant dades d'entrada etiquetades. Les dades etiquetades inclouen parells d'entrada-etiqueta on l'entrada es dona al model i ha de produir l'etiqueta de veritat bàsica com a resposta correcta.^[3] Això es pot aprofitar per generar representacions de característiques amb el model que donen lloc a una alta precisió de predicció de l'etiqueta. Alguns exemples inclouen xarxes neuronals supervisades, perceptró multicapa i aprenentatge de diccionaris (supervisat).
En l'aprenentatge de funcions no supervisat, les funcions s'aprenen amb dades d'entrada sense etiqueta mitjançant l'anàlisi de la relació entre els punts del conjunt de dades.^[4] Els exemples inclouen l'aprenentatge de diccionaris, l'anàlisi de components independents, la factorització matricial i diverses formes d'agrupació.^[5]^[6]
En l'aprenentatge de característiques autosupervisades, les característiques s'aprenen utilitzant dades no etiquetades com l'aprenentatge no supervisat, però es construeixen parells d'etiquetes d'entrada a partir de cada punt de dades, cosa que permet aprendre l'estructura de les dades mitjançant mètodes supervisats com ara el descens de gradients.^[7] Els exemples clàssics inclouen incrustacions de paraules i codificadors automàtics.^[8]^[9] Des de llavors, SSL s'ha aplicat a moltes modalitats mitjançant l'ús d'arquitectures de xarxes neuronals profundes com ara CNN i Transformers.^[7]

Referències[modifica]

↑ Goodfellow, Ian (2016). Deep learning. Yoshua Bengio, Aaron Courville. Cambridge, Massachusetts. pp. 524–534. ISBN 0-262-03561-8. OCLC 955778308.
↑ Y. Bengio; A. Courville; P. Vincent IEEE Transactions on Pattern Analysis and Machine Intelligence, 35, 8, 2013, pàg. 1798–1828. arXiv: 1206.5538. DOI: 10.1109/tpami.2013.50. PMID: 23787338.
↑ Stuart J. Russell, Peter Norvig (2010) Artificial Intelligence: A Modern Approach, Third Edition, Prentice Hall ISBN 978-0-13-604259-4.
↑ Hinton, Geoffrey; Sejnowski, Terrence (1999). Unsupervised Learning: Foundations of Neural Computation. MIT Press. ISBN 978-0-262-58168-4.
↑ "[1]" a ECCV Workshop on Statistical Learning in Computer Vision.
↑ Daniel Jurafsky. Speech and Language Processing (en anglès). Pearson Education International, 2009, p. 145–146.
↑ ^7,0 ^7,1 Ericsson, Linus; Gouk, Henry; Loy, Chen Change; Hospedales, Timothy M. IEEE Signal Processing Magazine, 39, 3, May 2022, pàg. 42–62. DOI: 10.1109/MSP.2021.3134634. ISSN: 1558-0792.
↑ Mikolov, Tomas; Sutskever, Ilya; Chen, Kai; Corrado, Greg S; Dean, Jeff Advances in Neural Information Processing Systems, 26, 2013.
↑ Goodfellow, Ian (2016). Deep learning. Yoshua Bengio, Aaron Courville. Cambridge, Massachusetts. pp. 499–516. ISBN 0-262-03561-8. OCLC 955778308.

[1] Goodfellow, Ian (2016). Deep learning. Yoshua Bengio, Aaron Courville. Cambridge, Massachusetts. pp. 524–534. ISBN 0-262-03561-8. OCLC 955778308.

[pami-2] Y. Bengio; A. Courville; P. Vincent IEEE Transactions on Pattern Analysis and Machine Intelligence, 35, 8, 2013, pàg. 1798–1828. arXiv: 1206.5538. DOI: 10.1109/tpami.2013.50. PMID: 23787338.

[3] Stuart J. Russell, Peter Norvig (2010) Artificial Intelligence: A Modern Approach, Third Edition, Prentice Hall ISBN 978-0-13-604259-4.

[4] Hinton, Geoffrey; Sejnowski, Terrence (1999). Unsupervised Learning: Foundations of Neural Computation. MIT Press. ISBN 978-0-262-58168-4.

[5] "[1]" a ECCV Workshop on Statistical Learning in Computer Vision.

[jurafsky-6] Daniel Jurafsky. Speech and Language Processing (en anglès). Pearson Education International, 2009, p. 145–146.

[:0-7] 7,0 ^7,1 Ericsson, Linus; Gouk, Henry; Loy, Chen Change; Hospedales, Timothy M. IEEE Signal Processing Magazine, 39, 3, May 2022, pàg. 42–62. DOI: 10.1109/MSP.2021.3134634. ISSN: 1558-0792.

[:3-8] Mikolov, Tomas; Sutskever, Ilya; Chen, Kai; Corrado, Greg S; Dean, Jeff Advances in Neural Information Processing Systems, 26, 2013.

[:1-9] Goodfellow, Ian (2016). Deep learning. Yoshua Bengio, Aaron Courville. Cambridge, Massachusetts. pp. 499–516. ISBN 0-262-03561-8. OCLC 955778308.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]