Aprenentatge automàtic

De Viquipèdia
Salta a la navegació Salta a la cerca

L'Aprenentatge automàtic ("machine learning" en anglès) és un camp de la intel·ligència artificial que està dedicat al disseny, l'anàlisi i el desenvolupament d'algorismes i tècniques que permeten que les màquines evolucionin. Es una àrea multidisciplinària que, a través de ciències com la computació, les matemàtiques, la lògica i la filosofia, estudia la creació i el disseny de programes capaços de generalitzar comportaments a partir del reconeixement de patrons o classificació i de sistemes capaços de resoldre problemes quotidians per si mateixos, utilitzant com a paradigma la intel·ligència humana. L'aprenentatge automàtic està relacionat amb el camp de l'estadística, però també coincideix amb els mètodes de construcció de models, o l'aprenentatge estadístic. També hi ha punts de contacte amb la informàtica teòrica. Això és degut a la complexitat computacional dels problemes.

Esquema d'aprenentatge automàtic

Alguns camps on s'ha aplicat aquest tipus d'aprenentatge són les aplicacions dedicades al processament del llenguatge natural, als algorismes de cerca, la diagnosi mèdica, la bioinformàtica, la detecció de fraus i la classificació.

Qualsevol sistema que es consideri intel·ligent ha de tenir l'habilitat d'aprendre, és a dir, de millorar automàticament amb l'experiència. Els programes utilitzats són sistemes d'aprenentatge capaços d'adquirir coneixements d'alt nivell i estratègies per la resolució de problemes mitjançant exemples, de forma anàloga a com ho faria la ment humana.

Història[modifica]

Durant molts anys la investigació sobre l'aprenentatge automàtic s'ha realitzat en diferents graus d'intensitat, tot utilitzant diferents tècniques i enfocant diferents aspectes i objectius. Es pot parlar de tres etapes importants, on cada una d'elles està centrada en un paradigma específic:

 • Tècniques de modelatge neuronal i de decisió
 • Aprenentatge orientat a conceptes simbòlics
 • Sistemes d'aprenentatge de coneixements amb exploració de diferents tasques d'aprenentatge.

La característica distintiva del primer paradigma esmentat anteriorment, va ser l'interès de construir sistemes d'aprenentatge que tinguessin com a punt de partida poc o cap coneixement inicial. L'objectiu va ser crear una gran varietat de màquines basades en models neuronals. Aquests sistemes es van anomenar xarxes neuronals o Sistemes Auto-organitzatius. Per cauda de la poca tecnologia computacional dels primers anys, la majoria de les investigacions en aquesta àrea van ser de caràcter teòric o relatives a la construcció específica de sistemes hardware amb propòsits específics, com per exemple Perceptrones (Rosenblatt, 1958), Panemonium (Selfridge, 1959) i Adelaina (Widrow, 1962). Aquests treballs van ser fets a la dècada dels anys quaranta per Rashvesky i els seus seguidors de l'àrea de biofísica. Un altre tipus de recerca relacionada amb aquesta àrea, és la que té a veure amb la simulació de processos evolutius, que a través d'operacions aleatòries de mutació i de selecció natural, poden crear un sistema capaç de realitzar un comportament intel·ligent (Friedberg, 1958 i Holland,1980).

L'experiència adquirida en aquestes àrees, va donar pas a una nova disciplina de Reconeixement de patrons que va ajudar a desenvolupar sistemes de decisió en aprenentatge automàtic. Un dels sistemes més exitosos i coneguts va ser el programa de joc de dames de Samuel (1963).

Com a investigació paral·lela al modelat de xarxes neuronals i sistemes de decisió, es van realitzar altres investigacions relacionades amb la teoria del control, ja que els resultats pràctics d'aquestes investigacions sobre xarxes neuronals i sistemes de decisió es van trobar amb diverses limitacions. Les altes expectatives esperades no es van complir i la investigació en aquesta àrea va començar a disminuir.

A partir d'aquí, un nou paradigma va començar a sorgir a la dècada dels seixanta gràcies a treballs de psicòlegs i investigadors de la intel·ligència artificial sobre el modelatge de l'aprenentatge humà. Aquest paradigma, utilitzava estructures lògiques en comptes de numèrics i estadístics. Els sistemes aprenien descripcions simbòliques que representaven millor els coneixements adquirits. En aquesta àrea, cal destacar el treball de Winston sobre l'aprenentatge estructural així com diversos treballs dedicats a programes d'aprenentatge basats en lògica inductiva. El tercer i últim paradigma representa un període més actual, començant doncs, a mitjans dels anys setanta. Les investigacions han estat orientades a l'aprenentatge de conceptes a partir d'exemples, utilitzant una gran varietat de tècniques.

Tipus d'algorismes[modifica]

Els algorismes d'aprenentatge automàtic es classifiquen d'acord amb allò que s'espera que el programa aprengui i també segons el grau d'interacció amb l'usuari.

Tipus d'aprenentatges
 • Aprenentatge supervisat — L'algorisme genera una funció que relaciona cada entrada amb la sortida desitjada. En el cas de problemes de classificació tenim que el sistema ha d'aprendre una funció (aproximar la conducta de la funció) a partir d'uns exemples que s'expressen en termes de l'aplicació d'un vector a un conjunt de classes. És a dir, es proporciona un conjunt de dades al sistema que han estat etiquetats de forma manual amb els valors esperats. Les xarxes neuronals (supervisades) i els arbres de decisió són exemples d'algorismes d'aprenentatge supervisat. La base de coneixement del sistema està format per exemples d'etiquetatges anteriors. Aquest tipus d'aprenentatge pot ser molt útil en problemes d'investigació biològica, biologia computacional i bioinformàtica.
 • Aprenentatge no supervisat — L'algorisme disposa d'un conjunt d'exemples, però no de la classe que els hi correspon. Això és, que els exemples no estan etiquetats com passa en el cas anterior. En aquest cas, l'algorisme ha de ser capaç de trobar patrons similars per tal de poder etiquetar. Els algorismes de categorització (en anglès, clustering) són un exemple d'aquests tipus d'aprenentatge.
 • Aprenentatge semisupervisat — Aquest algorisme combina els dos tipus d'algorismes anteriors per tal de generar una funció o classificador adequats. S'utilitza una combinació de les dades marcades i de les no marcades com a conjunt d'entrenament.
 • Aprenentatge per reforç — Un cop realitzada l'acció que pren el sistema s'obté un retorn per part de l'entorn (una gratificació o una penalització segons si l'acció ha estat reeixida o no). És a dir, la informació d'entrada és el resultat que obté de l'exterior com a resposta a les seves accions. s'aprèn mitjançant prova-error i degut això, es requereix un elevat nombre de repeticions.


Dins d'aquesta classificació, a més a més podem trobar un gran nombre d'algorismes específics amb diferents característiques pel tractament de les dades. Entre els més rellevants trobem:

 • Deep Learning — Consisteix en l'ús d'algorismes perfer representacions abstractes de la informació i facilitar l'aprenentatge automàtic.
 • Active Learning — És un cas especial d'aprenentatge semi-supervisat en què l'algorisme d'aprenentatge pot interactuar amb un altre usuari o font d'informació per obtenir els resultats desitjats.
 • Support Vector Machines — Busca la maximització de la distància entre la recta o el pla i les mostres que es troben a un costat o altre. En cas que les mostres no siguin linealment separables, s'utilitza una transformació anomenada Kernel.

Resultats[modifica]

A través de l'aprenentatge automàtic es poden generar tres tipus de coneixement. Cada un d'ells dependrà de les característiques que s'estiguin tractant.

 1. Creixement
 2. Reestructuració
 3. Ajust

Aplicacions[modifica]

Algunes de les aplicacions són:

Bibliografia[modifica]

 • Bishop, C. M. (1995). Neural Networks for Pattern Recognition, Oxford University Press. ISBN 0-19-853864-2
 • Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0-471-05669-3
 • Antoine Cornuéjols, Laurent Miclet, Yves Kodratoff (2002) Apprentissage Artificiel: Concepts et algorithmes, Eyrolles, ISBN 2-212-11020-0
 • Huang T.-M., Kecman V., Kopriva I. (2006), Kernel Based Algorithms for Mining Huge Data Sets, Supervised, Semi-supervised, and Unsupervised Learning, Springer-Verlag, Berlin, Heidelberg, 260 pp. 96 illus., Hardcover, ISBN 3-540-31681-7«Enllaç».
 • KECMAN Vojislav (2001), LEARNING AND SOFT COMPUTING, Support Vector Machines, Neural Networks and Fuzzy Logic Models, The MIT Press, Cambridge, MA, 608 pp., 268 illus., ISBN 0-262-11255-8«Enllaç».
 • MacKay, D. J. C. (2003). Information Theory, Inference, and Learning Algorithms, Cambridge University Press. ISBN 0-521-64298-1
 • Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN 0-07-042807-7
 • Sholom Weiss and Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5

Vegeu també[modifica]

Enllaços externs[modifica]

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Aprenentatge automàtic