Aprenentatge automàtic

De Viquipèdia
Dreceres ràpides: navegació, cerca

L'Aprenentatge automàtic és un camp de la intel·ligència artificial que està dedicat al disseny, anàlisi i desenvolupament d'algorismes i tècniques que permeten que les màquines evolucionin. Es tracta de crear programes capaços de generalitzar comportaments a partir del reconeixement de patrons o classificació. L'aprenentatge automàtic està relacionat amb el camp de l'estadística però també té solapament amb els mètodes de construcció de models, o l'aprenentatge estadístic. També hi ha punts de contacte amb la informàtica teòrica. Això és degut a la complexitat computacional dels problemes.

Alguns camps on s'ha aplicat aquest tipus d'aprenentatge són les aplicacions dedicades al processament del llenguatge natural, als algorismes de cerca, la diagnosi mèdica, la bioinformàtica, la detecció de fraus i la classificació.

Qualsevol sistema que es consideri intel·ligent ha de tenir l'habilitat d’aprendre, és a dir, de millorar automàticament amb l'experiència. Els programes utilitzats són sistemes d'aprenentatge capaços d'adquirir coneixements d'alt nivell i estratègies per la resolució de problemes mitjançant exemples, de forma anàloga a com ho faria la ment humana.

Esquema d'aprenentatge automàtic


Història[modifica | modifica el codi]

Durant molts anys la investigació sobre l'aprenentatge automàtic s'ha realitzat en diferents graus d'intensitat, tot utilitzant diferents tècniques i enfocant diferents aspectes i objectius. Es pot parlar de tres etapes importants, on cada una d'elles està centrada en un paradigma específic:

  • Tècniques de modelat neuronal i de decisió
  • Aprenentatge orientat a conceptes simbòlics
  • Sistemes d'aprenentatge de coneixements amb exploració de diferents tasques d'aprenentatge.

La característica distintiva del primer paradigma esmentat anteriorment, va ser l'interès de construir sistemes d'aprenentatge que tinguessin com a punt de partida poc o cap coneixement inicial. L'objectiu va ser crear una gran varietat de màquines basades en models neuronals. Aquests sistemes es van anomenar xarxes neuronals o Sistemes Auto-organitzatius. Degut a la poca tecnologia computacional dels primers anys, la majoria de les investigacions en aquesta àrea van ser de caràcter teòric o relatives a la construcció específica de sistemes hardware amb propòsits específics, com per exemple Perceptrones (Rosenblatt, 1958), Panemonium (Selfridge, 1959) i Adelaina (Widrow, 1962). Aquests treballs van ser fets a la dècada dels anys quaranta per Rashvesky i els seus seguidors de l’àrea de biofísica. Un altre tipus d’investigació relacionada amb aquesta àrea, és la que té a veure amb la simulació de processos evolutius, que a través d’operacions aleatòries de mutació i de selecció natural, poden crear un sistema capaç de realitzar un comportament intel·ligent (Friedberg, 1958 i Holland,1980).

L’experiència adquirida en aquestes àrees, va donar pas a una nova disciplina de Reconeixement de patrons que va ajudar a desenvolupar sistemes de decisió en aprenentatge automàtic. Un dels sistemes més exitosos i coneguts va ser el programa de joc de dames de Samuel (1963).

Com a investigació paral·lela al modelat de xarxes neuronals i sistemes de decisió, es van realitzar altres investigacions relacionades amb la teoria del control, ja que els resultats pràctics d’aquestes investigacions sobre xarxes neuronals i sistemes de decisió es van trobar amb diverses limitacions. Les altes expectatives esperades no es van complir i la investigació en aquesta àrea va començar a disminuir.

A partir d’aquí, un nou paradigma va començar a sorgir a la dècada dels sesanta gràcies a treballs de psicòlegs i investigadors de la intel·ligència artificial sobre el modelat de l’aprenentatge humà. Aquest paradigma, utilitzava estructures lògiques en comptes de numèrics i estadístics. Els sistemes aprenien descripcions simbòliques que representaven millor els coneixements adquirits. En aquesta àrea, cal destacar el treball de Winston sobre l’aprenentatge estructural així com diversos treballs dedicats a programes d’aprenentatge basats en lògica inductiva. El tercer i últim paradigma representa un període més actual, començant doncs, a mitjans dels anys setanta. Les investigacions han estat orientades a l’aprenentatge de conceptes a partir d’exemples, utilitzant una gran varietat de tècniques.


Tipus d'algorismes[modifica | modifica el codi]

Els algorismes d'aprenentatge automàtic es classifiquen d'acord amb allò que s'espera que el programa aprengui i també segons el grau d'interacció amb l'usuari.

Tipus d'aprenentatges
  • Aprenentatge supervisat — L'algorisme genera una funció que relaciona cada entrada amb la sortida desitjada. En el cas de problemes de classificació tenim que el sistema ha d'aprendre una funció (aproximar la conducta de la funció) a partir d'uns exemples que s'expressen en termes de l'aplicació d'un vector [X_1, X_2, \ldots X_N]\, a un conjunt de classes. És a dir, es proporciona un conjunt de dades al sistema que han estat etiquetats de forma manual amb els valors esperats. Les xarxes neuronals (supervisades) i els arbres de decisió són exemples d'algorismes d'aprenentatge supervisat. La base de coneixement del sistema està format per exemples d'etiquetatges anteriors. Aquest tipus d'aprenentatge pot ser molt útil en problemes d'investigació biològica, biologia computacional i bioinformàtica.
  • Aprenentatge no supervisat — L'algorisme disposa d'un conjunt d'exemples, però no de la classe que els hi correspon. Això és, que els exemples no estan etiquetats com passa en el cas anterior. En aquest cas, l'algorisme ha de ser capaç de trobar patrons similars per tal de poder etiquetar. Els algorismes de categorització (en anglès, clustering) són un exemple d'aquests tipus d'aprenentatge.
  • Aprenentatge semi-supervisat — Aquest algorisme combina els dos tipus d'algorismes anteriors per tal de generar una funció o classificador adequats. S'utilitza una combinació de les dades marcades i de les no marcades com a conjunt d'entrenament.
  • Aprenentatge per reforçament — Un cop realitzada l'acció que pren el sistema s'obté un retorn per part de l'entorn (una gratificació o una penalització segons si l'acció ha estat reeixida o no). És a dir, la informació d'entrada és el resultat que obté de l'exterior com a resposta a les seves accions. s'aprèn mitjançant prova-error i degut això, es requereix un elevat nombre de repeticions.

Resultats[modifica | modifica el codi]

A través de l'aprenentatge automàtic es poden generar tres tipus de coneixement. Cada un d'ells dependrà de les característiques que s'estiguin tractant.

1. Creixement

2. Reestructuració

3. Ajust


Aplicacions[modifica | modifica el codi]

Algunes de les aplicacions són:

Bibliografia[modifica | modifica el codi]

  • Bishop, C. M. (1995). Neural Networks for Pattern Recognition, Oxford University Press. ISBN 0-19-853864-2
  • Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0-471-05669-3
  • Antoine Cornuéjols, Laurent Miclet, Yves Kodratoff (2002) Apprentissage Artificiel: Concepts et algorithmes, Eyrolles, ISBN 2-212-11020-0
  • Huang T.-M., Kecman V., Kopriva I. (2006), Kernel Based Algorithms for Mining Huge Data Sets, Supervised, Semi-supervised, and Unsupervised Learning, Springer-Verlag, Berlin, Heidelberg, 260 pp. 96 illus., Hardcover, ISBN 3-540-31681-7«Enllaç».
  • KECMAN Vojislav (2001), LEARNING AND SOFT COMPUTING, Support Vector Machines, Neural Networks and Fuzzy Logic Models, The MIT Press, Cambridge, MA, 608 pp., 268 illus., ISBN 0-262-11255-8«Enllaç».
  • MacKay, D. J. C. (2003). Information Theory, Inference, and Learning Algorithms, Cambridge University Press. ISBN 0-521-64298-1
  • Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN 0-07-042807-7
  • Sholom Weiss and Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5


Vegeu també[modifica | modifica el codi]

Enllaços externs[modifica | modifica el codi]