Andrew Barto
| Biografia | |
|---|---|
| Naixement | 1948 |
| Formació | Universitat de Michigan Universitat de Massachusetts Amherst |
| Director de tesi | Bernard P. Zeigler |
| Activitat | |
| Camp de treball | Ciències de la computació, intel·ligència artificial, ciència computacional, aprenentatge automàtic i learning system (en) |
| Ocupació | enginyer, investigador d'intel·ligència artificial, informàtic, professor universitari |
| Ocupador | Universitat de Massachusetts Amherst |
| Membre de | |
| Obra | |
| Estudiant doctoral | Richard S. Sutton, Jonathan Richard Bachrach, Theodore J. Perkins (en) |
| Premis | |
| Lloc web | www-all.cs.umass.edu… |
Andrew Gehret Barto (nascut el 1948) és un informàtic estatunidenc, actualment Professor Emèrit d'informàtica a la Universitat de Massachusetts Amherst. Barto és conegut sobretot per les seves contribucions a la fundació del camp d'aprenentatge per reforç computacional modern.[1]
Primers anys i educació
[modifica]Andrew Gehret Barto va néixer el 1948.[2] Es va llicenciar amb distinció en matemàtiques a la Universitat de Michigan l'any 1970, tot i que els seus primers estudis havien estat en arquitectura i enginyeria naval. Després de llegir obres de Michael Arbib, Warren Sturgis McCulloch, i Walter Pitts, es va interessar en l'ús dels ordinadors i la matemàtica per modelitzar el cervell, i al cap de cinc anys va obtenir un doctorat en informàtica amb una tesi sobre autòmats cel·lulars.[3]
Carrera
[modifica]L'any 1977, Barto va entrar a la Facultat de Ciències de la Informació de la Universitat de Massachusetts Amherst com a ajudant de recerca postdoctoral, va pujar a professor associat el 1982, i va obtenir la càtedra el 1991. Fou cap de departament entre 2007 i 2011 i era el nucli del programa de Neurociència i Comportament.[4]
Durant aquesta època a UMass, Barto fou el codirector del Laboratori d'Aprenentage Autònom (al principi el Laboratori de Xarxes Adaptables), que va generar diverses idees clau en l'aprenentatge per reforç.[4] Richard Sutton, juntament amb el qual va escriure l'influent llibre Reinforcement Learning: An Introduction (MIT Press 1998; 2a edició 2018),[4] era el seu estudiant de doctorat.
Aprenentatge per reforç
[modifica]Quan Barto va començar a treballar a UMass, va unir-se a un grup d'investigadors que provaven d'explorar el comportament de les neurones dins el cervell humà com a base de la intel·ligència humana, un concepte que havia avançat l'informàtic A. Harry Klopf. Juntament amb el seu estudiant de doctorat, Sutton, va utilitzar les matemàtiques per fer avançar el concepte i utilitzar-lo com a base de la intel·ligència artificial. Aquest concepte es va acabar coneixent com a aprenentatge per reforç i va acabar convertint-se en una de les tècniques clau de la intel·ligència artificial.[5]
Barto i Sutton van utilitzar processos de decisió de Màrkov (MDP) com a fundació matemàtica per explicar com els agents (entitats algorísmiques) prenien decisions quan es trobaven en un entorn estocàstic o aleatori, rebent recompenses al final de cada acció. La teoria MDP tradicional assumia que els agents coneixien tota la informació sobre els MDPs en els seus intents per maximitzar la recompensa acumulada. Les tècniques d'aprenentatge per reforç de Barto i Sutton permetien que tant l'entorn com les recompenses fossin desconeguts, i això va permetre que aquesta categoria d'algorismes s'apliqués a un rang molt més ample de problemes.[6]
Barto va crear un laboratori a UMass Amherst per desenvolupar les idees sobre aprenentatge per reforç mentre que Sutton va tornar al Canadà. El camp de l'aprenentatge per reforç va continuar desenvolupant-se en cercles acadèmics fins que una de les seves primeres aplicacions destacades en el món real va aconseguir que el programa AlphaGo de Google, basat en aquest concepte, guanyés el campió humà de go.[5] Barto i Sutton han estat reconeguts i acceptats generalment com a pioners de l'aprenentatge per reforç modern, i la tècnica es considera fundacional de l'esclat modern de la intel·ligència artificial.[7]
Barto ha publicat més de 100 articles o capítols en revistes, llibres, i conferències. És coautor amb Richard Sutton del llibre Reinforcement Learning: An Introduction, MIT Press 1998 (2a edició 2018), i coeditor amb Jennie Si, Warren Powell, i Don Wunch II del Handbook of Learning and Approximate Dynamic Programming, Wiley-IEEE Press, 2004.[8]
Premis i honors
[modifica]Barto és fellow de l'Associació Americana per a l'Avenç de la Ciència, Fellow i Membre Sènior de l'IEEE,[9] i membre de l'American Association for Artificial Intelligence i la Society for Neuroscience.[10]
Barto va rebre el premi de la UMass als Assoliments en Neurociència l'any 2019, el premi Pioner de la IEEE Neural Network Society el 2004,[11] i el premi IJCAI a l'Excel·lència en Investigació el 2017. La justificació d'aquest últim premi deia: "El Professor Barto és reconegut per la seva recerca fundacional de gran impacte tant en la teoria com l'aplicació de l'aprenentatge per reforç."[1]
El 2025, va rebre el Premi Turing de l'Association for Computing Machinery juntament amb el seu antic estudiant de doctorat Richard S. Sutton pel seu treball en aprenentatge per reforç. La justificació del premi deia: "Per desenvolupar els fonaments conceptuals i algorísmics de l'aprenentatge per reforç."[5][12]
Referències
[modifica]- ↑ 1,0 1,1 «IJCAI 2017 Awards», 19-08-2017. [Consulta: 6 setembre 2022].
- ↑ Barto, Andrew Gehret. University of Michigan. Cellular automata as models of natural systems (tesi), 1975.
- ↑ «Virtual History Interview». International Neural Network Society, 07-01-2022. [Consulta: 6 setembre 2022].
- ↑ 4,0 4,1 4,2 «Andrew G. Barto». University of Massachusetts Amherst, 17-02-2008. Arxivat de l'original el November 28, 2020. [Consulta: 18 octubre 2020].
- ↑ 5,0 5,1 5,2 Metz, Cade «Turing Award Goes to 2 Pioneers of Artificial Intelligence» (en anglès). The New York Times, 05-03-2025.
- ↑ «A.M. Turing Award». amturing.acm.org. [Consulta: 8 març 2025].
- ↑ «AI pioneers Andrew Barto and Richard Sutton win 2025 Turing Award for groundbreaking contributions to reinforcement learning | NSF – National Science Foundation» (en anglès). www.nsf.gov, 05-03-2025. [Consulta: 8 març 2025].
- ↑ UMass Amherst: Department of Computer Science Arxivat September 2, 2006, a Wayback Machine.
- ↑ «Barto elected IEEE fellow». University of Massachusetts Amherst, 22-11-2005. Arxivat de l'original el December 3, 2019. [Consulta: 3 desembre 2019].
- ↑ «CMU CS – AI Seminar». www.cs.cmu.edu. [Consulta: 7 març 2025].
- ↑ «"IEEE Computational Intelligence Society Past Recipients"», 06-09-2022. [Consulta: 6 setembre 2022].
- ↑ «Turing Awardees – Directorate for Computer and Information Science and Engineering (CISE) | NSF – National Science Foundation» (en anglès). www.nsf.gov, 05-03-2025. [Consulta: 8 març 2025].