Test de Turing

De la Viquipèdia, l'enciclopèdia lliure
La prova de Turing

El test de Turing va ser proposat el 1950 pel matemàtic Alan Turing per discernir si una màquina mostra o no un comportament intel·ligent en un article, a partir de la qüestió, poden pensar les màquines?.[1]

Encara que l'article original el presenta una mica diferent, avui en dia el test de Turing bàsicament es realitza seguint el procediment explicat a continuació. Una persona, l'avaluadora, fa preguntes a dos subjectes: una computadora dissenyada per generar respostes anàlogues a les dels humans i una altra persona. L'avaluadora no pot accedir directament als subjectes, sinó a través d'una interfície intermèdia. Si després d'analitzar la conversa, l'avaluadora no pot distingir la persona de la màquina o considera que la màquina és una persona, la màquina superaria el test de Turing i es consideraria intel·ligent.

Des del punt de vista filosòfic, John Searle va plantejar una de les principals crítiques al test de Turing, coneguda com el test de l'habitació xinesa. No obstant, generalment aquestes crítiques no s'accepten.

La major crítica sobre el test de Turing no és conceptual, sinó pràctica. Actualment, és un test que no s'utilitza en el camp de la intel·ligència artificial. D'una banda, aquesta àrea de recerca encara està lluny de generar sistemes que puguen actuar com a persones en el sentit general. A més, la implementació del test és complexa.

Existeixen concursos basats en el test de Turing, com el premi Loebner. Més aviat són un espectacle, poc acceptat pels científics. Hi ha altres tests per a diferenciar persones de robots a la web, anomenats captchas, que es basen en les limitacions actuals de la intel·ligència artificial.

Objeccions[modifica]

L'habitació xinesa[modifica]

Article principal: Habitació xinesa

Es tracta d'una prova semblant, proposada per John Searle i popularitzada per Roger Penrose: la "sala xinesa", per argumentar que la màquina no ha superat la prova de Turing.[2] En essència, és igual en la forma, però es realitza amb persones tancades en una habitació i requereix que aquestes no coneguin l'idioma en què es realitza la conversa. Per a això s'utilitza un diccionari que permet confeccionar una resposta a una pregunta donada, sense entendre els símbols. Com a conseqüència, s'argumenta que per molt que una persona sigui capaç d'enviar una cadena de símbols en xinès relacionada amb una altra cadena rebuda, no significa que sàpiga xinès, sinó que sap aplicar un conjunt de regles que li indiquen el que ha d'enviar. En el procés falta la semàntica. Per això, és molt qüestionada com intel·ligència artificial, ja que equiparà una màquina pensant amb una que sembla que pensa. Ray Kurzweil prediu que l'ordinador passarà la prova de Turing cap al 2029, basat en el concepte de singularitat tecnològica.[3]

El pensament subarticulat i la superarticulació[modifica]

Una bona quantitat dels processos mentals humans, malgrat ser duts a terme pel cervell de cada individu, no són susceptibles a introspecció, i per tant tampoc poden ser directament verbalitzats. Aquest tipus de pensament fou denominat subarticulat pel teòric Donald Michie. La incapacitat del test de Turing a l’hora d’incloure activitats mentals que tenen lloc en tota ment humana tot i no tendir a ser expressats verbalment és la causa de part de les crítiques que rep.

D’altra banda, el fenomen que Michie anomena superarticulació es refereix a la habilitat que probablement posseiria una consciència artificial de justificar les seves decisions mitjançant la inducció a un nivell usualment inaccessible per als humans.

La combinació d’ambdós fenòmens explicats és considerada per a Michie com a mostra d’un error en el test ideat per Turing, ja que la màquina o bé seria fàcilment identificada a causa de la seva capacitat de verbalitzar processos inconscients, o bé hauria de fingir que pateix la subarticulació típicament humana. Certs crítics del joc de la imitació veuen de forma negativa la possibilitat que les màquines haguessin de recórrer a la segona opció per a superar la prova, i afirmen que “hom hauria de jutjar un test com a defectuós si forcés els candidats a demostrar la seva intel·ligència amagant-la!”[4]

Aquests arguments, però, resulten fàcils de refutar si un recorda que l’objectiu de la màquina en el test no és demostrar les seves capacitats intel·lectuals, sinó fer-se passar per un humà. Alan Turing, de fet, ja considerà aquest tipus de situació en l’article en què proposà originàriament el joc de la imitació: "S’afirma que l’interrogador podria distingir la màquina de l’home simplement presentant-los un nombre de problemes d’aritmètica. [...] La resposta a això és simple. La màquina no intentaria donar les respostes correctes als problemes aritmètics. Introduiria errors deliberadament d’una manera calculada per a confondre l’interrogador."[1]

Aplicacions[modifica]

Una de les aplicacions de la prova de Turing és el control de spam. Atès el gran volum de correus electrònics enviats, en general l'spam és enviat automàticament per una màquina. Així la prova de Turing es pot utilitzar per distingir si el correu electrònic era enviat per una persona o per una màquina (per exemple, per la prova Captcha).

Versions de la prova de Turing[modifica]

Saul Traigner argumenta que hi ha almenys 3 versions primàries de la prova de Turing, proposades en "Computing Machinery and Intelligence", i una altra que descriu com "la interpretació estàndard".

Hi ha controvèrsia sobre si Turing va descriure aquesta "interpretació estàndard" o si es basa en la mala interpretació del text. Però aquestes tres versions no es classifiquen com equivalents[5] i els seus punts forts i febles són diferents.

Huma Shah senyala que el mateix Turing estava consternat amb la possibilitat que una màquina pogués pensar, i estava proporcionant un mètode simple per distingir-ho, a través de sessions de pregunta-resposta entre una persona i una màquina.[6] Shah argumenta que existeix un joc d'imitació que Turing potser va posar en pràctica de dues maneres diferents: a) una prova d'un a un entre l'interrogador i la màquina, o b) una comparació simultània entre una persona i una màquina, interrogats paral·lelament per un mateix interrogador., ja que la prova de Turing avalua la indistingibilitat en la seva capacitat de funcionament, la versió verbal naturalment generalitza tota la capacitat humana, verbal i no verbal (robòtica).[7]

Joc de la imitació[modifica]

El joc original descrit per Turing proposava un joc de festa que involucrava tres jugadors. El jugador A és un home, el jugador B és una dona i el jugador C (qui té el rol d'interrogador) és de qualsevol sexe. Al joc, el jugador C no té contacte visual amb cap dels altres jugadors i es pot comunicar amb ells mitjançant notes escrites. A l'hora de fer preguntes als jugadors, el jugador C intenta determinar quin dels dos és l'home i quin la dona. El jugador A intentarà enganyar a l'interrogador fent-li escollir erròniament mentre que el jugador B ajudarà a l'interrogador a escollir al jugador correcte.[8]

Sterret es refereix a aquest joc com "La Prova del Joc Original De La Imitació".[8] Turing va proposar que el rol del jugador A el tingués una computadora perquè aquesta hagués de pretendre ser dona i tractés de guiar a l'interrogador a la resposta incorrecta. L'èxit de la computadora es determinaria comparant el resultat del joc quan el jugador A és la computadora amb el resultat del joc quan el jugador A és un home. Turing afirmà que si la computadora era capaç d'enganyar a l'interrogador tan freqüentment com quan el joc és plantejat per a un home i una dona,[9] es podrà argumentar que la computadora és intel·ligent.

La segona versió aparegué posteriorment al text de 1950 de Turing. Similar a l'anterior, el paper del jugador A seria realitzat per una computadora. No obstant això, el paper del jugador B seria realitzat per un home i no una dona.

En aquesta versió ambdós jugadors, A (computadora) i B, provaran de guiar a l'interrogador cap a la resposta incorrecta.

Interpretació estàndard[modifica]

Hi ha certa controvèrsia sobre quina és la interpretació a la qual Turing es referia. La comprensió general dicta que el propòsit de la prova de Turing no és determinar específicament si una computadora serà capaç d'enganyar a l'interrogador fent-li creure que és una persona, sinó la seva incapacitat d'imitar la persona. Sterrer creu que era aquesta[10] i, per tant, combina la segona versió amb aquesta mentre que altres, com Traiger, no ho fan.[5] Tanmateix, això no ha portat a una interpretació estàndard en realitat. En aquesta versió, el jugador A és una computadora i el sexe del jugador B és indiferent. L'objectiu de l'interrogador no és determinar quin d'ells és home i quina dona, sinó quin és computadora i quin persona. El problema fonamental amb la interpretació estàndard és que l'interrogador no pot diferenciar qui és persona i qui és màquina d'entre aquells que han donat una resposta.[5] Hi ha altres problemes en quant la duració, però la interpretació estàndard generalment considera aquesta limitació com una cosa que hauria de ser raonable.

Propostes alternatives[modifica]

El test de la feina[modifica]

Nils J. Nilsson, informàtic i investigador en l’àmbit de la intel·ligència artificial, formulà un test basant-se en el fet que l’assoliment de la consciència artificial implicaria de forma inherent que les màquines podrien substituir els humans en la major part de les tasques usualment realitzades per persones. A partir d’això, Nilsson decidí plantejar una prova amb què pretenia reemplaçar la de Turing: es tracta del test de la feina, que consisteix a calcular l’avenç tecnològic cap a la consciència sintètica a partir de quin percentatge dels oficis habitualment executats per humans poden ser duts a terme per robots.

Un dels principals propòsits de la proposta de Nilsson era dirigir el desenvolupament tecnològic del camp de l’automatització cap al disseny de sistemes generals programables capaços d’aprendre a realitzar una àmplia varietat d’empreses, en lloc de centrar-se en la creació d’una ingent quantitat de sistemes de finalitat específica d’una utilitat en comparació molt reduïda. Breument, en l’intent de crear sistemes més versàtils, segons Nilsson, s’evolucionaria simultàniament en els sectors de l’automatització i de la intel·ligència artificial forta.[11]

El test de Wozniak[modifica]

Aquesta prova fou suggerida per J. Storrs Hall, i es fonamenta en la idea que si un robot fos capaç d’entrar a una llar qualsevol i executar una acció tan casual com és fer-se un cafè identificant correctament la cuina i la cafetera, descobrint el seu funcionament de forma autònoma i trobant el cafè, les tasses i la resta d’elements necessaris, es podria dir que la màquina en qüestió és intel·ligent. La raó per la qual el test porta el nom del cofundador d’Apple Steve Wozniak és que ell, en una entrevista, comentà la subtil complexitat d’aquest procés i expressà dubtes davant la possibilitat que cap robot pogués arribar a efectuar-lo.[12]

S’observa una similitud essencial entre aquest test i el de Nilsson, que relacionava la intel·ligència artificial general amb l’automatització d’oficis: en ambdós casos un propòsit primordial de la proposta és instigar els investigadors a enfocar la seva feina en direcció al desenvolupament de sistemes generals i educables en comptes d’específics, malgrat els amplis suposin un repte de gran dificultat en comparació amb els altres.[13]

RoboCup[modifica]

Un dels esdeveniments anuals més multitudinaris en el món de la intel·ligència artificial a dia d’avui és la RoboCup, un campionat internacional de robòtica en què s’enfronten equips de futbol formats únicament per màquines. Aquesta competició, el nom complet de la qual és “Robot Soccer World Cup”, fou fundada l’any 1996 per un conjunt de professors universitaris que havien estat estudiant la possibilitat d’utilitzar robots per a jugar a futbol de manera separada amb la intenció de promoure la investigació en els camps de la intel·ligència artificial i la robòtica.

RoboCup consta d’un ambiciós objectiu a llarg termini: “A mitjans del segle xxɪ, un equip de futbol compost de robots humanoides completament autònoms guanyarà un partit, d’acord amb la normativa oficial de la FIFA, contra el guanyador de la Copa del Món de Futbol més recent.”[14] Ara per ara pot semblar un objectiu massa elevat per ser assolit a temps, però cada any que passa va acompanyat d’avenços en aquesta disciplina fruit del concurs de RoboCup. Davant les dificultats i reptes que comporta aquesta meta, els seus organitzadors pretenen recordar a la gent que “només va haver-hi 50 anys entre el primer avió dels germans Wright i el programa Apollo [...]. També van passar tan sols 50 anys des de la invenció de l’ordinador digital fins a Deep Blue, que guanyà al campió d’escacs del món.”[14]

Una sèrie de factors fan d’aquest esdeveniment un dels de major èxit quant a participació i recerca científica, com ara un sistema intern d’organització robust i pràctic, un baix cost d’accés, el lliurament del “RoboCup Scientific Challenge Award” al millor escrit tècnic, animant els concursants a compartir les seves idees amb la comunitat científica, i sens dubte l'enorme motivació que causa la competició esportiva.

Altres tests pràctics[modifica]

D’entre l'extensa varietat de plantejaments alternatius al joc de la imitació que pretenen valorar les qualitats d’una màquina respecte a la consciència sintètica, és interessant esmentar-ne un parell més: hi ha qui proposa examinar la capacitat dels robots de comprendre històries ja sigui en format audiovisual o textual, sotmetre’ls a avaluacions psicològiques usualment realitzades per a jutjar les capacitats intel·lectuals d’un infant de preescolar, aconseguir que aprenguin a jugar a un videojoc únicament a través de l'experiència acumulada i completar uns estudis universitaris com qualsevol altre alumne, ja sigui presencialment o en línia.[15]

Premi Loebner[modifica]

El Premi Loebner és una competició que premia la màquina dotada d'intel·ligència artificial que superi amb més eficàcia el Test de Turing. La seva creació es remunta al 1990,[16] gràcies a Hugh Loebner, el seu principal patrocinador, en col·laboració amb el centre d'Estudis de Comportament de la Universitat de Cambridge.

L'esdeveniment se celebra anualment en diverses seus que oscil·len entre Gran Bretanya i els Estats Units d'Amèrica. El procediment que segueixen per a provar les màquines és el mateix emprat al test original: l'avaluació de converses generades entre un humà i una màquina per part d'uns jutges.

Aquesta celebració ha rebut moltes crítiques i ha estat controvertida. Un dels motius principals de les crítiques és la condició de no experts d'alguns dels jutges que hi participen.

Competició a la Universitat de Reading[modifica]

El 7 de juny de 2014 es va organitzar una competició del test de Turing, a càrrec d'Huma Shah i Kevin Warwick, celebrant el 60è aniversari de la mort de Turing. Es va celebrar a la Royal Society de Londres i va ser guanyada pel bot de conversa rus Eugene Goostman.[17] El bot, durant una sèrie de converses via text de cinc minuts, va convèncer el 33% dels membres del jurat que era humà. El jurat estava format per John Sharkey, un patrocinador de la proposta de llei per garantir-li un perdó governamental a Turing, el professor d'Intel·ligència artificial Aaron Sloman i l'actor del Nan Roig, Robert Llewellyn.[18][19][20][21]

Els organitzadors de la competició van afirmar que el test de Turing va ser superat per primer cop allà, dient que L'esdeveniment va involucrar el nombre més gran de comparacions simultànies fins al moment, sent independentment verificat i, fet crucial, les conversacions no van ser restringides. Un test de Turing verídic no marca les preguntes ni els temes a parlar abans de les converses.[19]

Test de Turing a la ficció[modifica]

La rellevància d'aquesta prova en l'àmbit tecnològic ha promogut la seva aparició, menció o referència a diverses obres audiovisuals:

A Blade Runner (1982), adaptació de la novel·la Somien els androides amb ovelles elèctriques? dirigida per Ridley Scott apareix una prova basada en el Test de Turing: el test Voight-Kampff. La prova tracta de comprovar si algú és una persona o un androide mitjançant una maquinària que analitza les reaccions corporals a unes preguntes com a estímuls. Si l'individu analitzat presenta respostes emocionals es dictaminarà que és humà, mentre que si no hi ha cap mostra emocional es resoldrà que és un androide.

A.I. Artificial Intelligence (2001) de Steven Spielberg plasma en la ficció l'intent d'equiparar les màquines als humans i integrar-les a la societat. En aquest cas, mitjançant un nen robot que intenta ser un nen "normal".

El director estatunidenc Spike Jonze va realitzar Her el 2013. En el film, el seu protagonista s'enamora d'un sistema operatiu, Samantha, i es planteja la polèmica de si les màquines poden arribar a desenvolupar una intel·ligència i sentiments semblants als humans.

The Imitation Game (2014) és un film dirigit per Morten Tyldum, amb referències al test. Principalment, perquè aquest drama és una adaptació de la vida del seu creador, Alan Turing, i la seva labor desencriptant la màquina Enigma durant la Segona Guerra Mundial.

Ex Machina (2015) és un film de ciència-ficció dirigit per Alex Garland. Mostra com un androide sembla intel·ligent i les proves que li realitza el seu creador. D'altra banda, presenta novament el debat de si les màquines poden tenir sentiments com els humans.

Controvèrsia[modifica]

L'any 2014, per primer cop des que Alan Turing va dissenyar el test, un programa d'ordinador va aconseguir convèncer a més del 30% dels jutges de que era humà. El xatbot (robot programat per conversar en línia) anomenat Eugene Goostman va ser capaç de fer creure al 33% del jurat que va participar en la prova en la Royal Society que estava parlant amb un nen ucraïnès de 13 anys. El xatbot va combinar tècniques de processament del llenguatge, amb concordança de paraules clau i amb accés a bases de dades. El resultat és un agent de conversa intel·ligent que pot interactuar amb un o més usuaris a través de mètodes auditius o textuals. Els creadors són Vladimir Veselov (un informàtic rus resident als Estats Units) i Eugene Demchenko (un jove ucraïnès que viu a Rússia). Els dos feia temps que circulaven el programa per diversos circuits especialitzats amb bons resultats, però mai fins al punt d'enganyar a més del 30% d'usuaris amb els quals interactua (el llistó que va posar Turing quan va concebre la prova).[22]

Després de l'anunci per part de la Universitat de Reading molts investigadors i científics van senyalar que la notícia era absurda i un engany, mentre que d'altres defenien la seva validesa. Els del primer grup exposen que és una exageració i una eina de màrqueting, i exposen que actualment hi ha diverses maneres de realitzar i interpretar el test. Segons diu José María Peña, subdirector del Centre de Supercomputació i Visualització de la Universitat Politècnica de Madrid (UPM): "El test inicial de Turing és un postulat teòric. Depenent de com l'interpretes i implementes, pots utilitzar-lo o no per obtenir resultats en el teu propi benefici". Com que no existeix una única entitat que estandarditzi i verifiqui els tests de Turing, bàsicament qualsevol pot organitzar un i assegurar que s'ha superat per primer cop.

Un dels altres punts més discutits sobre Eugene va ser la premissa de la qual partia: un nen ucraïnès de 13 anys parlant anglès, idioma en el qual no era natiu. Si els avaluadors saben que a l'altra banda hi ha un nen (o una màquina) que es comunica en un idioma que no és el seu propi, s'introdueix un biaix a l'hora d'analitzar la validesa i complexitat de les seves respostes.

També hi ha qui defensa que l'any 1964 ja va haver-hi programes que van aconseguir alguna cosa semblant, com Eliza, dissenyat pel MIT. Steven Harnad, professor de ciències cognitives a la Universitat de Quebec, a Canadà, va dir a The Guardian: "És una ximpleria, una completa ximpleria. No hem superat el test de Turing. No estem ni tan sols a prop".[23]

Referències[modifica]

  1. 1,0 1,1 Turing, Alan «Computing Machinery and Intelligence». Mind, 1950.
  2. Roger Penrose. La nova ment del emperador . Barcelona: Grijalbo Mondadori. 1991. Pàgina 42
  3. Raymond Kurzweil. L'era de les màquines espirituals . 1999.
  4. Michie, Donald «Turing’s Test and Conscious Thought». Artificial Intelligence, 1993, pàg. 1-22.
  5. 5,0 5,1 5,2 Traiger, Saul (2000), «Making the Right Identification in the Turing Test», Minds and Machines 10 (4): 561, doi:10.1023/A:1011254505902 (reprinted in The Turing Test: The Elusive Standard of Artificial Intelligence edited by James H. Moor, Kluwer Academic 2003) ISBN 1-4020-1205-5
  6. Shah, Huma (2011), Turing's Misunderstood Imitation Game and IBM's Watson Success
  7. Oppy, Graham & Dowe, David (2011) The Turing TestStanford Encyclopedia of Philosophy.
  8. 8,0 8,1 Saygin, A. P.; Cicekli, I.; Akman, V. (2000), «Turing Test: 50 Years Later» Arxivat 2011-04-09 a Wayback Machine., Minds and Machines 10 (4): 463-518, doi:10.1023/A:1011288000451. Reprinted in Moor (2003, pp. 23–78).
  9. Turing, 1950, p. 434.
  10. Moor, James, ed. (2003), The Turing Test: The Elusive Standard of Artificial Intelligence, Dordrecht: Kluwer Academic Publishers, ISBN 1-4020-1205-5
  11. Nilsson, Nils «Human-Level Artificial Intelligence? Be Serious!». AI Magazine, 2005, pàg. 68-75.
  12. «Wozniak: Could a Computer Make a Cup of Coffee?» (en anglès). Fast Company, 2010.
  13. «AGI Roadmap meeting» (en anglès). John Storrs Hall, 2009.
  14. 14,0 14,1 «RoboCup Federation» (en anglès). RoboCup Federation, 2016.
  15. Goertzel, Ben «Artificial General Intelligence: Concept, State of the Art, and Future Prospects». Journal of Artificial General Intelligence, 2014, pàg. 1-48.
  16. «Test de Turing, on season 4, episode 3». Scientific American Frontiers. Chedd-Angier Production Company, 1993-1994.
  17. «AI with 13-year-old boy's personality wins top prize at world's biggest Turing test». The Verge.
  18. Warwick, Kevin; Shah, Huma «Can machines think? A report on Turing test experiments at the Royal Society». Journal of Experimental & Theoretical Artificial Intelligence, 28, 6, 01-11-2016, pàg. 989–1007. DOI: 10.1080/0952813X.2015.1055826. ISSN: 0952-813X.
  19. 19,0 19,1 «University of Reading» (en anglès). [Consulta: 13 octubre 2017].
  20. McCoy, Terrence «A computer just passed the Turing Test in landmark trial» (en anglès). Washington Post, 09-06-2014. ISSN: 0190-8286.
  21. «An AI milestone: Chatbot passes Turing Test by posing as 13-year-old boy» (en anglès). PCWorld.
  22. «Un ordenador logra superar por primera vez el test de Turing» (en castellà), 09-06-2014. [Consulta: 15 desembre 2018].
  23. Méndez, Manuel Ángel. «El ordenador que superó el test de Turing: ¿engaño o hito histórico?» (en espanyol europeu). [Consulta: 16 desembre 2018].

Enllaços externs[modifica]

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Test de Turing