Vés al contingut

Marta Villegas Montserrat

De la Viquipèdia, l'enciclopèdia lliure
Plantilla:Infotaula personaMarta Villegas Montserrat
Biografia
FormacióUniversitat Politècnica de Catalunya Modifica el valor a Wikidata
Activitat
Ocupacióinvestigadora, lingüista computacional Modifica el valor a Wikidata
OcupadorCentre de Supercomputació de Barcelona, investigador sènior (2017–) Modifica el valor a Wikidata
Premis


LinkedIn: martavillegasmontserrat Modifica el valor a Wikidata

Marta Villegas Montserrat (Barcelona, segle XX) és una lingüista computacional i investigadora catalana. Dirigeix la Unitat de Tecnologies del Llenguatge del Barcelona Supercomputing Center - Centre Nacional de Supercomputación (BSC–CNS).[1][2][3]

Trajectòria

[modifica]

Villegas es va doctorar en Lingüística aplicada en 1998 en la Universitat Politècnica de Catalunya (UPC) amb la tesi titulada Controlled subjects in Spanish and other "senar-strictly local" bounded dependency constructions (Subjectes controlats en espanyol i altres construccions de dependència delimitada «no estrictament locals»), on analitza com les llengües romàniques, com l'espanyol, desafien alguns principis de la teoria lingüística HPSG (Head-Driven Phrase Structure Grammar).[4]

Villegas dirigeix la Unitat de Tecnologies del Llenguatge del Barcelona Supercomputing Center - Centre Nacional de Supercomputación (BSC–CNS) on treballa des de 2017. Lidera el projecte MarIA dins del BSC–CNS, una iniciativa d'accés obert dissenyada per a millorar la comprensió de la llengua espanyola per part dels sistemes d'intel·ligència artificial (IA).[5] Fou el primer model massiu d'IA en espanyol obert. El seu desenvolupament s'ha basat en una base de dades proporcionada per la Biblioteca Nacional Espanyola, que conté 135.000 milions de paraules.[6] MarIA s'entrenà per a aprendre a contextualitzar el vocabulari, utilitzant per a això la potència del supercomputador MareNostrum.

A més, també lidera el projecte AINA, una iniciativa d'intel·ligència artificial i tecnologies del llenguatge que, des de finals del 2020, té com a objectiu potenciar l'ús del català en el món digital.[7][8] El projecte genera i posa a la disposició de tots recursos lingüístics, corpus i models informàtics perquè els desenvolupadors d'aplicacions basades en IA puguin integrar-los fàcilment en català, captat a través de la plataforma Common Voice.[9] Això inclou assistents de veu, traductors automàtics, correctors i agents conversacionals, amb la finalitat de facilitar la interacció en català en l'àmbit digital.[3]

El gener de 2025 el Govern d'Espanya va presentar ALIA, una iniciativa que agrupa els projectes dirigits per Villegas, incloent-hi, MarIA i AINA.[10][11]

A més, Villegas ha publicat nombrosos estudis i forma part de l'equip tècnic del Pla d'Impuls de les Tecnologies del Llenguatge de l'Agenda Digital per a Espanya.

Reconeixements

[modifica]

En 2022, Marta Villegas va guanyar el Premi Ciutat de Barcelona en la categoria de Ciències Experimentals i Tecnologia per la construcció i desenvolupament dels models de processament de llenguatges naturals per al català i el castellà, AINA i Maria.[12] El projecte MarIA liderat per Villegas ha rebut al seu torn altres reconeixements com el premi Archiletras, convocat per l'editorial Premsa i Serveis de la Llengua per a reconèixer els mèrits en la promoció, suport, recerca i desenvolupament en l'espanyol i altres llengües.[13]

Referències

[modifica]
  1. Villegas, MARTA VILLEGAS Position: LEADER LANGUAGE TECHNOLOGIES UNIT Barcelona Supercomputing Center-Centro Nacional de Supercomputación Life Sciences- Language Technologies. «Marta Villegas» (en anglès). BSC-CNS. [Consulta: 8 febrer 2025].
  2. Soler, Adrián. «Marta Villegas: "Lo ideal es que podamos hablar con las máquinas en nuestras lenguas maternas"» (en espanyol europeu). Paréntesis.Media, 03-05-2024. [Consulta: 8 febrer 2025].
  3. 3,0 3,1 Gordillo, Saül. «Marta Villegas, mestra de català de la IA - 01 oct 2024». El Punt Avui. [Consulta: 8 febrer 2025].
  4. Villegas Montserrat, Marta. "Controlled subjects in Spanish and other ""non-strictly local"" bounded dependency constructions" (tesi) (en castellà). Universitat Politècnica de Catalunya, 1998 [Consulta: 8 febrer 2025]. 
  5. «MarIA: el proyecto para enseñar español a las máquinas diseñado en Barcelona» (en castellà). Crónica Global, 06-02-2022. [Consulta: 8 febrer 2025].
  6. Neira, Pablo de Llano. «Acelerando la ciencia a 314.000 billones de operaciones por segundo» (en castellà). El País, 25-06-2022. [Consulta: 8 febrer 2025].
  7. «El entorno multilingüe español supone una oportunidad para la industria de los datos» (en castellà). El Español, 10-11-2022. [Consulta: 8 febrer 2025].
  8. «AINA, el fomento del catalán en la era digital | Actividades» (en castellà). CCCB. [Consulta: 8 febrer 2025].
  9. Press, Europa. «El Govern destina 3 millones al proyecto Aina para crear un corpus en catalán para tecnología». www.europapress.es, 15-02-2022. [Consulta: 8 febrer 2025].
  10. Pastor, Javier. «"El objetivo no es competir con ChatGPT": hablamos con los creadores de ALIA, la IA 100% española, para entender su futuro» (en castellà). Xataka, 23-01-2025. [Consulta: 8 febrer 2025].
  11. «Publicados los primeros modelos de ALIA, la familia de modelos de IA en castellano y lenguas cooficiales | España Digital 2026». espanadigital.gob.es. [Consulta: 8 febrer 2025].
  12. «Premio Ciudad de Barcelona para la investigadora Marta Villegas por los proyectos de procesamiento de lenguaje natural AINA y MarIA» (en castellà). BSC-CNS. [Consulta: 8 febrer 2025].
  13. «El proyecto MarIA del BSC, premio Archiletras de la Lengua a la innovación» (en castellà). BSC-CNS. [Consulta: 8 febrer 2025].