Tema de Viquipèdia:La taverna/Novetats

Albertvillanovadelmoral (discussiócontribucions)

Hola,

Actualment estic treballant en col·laboració amb HuggingFace: https://huggingface.co.

Un dels meus objectius personals és aconseguir una major presència del català a l'àmbit del NLP.

En l'actualitat, estem creant un gran projecte internacional de Open Science, sobre grans models de llenguatge en Open Source, creats per i per a tota la comunitat. Un dels eixos és la diversitat: un projecte multi-llengües. En principi, es vol assegurar almenys 8 llengües: Arabic (Fusha), Chinese, English, French, Hindi, Portuguese, Spanish, and Swahili. La raó per la qual us contacte és perquè trobe interessant que el català no perda aquesta oportunitat.

Altre dels eixos és evitar biaixos, mitjançant, entre d'altres, una especial cura en l'elaboració dels data-sets. Per aquest motiu estem buscant contactes amb qualsevol institució que puga ajudar-nos a tenir accés a texts ben documentats i d'alta qualitat. Jo havia pensat immediatament a la fundació Wikimedia. Què us sembla? Però a banda, és que potser podríeu donar-me el contacte d'altres persones/institucions de l'àmbit català que podria contactar?

Cordialment, Albert.

Resposta a «Projecte internacional NLP/PLN»