Vés al contingut

Tema de Viquipèdia:La taverna/Novetats

Propers passos per a l’eina de traducció

37
Pginer-WMF (discussiócontribucions)

Des del 2015 quan l’eina de traducció de continguts es va publicar com a versió beta, més de 30.000 articles s’han creat en Català usant l’eina. Aquestos representen un percentatge significatiu (sobre l’11%) de tots els articles creats a la Viquipèdia en Català des de llavors. A més a més, els indicadors de qualitat suggereixen que els articles creats amb l’eina de traducció són esborrats amb menys freqüència que aquells creats des de zero. A la Viquipèdia en Català, durant 2018 el percentatge d’articles esborrats va ser de l’1% per als articles creats amb l’eina de traducció de continguts, i del 9,5% per a la resta de nous articles. Esperem que fent l’eina de traducció accessible per a més usuaris es generen més continguts de qualitat.

Durant el darrer any hem fet nombroses millores a l’eina de traducció, i la nova versió representa una renovació significativa per proporcionar una experiència més sòlida als usuaris. En particular, la nova versió proporciona més mecanismes de control de qualitat. Ara l’eina anima els traductors a revisar la traducció automàtica inicial per a cada paràgraf, i afegeix a una categoria de seguiment aquelles traduccions publicades amb continguts sense modificar perquè els editors puguen revisar-les. Per als casos més extrems, amb un 99% o més de continguts per modificar, l’eina impedeix directament la seua publicació.

Compartiu els vostres comentaris

Mentre continuem millorant l’eina de traducció, volem saber quines considereu que són les àrees principals que necessiten més atenció abans que l’eina es pose a l’abast de més usuaris. Busquem exemples basats en la vostra experiència que il·lustren limitacions importants que us impedeixen fer bones traduccions, o us generen un treball significatiu en revisar el treball fet per altres editors amb l’eina.

Podeu compartir la vostra experiència responent en aquest mateix fil de discussió.

Moltes gràcies!

Lohen11 (discussiócontribucions)

Gràcies per l'esforç, però queda molt camí. L'únic que funciona mínimament de forma raonable és el basat en google translate. No sembla que s'hagi revisat gaire. Sense anar més lluny, hi ha alguns errors que molesten molt:

  • després de cada signe de puntuació hi ha un molest espai que s'ha de treure. El mateix passa amb el núm. d'una referència.
  • no detecta el genitiu saxó.
  • les concordances de gènere article-nom-adjectiu.
Mcapdevila (discussiócontribucions)

Totalment d'acord amb en Lohen11, només puc afegir una sugerència sobre una caracterìstica que tenia un traductor que vaig comprar fa uns 20 anys: se li podia definir el context de l'article.. P.E. traduint de l'italià si el context és d'esports "calcio" el tradueix per futbol, sinó el tradueix per "calci", vegeu el "clorur de futbol" (https://ca.wikipedia.org/w/index.php?title=Vidre_opal%C3%AD&oldid=20927877)

Lohen11 (discussiócontribucions)

Sí, estaria bé, així ja no hauria de substituir més els òrgans de les catedrals.

Pginer-WMF (discussiócontribucions)

L'eina de traducció envia als motors de traducció envia cada paragraph sencer per tractar de donar suficient context als motors de traducció. Per la nostra banda, el que tenim previst és evitar les correccions repetitives per a termes on la traducció automática falla sistemàticament en un determinat article. Es a dir, per a un article esportiu només caldria corregir "clorur de futbol" la primera vegada, i la correcció s'aplicaria automáticament les properes vegades que el servei de traducció retornara l'expresió "clorur de futbol".

Identificar correccions i el seu context és una tasca complexa (especialment si volem evitar els problemes comuns que donen alguns autocorrectors). Així que no sabem uant podrem realitzar aquestes millores, però és útil saber que aquestos problemes són comuns i coneixer la vostra experiencia.

Moltes gràcies!

Lohen11 (discussiócontribucions)

Després de cinc mesos encara no s'ha pogut treure l'espai després de cada signe de puntuació i abans del número de la referència? I el traductor encara no sap que la millor equivalència per traduir una paraula al català és a la viquipèdia catalana i no a la castellana?

Lohen11 (discussiócontribucions)
Lohen11 (discussiócontribucions)

@Pginer-WMF: és que és un desastre, ara ja no fa ni els enllaços interwikis.

Pginer-WMF (discussiócontribucions)

Hola @Lohen11,

L'eina de traducció integra serveis de traducció externs. el problema dels espais és un problema del servei de traducció de Google Translate, que hem reportat i informat el seu equip de desenvolupament. He provat un example i sembla que altres serveis de traducció no sofreixen aquesta limitació, per el que pots fer servir Apertium o Yandex per evitar aquest problema mentre Google millora el seu servei de traducció.


Sobre els enllaços interwikis, haurien de funcionar com abans. Quan hem rebut una queixa sempre ha estat un problema de la memòria cache. Si pots indicar-nos un example on els enllaços d'idioma no s'hagen creat automàticament després d'un temps significatiu, seria molt útil per a investigar-ho.


Per ultim, quan comentes que "el traductor encara no sap que la millor equivalència per traduir una paraula al català és a la viquipèdia catalana i no a la castellana", no tinc del tot clar a qué et refereixes. Si parles de la qualitat de traduccions que proporciona google Translator, és un aspecte extern a l'eina. El proposit de l'eina es facilitar l'edició d'aquestes traduccions inicials imperfectes per estalviar esforços als editors, no reemplaçar-los.


Lohen11 (discussiócontribucions)

És estrany que vingui del Google Translate perquè si ho tradueixes allà, no ho fa. Ho faig amb Google perquè els altres traductors ho fan molt pitjor. Respecte als enllaços, ja els vaig posar jo, si em torna a passar t'informo. D'acord en el fet que l'eina només ha de facilitar, però justament el que porta més feina és arreglar totes aquestes tonterietes.

Et posaré un exemple sobre l'equivalència rara: Tallinn ho tradueix com a Tallin (els castellans hi han tret una n), però en català és Tallinn. I sí, això sembla culpa del Google.

Una altra errada: quan la paraula que s'apostrofa porta enllaç intern, deixa un espai també. Això no crec que vingui de Google.

D'altra banda, amb el que Google s'arriba a aprofitar de la Viquipèdia, ja ens podrien ajudar una mica.

Lohen11 (discussiócontribucions)

Acabo de traduir Lepo Sumera, i al cap de 5 minuts d'anar refrescant, no apareixen els enllaços. Abans eren immediats. Els he acabat posant jo.

Lohen11 (discussiócontribucions)

Més, no posa la plantilla Autoritat.

Lohen11 (discussiócontribucions)

Més, els encapçalaments els comença en minúscula. Més, si el nom porta un enllaç intern, l'article no apostrofa Més, no tradueix la plantilla ORDENA

Pginer-WMF (discussiócontribucions)

Gràcies pels comentaris, @Lohen11.

L'eina integra diferents serveis de traducció (depenent dels idiomes). Aquestos serveis són projectes externs, per el que no podem influir directament en les traduccions que proporcionen. L'objectiu de l'eina de traducció és facilitar el procés de creació de nous articles prenent aquestes traduccions inicials com a base, però sempre caldrà revisar-les i fer ajustos.

Per ajudar a millorar els serveis de traducció externs, el que fem és exposar les correccions que fan els usuaris sobre les traduccions inicials. D'aquesta manera els equips que desenvolupen aquestos serveis de traducció poden fer servir les correccions per a millorar els seus projectes, i millorar aspectes gramaticals com el genitiu saxó o les concordances que comentes. Però aquestes millores no depenen de nosaltres ni són immediates.

Respecte el cas dels espais addicionals, aquest és un problema en el que estem treballant, i esperem resoldre prompte.

Medol (discussiócontribucions)

Per a mi la utilitat de l'eina de traducció és que automàticament et genera els enllaços interns als articles equivalents i que t'enllaça amb les interviquis. La traducció l'he de revisar tota des de zero i les referències les he de copiar totes des del codi de l'article original. Només que mantingués les referències sense tocar-les ja hi hauria molt de guanyat.

Paputx (discussiócontribucions)

El tema de les referències s'hauria de millorar molt, sempre surten malament. I porta molta feina refer-los. De fet, el millor és eliminar-les i fer-les de nou

Medol (discussiócontribucions)

Pel que fa a les referències, només que no fes res, o sigui que les mantingués igual que en la versió original, ja n'hi estaria infinitament millor que ara.

Pginer-WMF (discussiócontribucions)

Gràcies pels comentaris, @Pginer-WMF

Quan parles de mantindre les referències igual que a l'original, et refereixes a mantindre la informació d'aquestes a l'idioma original?

Actualment per a la majoria de referències que usen plantilles per estructurar la informació es copia la informació original, a la plantilla equivalent però sense traduir-los. Les referències que no utilitzen plantilles si que es tradueixen automaticament, i potser caldria no fer-ho si és problematic.

El problema habitual amb les referències és en el procés de copia des de l'article original a la traducció. Cada viquipèdia utilitza plantilles diferents per a estructurar la seua informació. L'eina de traducció utilitza Wikidata per trobar la plantilla equivalent a l'original, i mira les metadades (templateData) per buscar noms i alies dels paràmetres per saber on copiar la informació entre plantilles.

Estem treballant per millorar el suport a les referències i la documentació per a que les comunitats puguen incloure incloure més fàcilment les metadades corresponents. Donat el nombre de plantilles i idiomes existents, és un procés complex, però amb els vostres comentaris podem identificar els casos més comuns i comprovar que el sistema funciona adequadament per a aquestos. Així que no dubteu a reportar els problemes concrets que trobeu.

Moltes gràcies!

Medol (discussiócontribucions)

Jo preferiria mil vegades que es deixés tot igual, en l'idioma original, sí. La meva experiència és en el cas de l'anglès, i en aquest cas va bé deixar-ho tot com a l'original, potser aquest mètode en altres llengües presenta problemes.

Pginer-WMF (discussiócontribucions)

Moltes gràcies per els detalls. He creat un ticket per a que es mantingua la informació de les referències en l'idioma original.

També he trobat que l'eina de traducció no pot accedir a les metadades quan aquestes es troben a la pestanya de documentació, com sembla que ocorre a diverses plantilles. Fent que la transferència de continguts entre plantilles falle més del que cabria esperar. Així que ho he reportat, i una vegada resolt podrem avaluar de nou si es nota un millora significativa. Així que us animem a seguir compartint els vostres comentaris.

Moltes gràcies!

Flamenc (discussiócontribucions)

La traducció automàtica pot ajudar per fer un esborrany, però té molts elements problèmàtics:

  • Quan es tradueix de l'anglès, molts articles son biaixats i només utilitzen fonts disponibles en anglès, ignoren sovint estudis europeus i encara més fonts de l'ambit català.
  • Sovint es tradueixen títols de llibres i articles, que no tenen traducció publicada. Aixó dificultat trobar la font (aleshores s'ha de tornar amb prou feines a la viqui anglesa per assajar trobar-la ref correcta).
  • Quan es tracta d'obres literàries, citen sovint només la traducció anglesa. Per exemple, en l'article: Tintín al país dels soviets (l'he corregit fa uns dies) es posava la ref a la traducció en anglès, d'un original en francès, i no es mencionava la traducció oficial en català.
  • Quan es tracta de autors de l'antigüetat clàssica, cita fonts anglesos (també en la traducció), i s'ignora, per exemple,les excel·lents traduccions o edicions la Fundació Bernat Metge etc. etc.

Em dol, però la traducció automàtica només és una (petita) ajuda, hem de continuar pensant.--Flamenc (disc.) 18:24, 23 març 2019 (CET)

Pginer-WMF (discussiócontribucions)

Gràcies pels comentaris, @Flamenc.

Sembla que les referències son un dels aspectes importants a millorar. Actualment estem treballant per donar un millor support a les referències. Aquestes millores es centren a fer més robusta la transferència de referències entre idiomes. Per el que comentes, hi ha també un problema relatiu al bon ús de les referències, i com el procés de traducció requereix un esforç del traductor per evitar transferir el biaix de l'idioma original.

Aquest aspecte recau a l'area de la qualitat de la traducció i resulta més complicat que l'eina actue directament sobre ell, encra que és possible fer-ho de forma indirecta (animant a revisar les referències, detectant possibles casos problematics, etc.).

En qualsevol cas, l'objectiu de l'eina de traducció és eliminar els passos més tediosos per a que els editors usen aquest temps per a crear contingut de qualitat. No podem garantir que tots els articles creats compleixen tots els estàndards de la comunitat, però pensem que facilitant el procés de traducció un usuari pot crear una millor primera versió de l'article que la que podria obtindre amb el mateix esforç començant amb una pàgina en blanc.

Pginer-WMF (discussiócontribucions)

Moltes gràcies pels vostres comentaris, @Lohen11, @Mcapdevila, @Medol, @Paputx, @Flamenc.

En aquestes darreres setmanes hem estat treballant en diferents millores en el support a referències. Com les plantilles són diferents a cada Viquipedia, l'efecte percebut pot ser molt diferent a cada Viquipedia. Per example, sembla que les millores han estat prou visibles a la Viquipedia portuguesa.

Encara tenim previst fer més millores en aquesta area, però ens agradaria sentir les vostres impressions. Si considereu que el suport per a referències ha millorat, i que compartiu examples específics que il·lustren on cal millorar encara.

Moltes gràcies!

Medol (discussiócontribucions)

Ha millorat significativament pel que fa a les referències, i poder escollir el traductor és molt útil també. Gràcies per la feina. De moment, però, veig dues possibles millores. Algunes referències no es tradueixen i queden buides; en aquests casos convindria copiar-les de la llengua original (vegeu ref 6). Un altre problema no greu però que potser es podria millorar és que en incorporar referències automàticament des d'url de mitjans de comunicació gairebé mai apareix el nom del mitjà. Podeu veure-ho aquí.

Pginer-WMF (discussiócontribucions)

Moltes gràcies pels comentaris, @Medol. M'alegra escoltar que la situació ha millorat respecte a les referències.

Respecte als problemes que comentes, l'eina de traducció necessita identificar quins son els paràmetres equivalents entre les dues plantilles usades per les referències de cada idioma. Açò es senzill quan les dues plantilles tenen parametres amb el mateix nom (com "url"), però en molts cassos necesitarem metadades que ajuden a trobar aquestes equivelències.

Per example, per a saber que la informació del parámetre "work" de la plantilla Cite book anglesa s'ha de copiar al paràmetre "obra" de la plantilla catalana Ref-llibre, l'eina de traducció necessita que el paràmetre "obra" incloga com a alies el terme "work" en les metadades de la plantilla (templateData).

Els editors podeu afegir metadades, anant a la pestanya de "Documentació" de la plantilla, i al editar seleccionar la opció de "Gestionar templateData". Allí, per a cada paràmetre podeu afegir un alias per al nom del paràmetre equivalent en un altre idioma per facilitar la traducció (aquest diff és un example d'aquestos canvis). Per a que els canvis tinguen efecte, a més de guardar la pàgina de documentació, cal també guardar la pàgina principal de la plantilla per forçar que les metadades s'actualitzen.

Aquest és un procés un tant complex, però pot ajustar a millorar el support per a les plantilles més comuns. En els nostres plans està millorar el suport automatic, facilitar la manera de contribuir per a la comunitat, millorar la documentació, i per als casos on no es puguen traduir les referències fer més evident que hi ha problemes a resoldre per part del traductor.

Respecte al support de la plantilla Ref-web que menciones al example, sembla que les metadades sí que estan a la documentació de l a plantilla (per example, el camp "editor" inclou els alias per a "publisher" i "website"), però faltaria forçar l'actualització de la plantilla per a que les noves metadades tinguen efecte. Només cladria accedir a la pàgina de la plantilla, accedir a la opció de editar i guardar els canvis afegint un resum (no cal modificar els continguts). Això sí, caldrà que ho faça algú amb els permisos necessaris, ja que la plantilla està protegida.


Si tens qualsevol dubte, no dubtes en compartir-lo.


Alvaro Vidal-Abarca (discussiócontribucions)

Ara fa un temps que faig servir ContentTranslation per a la generació d'articles sobre matemàtiques i, tot i que és una gran ajuda per general els enllaços cap a d'altres articles, i les traduccions dels textos és bona (encara que millorable), em trobo sovint amb problemes quan es tracta de fórmules matemàtiques en TeX. L'eina tradueix indegudament directrius com "\begin{xxx}" per "\comença{xxx}", cosa que no hauria de succeir, ja que es tracta de directrius i comandes del propi llenguatge del TeX. A més, les fórmules en un text acabat de traduir apareixen fora de la seva posició (per exemple, al final d'un paràgraf, en comptes d'enmig d'una frase), i sovint no s'actualitza el resultat del renderitzat d'una fórmula quan s'edita; cal afegir-hi espais en blanc per tal que se n'actualitzi el resultat.

Tot i això, continuo utilitzant l'eina de traducció perquè entenc que té molt potencial per ajudar els editors. Bona feina!

Pginer-WMF (discussiócontribucions)

Moltes gràcies pels comentaris positius, @Alvaro Vidal-Abarca.

Respecte a les fórmules matemàtiques ha reportat aquest problema per a millorar el suport. En les meues proves, el codi font es mostra a l'editor de traduccions quan no ho hauria de fer, i aquest inclou també alguns elements traduits que no ho haurien de estar. Però aquestes traduccions inesperades no s'apliquen al contingut real de la formula quan aquesta s'inspecciona o es publica.

Si tens algun example on el problema afecte realment els continguts, no dubtes en compartir-lo i l'investigarem. En qualsevol cas, el comportament actual genera confusió que cal evitar.

Moltes gràcies!

Alvaro Vidal-Abarca (discussiócontribucions)

Hola de nou,

ara m'he trobat un altre cop amb un error recurrent:

  1. faig clic per tal que l'eina de traducció importi a l'idioma destinació un paràgraf que només consta d'una fórmula
  2. modifico la fórmula en l'idioma destinació
  3. treballo en altres paràgrafs
  4. l'eina diu que s'ha desat
  5. però quan tanco i torno a obrir l'eina de traducció, veig que la fórmula no ha mantingut les modificacions que li havia fet, sinó que té exactament el mateix contingut que quan es va importar directament des de l'idioma origen.

Ara mateix em passa amb l'article en:Augmented matrix, que vull traduir com ca:Matriu ampliada (ContentTranslation). En el 3r paràgraf hi ha una fórmula amb dues matrius delimitades per "["claudàtors"]" (\begin{bmatrix}...\end{bmatrix}), quan de fet vull respectar el costum català i espanyol de delimitar per "("parèntesis")" (\begin{pmatrix}...\end{pmatrix}).

Alguna ajuda? Gràcies!

Pginer-WMF (discussiócontribucions)

Moltes gràcies pel comentari.

Aquesta és una limitació actual de l'eina. La extensió Math no emet els events necessaris per identificar els canvis en aquest contingut. Aquest tiquet captura la incidència per poder fer el seguiment i investigar-lo amb més detall.

En general tractem de donat prioritat a les millores generals, però també volem revisar alguns tipus de contingut especific com és el cas de les fórmules matemàtiques próximament.

Lohen11 (discussiócontribucions)
Pginer-WMF (discussiócontribucions)

Gràcies pel comentari, @Lohen11.

Actualment estem millorant el procés de restaurar traduccions. Un dels canvis ens ha donat problemes a l'hora de restaurar certes traduccions i hauria d'estar ja resolt en les pròximes hores. Prova a publicar de nou la traducció i confirma'ns si funciona finalment.

Moltes gràcies

Lohen11 (discussiócontribucions)

Gràcies Pau, ja funciona!

Lohen11 (discussiócontribucions)

Quan tradueixes un article parcialment en una pàgina d'usuari, ara s'emporta les iw a la pàgina d'usuari, abans no ho feia.

Lohen11 (discussiócontribucions)

No et vull desanimar, però crec que anem de mal en pitjor. Refer aquesta traducció costa més que fer-la sense l'eina. Mira. I ja m'hi havia passat una bona estona dins de l'eina.

Pginer-WMF (discussiócontribucions)

@Lohen11, he estat mirant els problemes que comentes.

Respecte a la creació dels enllaços entre idiomes a pàgines creades a l'espai d'usuari he fet proves i no ho he pogut reproduir. Si tens algun example específic o has vist que ocorre en més caoss ens interessaria aquesta informació.


Respecte a la traducció de The Deer's Cry, l'article original conté un tipus particular de referència que no té un bon support ara mateix. En aquest article les referències s'inclouen pel seu nom, i la seua definició es troba dins de la plantilla que genera la llista de referències.

De moment aquestes referències no poden ser editades amb l'editor visual, i l'eina de traducció (que usa la mateixa superficie d'edició) no te visibilitat sobre aquestes. Aquesta és una limitació coneguda de l'editor visual. He afegit un comentari al ticket per veure si es pot millorar el suport al menys per als casos més comuns.

En qualsevol cas, considerem aquest un cas particular de referència que esperem poder millorar en un futur, però no hauria de ser representatiu del suport general per a les referències de l'eina.

Moltes gràcies pels comentaris!


Mcapdevila (discussiócontribucions)

Congratulations! per la tasca realitzada, avui el traductor permet fer traduccions de de força qualitat mira p.e. Sistema fotovoltaic fet de forma indirecta peró és la traducció sortida de "Special:ContentTranslation"

Mancances principals que hi trobo:

*No trasllada bé les <math expressions> no cal trencar-se el cap, es re-copien de l'original i ja està!, ja es corregirà el que calgui desprès

*El visual editor (ja sé que és una eina a part) hauria de tenir (igual que té el wikED) un històric de les paraules tant cercades com reemplaçades .. he fet una captura de pantalla per poder veure-ho millor

Gràcies per tot

Ah!..., propòsit del visual editor, tot i que un administrador que era a Gdansk va tenir els nassos de negar-ho davant d'un grup de persones tinc el testimoni de varis centenars de persones que em van sentir..

Ah!... per si no t'ho havien dit els que estaven presents a l'assemblea de Gdansk (wikimania-2010), et passo el meu speech (i arguments) amb el Jim Wales, davat d'uns quants centenars de wikipedistes (entre ells en Gomà, en Carles i en Pau) que com s'ha vist amb la creació del visual editor, crec que el va convèncer:

Hi Jim, congratulations for "wikitext",  you have achieved a great language much easier to learn to edit than the cumbersome "hypertext", but today there are plenty of "wysiwyg" editors for "hypertext" and none for "wikitext", wich represent its main drawback to be used by "full of knowledge" lawyers, architects, writers of my generation unable to become..ever.. "skilled wikitext editors".. , nevertheless they are able to edit  with "wysiwyg" editors like "word", etc..Back in 1987 I saw at Macworld-Boston (as a member of Apple Spain) the presentation of "Hypercard" wich gave birth a bit later to the "Berners-Lee hypertext", very complicated and difficult to edit (impossible for non professionals..) but boom!, the 20 following years gave birth to hundreds of "wysiwyg" editors for "hypertext", making it usable by everybody professional or not not..That's what Wikipedia needs, a "wysiwyg" editor able to be used not only by newcomers (a newcomer arrives to be a skilled editor in a couple of weeks..) but by anyone else specially the "professionals of a certain age with great knowledge" I've mentioned before, that will end their editing days without becoming "skilled wikitext editors"...

Jimbo answer: so we are losing a big amount of "full of knowledge" lawyers, architects, writers, etc.. that will never be.. "skilled wikitext editors".. don't worry ..we will have a "visual editor" in two years time..by 2012...

I..encara que amb una mica de retard a complert la seva paraula...

Aixó no m'ho ha agraït ningú..--~~~~

Lohen11 (discussiócontribucions)

Sembla que ens han deixat amb la paraula a la boca... l'última del traductor: tradueix "opera" per "Operapera", sembla que se'n fotin.

Resposta a «Propers passos per a l’eina de traducció»