Tema de Viquipèdia:La taverna/Novetats

Moure l’eina de traducció a les preferències

28
Pginer-WMF (discussiócontribucions)

L’eina de traducció ha donat suport a la Viquipèdia en català de forma satisfactòria els darrers anys. Pròximament tenim previst moure la seva configuració des de la secció “beta” a les preferències generals, activant-la per defecte per als usuaris registrats. Els editors trobaran l’accés a l’eina a la pàgina de “contribucions”, i podran desactivar-la des de la pàgina de preferències. Amb aquest canvi, no caldrà activar l’eina a la secció “beta” abans d’usar-la, com fins ara.

Volem començar el procés de migració per posar l’eina a disposició de més usuaris. Després d’una conversa inicial per escoltar la vostra experiència amb l’eina tenim previst fer diverses millores, però volem animar-vos a compartir qualsevol consideració sobre la proposta abans de que l’eina es pose a l’abast de més usuaris. Podeu compartir els vostres comentaris responent en aquest mateix fil de discussió.

Com a part d’aquest procés, observarem amb especial atenció l’impacte en termes de continguts creats, el percentatge d’articles esborrats, i els comentaris dels usuaris.

Moltes gràcies!

Pacopac (discussiócontribucions)

Em sembla molt bé que no s'haja d'activar i que vinga per defecte ;-)

Joutbis (discussiócontribucions)

Home no fotem. Jo de fet la restringiria a només els pocs usuaris que han demostrat que són capaços de repassar el llenguatge incomprensible que generen els traductors automàtics. Dóna un cop d'ull a Categoria:Articles amb traducció per millorar, no en necessitem més.

Jo crec que una de les missions de la Viquipèdia en català hauria de ser conservar una llengua de qualitat. Això és especialment important en el context d'una llengua minoritzada, que es va castellanitzant, i els resultats del Content Translator són catanyol. Pocs pronoms febles s'hi veuen.

Això, en el millor dels casos; de traduccions creatives, n'hi ha unes quantes, i a Viquipèdia:Anecdotari n'hi trobaràs unes quantes més.

Per no parlar dels continus bugs, fent coses estranyes amb els enllaços (últimament, passa bastant que l'enllaç està bé, però el text que s'ensenya no), com aquí. No sé quina mena de proves es fan abans de passar codi a producció.

Fa temps vaig fer un post llarguíssim explicant els problemes que hi havia, i no em van fer cap cas. Aquí a la taverna hi va haver una discussió animada, i l'eina no quedava gens bé.

Resumint, una de les tasques que em fan més ràbia d'editar la viquipèdia és veure traduccions d'aquestes sense revisar. Només ens faltaria augmentar-ho. Estic rotundament en contra de fomentar-ho.

Amadalvarez (discussiócontribucions)

Subscric el punt de vista del @Joutbis.

Jo fa un parell d'anys que vaig deixar de fer-la servir i, des de llavors, no he trobat ningú que en parli satisfactòriament.

A banda dels aspectes lingüístics (que no és un tema menor), continuen sense resoldre's correctament les referències i cal fer un esforç en revisar / corregir, que només aborda la gent amb vocació i paciència.

Una generalització del seu ús sense límits provocarà una caiguda de la qualitat sense tenir arguments contra qui no hagi tingut cura de revisar resultats, ja que s'assumeix que una eina en producció ha d'anar bé.

Pginer-WMF (discussiócontribucions)

Moltes gràcies pels comentaris.

Durant l'últim any hem estat millorant l'eina de traducció per a donar suport a molts dels aspectes que @Joutbis i @Amadalvarez comenteu, i podem ajustar el seu funcionament encara més a les necessitats de la comunitat, però necessitem més informació sobre problemes específics, i les vostres recomanacions sobre els possibles ajustos. Part d'aquest procés busca justament això. Ho detalle a continuació per a cada aspecte:


Referències

El problema habitual amb les referències es produeix en el procés de copia des de l'article original a la traducció. Cada viquipèdia utilitza plantilles diferents per a estructurar la seua informació. L'eina de traducció utilitza Wikidata per trobar la plantilla equivalent a l'original, i mira les metadades (templateData) per buscar noms i alies dels paràmetres per saber on copiar la informació entre plantilles.

La comunitat d'editors pot ajudar a millorar el suport emplenant les metadades de les plantilles més freqüents. Per example, aquest canvi a les metadades de la plantilla Ref-llibre ha permés l'eina de traucció saber que la informació al camp "publisher" de la plantilla anglesa cal copiar-la al camp "editorial" quan es tradueix al català.

Per el que comentaven els editors a l'anterior conversa, el suport a les referències havia millorat significativament les darreres setmanes, i encara tenim previstes fer més millores sobre el tractament de les referències.

Donat el nombre de plantilles i idiomes existents, aquest és un procés complex, però amb els vostres comentaris podem identificar els casos més comuns i comprovar si el sistema funciona adequadament per a aquestos.


Traduccions sense prou modificacions

L'eina de traducció disposa d'un sistema per garantir que les traduccions inicials es modifiquen de forma suficient. Aquestos limits es poden ajustar segons les necessitats de cada comunitat, i impedir la publicació d'articles que superen un cert percentatge de traduccions automátiques sense modificar. Per example, recentment hem fet més estricte el límit per a les traduccions a indonesi, i membres de la comunitat indonesa ens han confirmat que ha solucionat el seu problema amb les traduccions problemátiques que rebíen.

Podem ajustar els limits per a reduïr el nombre de traduccions problemàtiques. Però com a part del procés d'ajust, necessitem identificar el percentage de modificacions adequat i posar-lo a prova amb diferents tipus d'articles.

Per al cas del català, les nostres observacions no ens han alertat de res alarmant en quant a la qualitat del contingut. Durant 2018 el percentatge d’articles esborrats va ser de l’1% per als articles creats amb l’eina de traducció de continguts, i del 9,5% per a la resta de nous articles. Sobre la categoria de traduccions a revisar, sembla que hi ha unes 15-20 traduccions a revisar per a cada mes, tenint en compte que se'n publiquen més de 400 amb l'eina de traducció normalment, els articles a la categoria representarien un 5%. Però els números només conten una part de la història, i estem oberts a ajustar els límits per millorar la qualitat del contingut creat.


Traducció errònia de paraules concretes

L'eina de traducció integra serveis de traducció externs, i no podem fer massa per millorar aquestos directament. El que hem tractat és de proporcionar més opcions, com Google Translate.

Per al cas del català, actualment oferim per defecte Apertium per tractar-se d'un servei lliure, però si considereu que un altre servei com Google Translate pot proporcionar millors traduccions inicials per a alguna combinació d'idiomes podem marcar-lo com al servei per defecte. Com he comentat abans, exigir als usuaris un major percentatge de modificacions sobre aquestes traduccions inicials pot ajudar a que aquestes es revisen amb més detall i es corregisquen les traducciones problemàtiques.

A més a més, Apertium opera només amb text pla, el que fa que el procés d'afegir els enllaços de nou al seu lloc sobre la traducció siga menys estable comparat amb els altres serveis que treballen directament sobre HTML.

Actualment les dades de traduccions i els canvis dels usuaris ja s'exporten per a que els responsables dels serveis de traducció puguen millorar-los, i tenim previst evitar les correccions repetitives per a termes on la traducció automática falla sistemàticament en un determinat article.

Paputx (discussiócontribucions)

També crec que encara no s'ha de fer el canvi. Hem de poder avaluar si els canvis que ara s'han fet redueixen els articles amb nul·la qualitat.

Pginer-WMF (discussiócontribucions)

Clar que sí, @Paputx. Amb la conversa inicial i amb aquesta us animem a provar l'eina, observar el contingut creat amb aquesta i compartir les vostres impressions. Els vostres comentaris ens permeten identificar la llista de les millores absolutament necessaries abans de proporcionar access a l'eina per defecte. D'aquesta manera només considerarem fer el canvi quan aquestes queden resoltes.

Disculpeu si el missatge original donava una sensació d'imminència, pero despres de les millores confirmades a la conversa inicial sobre el suport a referències em feia la impressió que estavem un poc més avançats en el procés. En qualsevol cas, per aquest procés necessitem les vostres impressions i recomanacions per ajustar el funcionament de l'eina.

Moltes gràcies!

Noemiroig (discussiócontribucions)

Hola!

Potser una solució a mig camí és incloure informació a la pròpia eina de traducció sobre com solucionar d'una manera fàcil problemes com el de les referències. O posar més èmfasi en que cal repassar.

Avui mateix he fet servir l'eina per traduir i és cert que és molt més intuïtiva que fa un anys, tot i així potser caldrien més tips/missatges insistint en la qualitat del text final o el tema de les referències abans de fer-la més visible a viquipedistes novells.

Pginer-WMF (discussiócontribucions)

Gràcies pel comentari, @Noemiroig.

Respecte el que comentes, estem treballant en fer més visible els casos on una referència queda buida per problemes amb les referències, així com quan aquesta queda incompleta restant un paràmetre obligatori.

També estem millorant la documentació d'usuari en general, incloent aspectes com el funcionament dels diferents límits per garantir que els usuaris revisen les traduccions. Tenim previst també documentar com els editors poden millorar les metadades de les plantilles per fer-les més fàcils de traduïr.

Qualsevol altra idea en aquest àmbit ens interessa. Així que no dubtes en compartir qualsevol sugeriment, o algún cas concret que hages trobat on es puga millorar el suport.

Moltes gràcies!

KRLS (discussiócontribucions)

Si una eina ja no es troba en un estat Beta no hauria de quedar-se eternament en aquella pestanya. Llavors, sí o sí s'hauria de traslladar a les preferències de l'usuari. Una altre qüestió i si la comunitat està d'acord en activar per defecte aquesta eina o no. Jo penso que s'hauria d'activar per defecte a tots els usuaris registrats, perquè l'eina em sembla suficientment madura i les traduccions molt deficients no impliquen un gran percentatge del total (l'opció d'usuarificar s'ha estès). Crec que hem d'intentar ser menys conservadors a l'hora de donar eines als nous usuaris per tal de minimitzar la seva corba d'aprenentatge (aramateix segueix sent molt alta).

Paputx (discussiócontribucions)

M'has fet pensar. I crec que tens raó. Amb aquesta eina és redueix molt la corba d'aprenentatge. Encara que a vegades s'utilitzi malament si ajuda augmentar els viquipedistes val la pena. Tot i això, per mi és fàcil opinar perquè quasi bé mai em dedico a arreglar articles desastre

Joutbis (discussiócontribucions)

El que passa és que aquesta eina està molt lluny de l'estat beta. Beta és quan l'eina és utilitzable per usuaris experts, i pot tenir algun error menor que s'ha de polir abans de posar-lo a públic. El Content Translator per al català no ha passat mai d'alfa. A continuació argumentaré per què. Potser se'm farà una mica llarg i ho partiré en dos, aviso.

Primer, ens centrarem només amb la traducció en si. Imaginem (amb un esforç sobrehumà) que la part de sintaxi viquipedista està fina. Heu provat mai el llenguatge que proposa l'eina? Si ve d'una llengua no llatina, no s'entén absolutament res. Només és mig comprensible si ve del castellà, però llavors és pur catanyol. Utilitzar les estadístiques d'articles esborrats i les plantilles de millora com a mesura de la qualitat dels articles és penós. Potser et pot servir per llengües que no coneguis, però el català és la teva llengua, no t'autoenganyis, si us plau. Potser és que ja estem farts de posar plantilles i corregir animalades com times-estafis, i mead-pixeu.

I és que, com és normal, l'esforç en millorar traduccions automàtiques es farà primer en llengües amb molts parlants i amb un estat al darrere. Així, el català no serà de les primeres llengües que tingui una bona traducció automàtica.

Entenc que us ha anat bé la Viquipèdia com a conillet d'Índies, perquè tenim pocs editors, i per tant una política molt estricta de no mossegar els nouvinguts, però el Content Translator serà útil primer en llengües que tinguin un bon traductor, i el català no és d'aquestes.

Per tant, si us plau, escolteu una mica els suggeriments que fa la comunitat, i implementeu recursos per limitar l'accés a aquesta eina, que no és beta, sinó alfa, i li falta un bon bull per arribar a beta: per exemple, limitacions de quins usuaris poden utilitzar l'eina, i des de quines llengües: jo, per exemple, puc arribar a fer bones traduccions des de l'anglès i el francès, però si ho intento des del rus o l'urdu, quedarà un bunyol. I hi ha usuaris que no saben idiomes, i que per tant, no han de poder fer traduccions automàtiques.

Joutbis (discussiócontribucions)

I ara, parlem del que fa l'eina en si, que hauria de gestionar la sintaxi wiki, bàsicament enllaços, plantilles i referències. Aquí la culpa no és d'Apertium ni de Google Translate, sinó del desenvolupament que es fa. I això fa posar els pèls de punta, i em suggereix que no s'han seguit mai uns mínims principis d'enginyeria de programari. Més avall hi ha un exemple ben recent d'en Lohen11, aquest. Com pot ser que això passi un mínim joc de proves? Quin procés es fa servir per posar els canvis a producció? Estem en una versió alfa, indubtablement.

És que amb tot surten problemes:

  • enllaços: la part que et dóna més pistes. Segueixes un interwiki, i pots estar segur de la traducció bona. Llavors, perquè moltes vegades al text hi surt el text en l'idioma original?
  • plantilles: hem passat anys amb una plaga d'Error en el títol o la URL. Encara ara passen coses. Per què?
  • referències: tradicionalment, han omplert el codi wiki de tags totalment innecessaris que fan que l'edició sigui difícil per als experts i impossible per als novells. Vegeu l'exemple d'en Lohen11 més amunt.

De veritat que aquests errors no es podien haver detectat en proves, abans de passar-los a la comunitat?

Jo, que sí que em dedico sobretot al manteniment, estic molt fart dels bunyols del Content Translator, tant a nivell de llengua com de sintaxi wiki. És l'única cosa que de vegades em fa plantejar d'engegar-ho tot a rodar. Si alguna cosa no necessita la viquipèdia, és empitjorar en qualitat.

A més, si les úniques traduccions mig potables venen de la viquipèdia en castellà, tampoc no hi trobo gaire valor afegit. Al final, la majoria de catalanoparlants també el sabem i hi podem anar directes. Seria interessant un bon traductor automàtic des de l'anglès, perquè la viquipèdia en anglès té infinitament més qualitat, però de moment la tecnologia no acompanya.

Us demanaria que prioritzéssiu l'aplicació del Content Translator a altres llengües. Potser no seran tan tolerants amb les pífies de programació, però això us ajudarà a millorar. Reviseu el codi que genera l'eina. Escolteu la comunitat, accepteu les seves crítiques i implementeu les seves propostes. Quan la tecnologia estigui madura, parlem de posar-ho com a eina estàndard. Però el que no podeu fer és passar de nosaltres durant anys, i ara venir a posar-ho en producció com si no hagués passat res.

Pginer-WMF (discussiócontribucions)

@Joutbis, rsponc als diferents comentaris:


Primer, ens centrarem només amb la traducció en si. Imaginem (amb un esforç sobrehumà) que la part de sintaxi viquipedista està fina. Heu provat mai el llenguatge que proposa l'eina?

La traducció automàtica no té prou qualitat per ser usada directament, això crec que ningú ho discuteix. Però aquest és justament el propòsit de l'eina de traducció: permetre usar la traducció inicial com base per millorar-la. Hi ha editors a qui els resulta útil i en fan un bon ús, i d'altres no. Tenir integrats els serveis de traducció ens permet mesurar quant s'editen els continguts inicials i instar als editors a revisar més el contingut per incentivar el bon ús.


Utilitzar les estadístiques d'articles esborrats i les plantilles de millora com a mesura de la qualitat dels articles és penós. Potser et pot servir per llengües que no coneguis, però el català és la teva llengua, no t'autoenganyis, si us plau.

Jo no considere penós mirar les estadístiques. Les estadístiques, tot i les seues limitacions, ajuden a tindre una perspectiva general, més enllà dels casos individuals (que també cal analitzar). Si et dediques a revisar molts articles nous, estic segur que tens una perspectiva molt útil, però cal entendre que aquesta pot ser diferent a la que tenen altres usuaris participant a la comunitat en diferents rols.

Jo he vist articles bons i no tan bons creats amb tot tipus d'eines d'edició. Amb tota eina de creació anem a trobar-nos usuaris que no en facen un bon ús, i és el que hem d'intentar minimitzar. El que intentava comparant els esborrats d'articles creats amb altres editors era tractar d'establir una línia de base. Es a dir, respondre a la pregunta de si un editor inexpert crea un article millor o pitjor quan ho fa amb l'eina de traducció o amb l'editor estàndar.


Per tant, si us plau, escolteu una mica els suggeriments que fa la comunitat, i implementeu recursos per limitar l'accés a aquesta eina

Estem escoltant els sugeriments. L'eina de traducció està disponible a les més de 300 Viquipedies. Durant l'ultim any l'eina s'ha actualitat significativament per donar resposta a aspecte importants que hem identificat amb la colaboració de les diferents comunitats.

En particular, s'ha implementat un sistema de limits per a garantir que les traduccions s'editen adequadament. Aquestos limits poden ajustar-se a les necessitats de cada comunitat i fer-los mes estrictes si cal. Per example, recentment hem fet més estricte el límit per a les traduccions a indonesi, i membres de la comunitat indonesa ens han confirmat que ha solucionat el seu problema amb les traduccions problemátiques que rebíen.


Més avall hi ha un exemple ben recent d'en Lohen11, aquest. Com pot ser que això passi un mínim joc de proves? Quin procés es fa servir per posar els canvis a producció?

Aquest problema en particular ve d'una limitació de l'editor visual per a un tipus concret de referències (més detalls). Més avall parle de la complexitat de suportar les plantilles, però per a cada cas que es resol s'amplia el banc de proves per evitar regressions.


enllaços: la part que et dóna més pistes. Segueixes un interwiki, i pots estar segur de la traducció bona. Llavors, perquè moltes vegades al text hi surt el text en l'idioma original?

L'eina fa servir Wikidata, per el que els enllaços haurien d'apuntar a l'article corresponent. Caldria analitzar els casos concrets per determinar si aquestos estan dins d'alguna plantilla o un continut més complex.


plantilles: hem passat anys amb una plaga d'Error en el títol o la URL. Encara ara passen coses. Per què?

Les plantilles es defineixen individualment a cada wiki, i això fa complicat saber com copiar els paràmeters d'una plantilla als de la seua plantilla equivalent en un altre idioma. L'eina utilitza les metadades de les plantilles per trobar aquestes equivalències, però de vegades no es pot trobar l'equivalència i la informació queda incompleta. La comunitat d'editors pot ajudar a millorar el suport emplenant les metadades de les plantilles més freqüents. Per example, aquest canvi a les metadades de la plantilla Ref-llibre ha permés l'eina de traucció saber que la informació al camp "publisher" de la plantilla anglesa cal copiar-la al camp "editorial" quan es tradueix al català.

Ja hem fet diverses millores en aquest aspecte a partir dels comentaris de les diferents comunitats, i hem rebut confirmació de que les millores s'han notat per part dels editors. Tot i això tenim previst millorar tant el mecanisme automàtic com la comunicació quan aquest falla.


referències: tradicionalment, han omplert el codi wiki de tags totalment innecessaris que fan que l'edició sigui difícil per als experts i impossible per als novells. Vegeu l'exemple d'en Lohen11 més amunt.

Molts dels problemes amb les referències son un cas particular del suport a plantilles. Les referències usen plantilles per estructurar la informació, i aquestes son diferents a cada idioma, per el que copar-ne la informació no sempre és fàcil. Per example, en el cas que comentes es tracta d'una referència que no inclou els detalls directament ja que aquestos s defineixen dins d'una altra plantilla.


Us demanaria que prioritzéssiu l'aplicació del Content Translator a altres llengües. Potser no seran tan tolerants amb les pífies de programació, però això us ajudarà a millorar. Reviseu el codi que genera l'eina. Escolteu la comunitat, accepteu les seves crítiques i implementeu les seves propostes. Quan la tecnologia estigui madura, parlem de posar-ho com a eina estàndard. Però el que no podeu fer és passar de nosaltres durant anys, i ara venir a posar-ho en producció com si no hagués passat res.

L'eina de traducció està present ja a totes les llengües. Cada una té les seues necessitats particulars, i esperem que amb processos com aquest pugam identificar les àrees més importants a millorar amb examples concrets que ens permeten investigar l'arrel de cada problema.


Pginer-WMF (discussiócontribucions)

Per facilitar l'anàlisi del contingut creat recentment amb l'eina de traducció he recopilat totes les traduccions que es van completar ahir (3 de juny). He inclós el percentage de traducció automàtica que contenien aquestes quan es van publicar i el servei de traducció utilitzat:

  • Mecanobiologia. Traducció del castellà fent servir Apertium i modificant el 98% dels continguts de la traducció inicial (un 2% de traducció automàtica sense modificar).
  • Ruïnes de Caparra. Traducció de l'anglés fent servir Apertium i modificant el 78% dels continguts de la traducció inicial (un 22% de traducció automàtica sense modificar).
  • Paul DeBach. Traducció de l'anglés fent servir Apertium i modificant el 67% dels continguts de la traducció inicial (un 33% de traducció automàtica sense modificar).
  • Garamut. Traducció de l'alemany fent servir Google Translate i modificant el 95% dels continguts de la traducció inicial (un 5% de traducció automàtica sense modificar).
  • Cartes i escrits de Georg Friedrich Händel. Traducció del castellà fent servir Apertium i modificant el 58% dels continguts de la traducció inicial (un 42% de traducció automàtica sense modificar).


Vagent el contingut creat penseu que caldrien alguns del següents adjusts?

Cal tenir en compte que aquesta és només una mostra recent del darrer dia i caldria fer un estudi més exhaustiu, però aquesta mostra pot ser util per començar a definir hipòtesi a verificar posteriorment.

Pginer-WMF (discussiócontribucions)

Ha passat una setmana des de que vaig recopilar la mostra d'articles del missatge anterior. Cap ha estat esborrat i generalment gran part de les correccions posteriors les han realitzades els propis usuaris que van crear l'article. tots els articles creats amb l'eina de traducció el dia de la mostra semblen contribucions positives. @Joutbis, @Paputx, @Amadalvarez, alguna observació al respecte que sen's haja pogut passar?

Podem repetir i ampliar la mostra, per tenir una millor idea de la situació general. Però primer volia comprovar la utilitat de la primera mostra. Moltes gràcies!

Amadalvarez (discussiócontribucions)

@Pginer-WMF Disculpa però no he pogut comprovar-ho. Aquests dies estic capficat amb un altre tema. Delego la decisió en els companys més actius amb el CT. Gràcies per tenir-nos presents si surten nous incidents.

Joutbis (discussiócontribucions)

A veure, és que aquestes coses van i vénen. Com que no sabem en quin estat està l'eina, ni quins canvis s'hi apliquen, i quan entren o surten, costa de dir. Aquest cap de setmana he estat arreglant referències. Pel que he observat (però és que no sempre és igual), té tendència a repetir tot el text de la referència quan només hi hauria de fer una menció. I fins i tot llavors, de vegades falla i només posa la crida sense paràmetres, a l'estil {{ref-notícia}}. Llavors surten molts errors de "referència amb contingut diferent". Alguns usuaris veig que repassen força la llengua i llavors queda llegible, però la part de sintaxi queda feta un coca, i això sí que és plenament imputable a l'eina. Per una destrossa notable, mira't Animals de gran altitud.

Per mi li falta molt per estar en producció. Aquests bugs que vénen i van són indicatius de codi no estable. Com a suggeriment, jo agafaria alguns dels usuaris habituals de l'eina, i faria un seguiment dels seus articles, i veure el codi wiki que ha generat l'eina. Mentre no sigui comparable amb el de la traducció original, no heu acabat. I els canvis, controlats i poquet a poquet. Fer proves de regressió, que arreglant una cosa no en trenquis una altra, ...

Una altra cosa que molesta molt és quan agafa una plantilla de l'altra wiki que no té un equivalent a la nostra, i simplement l'expandeix, amb tots els tags HTML per allà al mig, amb enllaços en llocs insospitats i amb molts enllaços vermells sense traduir. Un exemple a Tomba de corredor en tascó que és traducció de es:Tumba de corredor en cuña.

Més coses: molt sovint hi ha enllaços que passen a ser enllaços a la wiki original. Mira Guerra d'Itàlia de 1551-1559. Passa amb els enllaços màgics ISBN, però també amb d'altres, com els que van a Cambridge University Press

Per això us dic que necessiteu ampliar la mostra i anar a altres wikis. Això no arriba a beta, ho sento.

Joutbis (discussiócontribucions)

Ah, i aquesta és vella, però tot un clàssic: destrossar URL's, inserint-hi espais i traduint-les. Mira aquest canvi. i prova a veure si la URL que diu "sistema-operativo/android-go-edition-la-version-ultraligera-de-android-oreig-per-mòbils-amb-poca-memòria-ram-és-oficial" funciona...

Pginer-WMF (discussiócontribucions)

Gràcies pels comentaris, @Joutbis.

Respecte a la aparent inestabilitat, aquesta es produeix per la gran quantitat de plantilles, i formes d'ús d'aquestes. Ja disposem d'un banc de proves que s'apliquen automàticament i anem ampliant amb més examples per evitar regressions.


He recreat l'example dels "Animals de gran altitud". Les metadades afegides a la plantilla Ref-publicació (amb aquesta edició) han permés l'eina de traducció trobar els paràmetres equivalents en la majoria de casos. He provat a publicar una versió de la traducció l'article només amb les referències. De les 70 referències he trobat els següents problemes:

  • Tres errors (referències 18, 24, i 58) per referències que es reusen en múltiples llocs i no haurien d'incloure la informació de la referència, com ja hem comentat abans.
  • Dos errors (referències 5 i 6 )que apareixen buides per usar una plantilla Ref-notícia on no hi ha metadades (pots comprovar l'opció "Gestiona TemplateData" ací) per poder copiar els paràmetres de l'original Cita_noticia.


A continuació més detalls sobre cadascun dels problemes:


Referències que es reusen en múltiples llocs. Aquest problema, descrit en aquest ticket, el tenim a la llista d'aspectes a resoldre abans d'exposar l'eina a més usuaris. La complicació ve pel fet de que les referències (tant la que conté les dades com les que hi fan referencia a aquesta) poden afegir-se o no a la traducció, complicant la casuistica. Però és un problema a resoldre en qualsevol cas.


Referències basades en plantilles on falten metadades per poder copiar els seus paràmetres.

En aquest cas, per a que el sistema funcione correctament necessitem que la comunitat connecte les plantilles equivalents a Wikidata i proporcione les metadades necessaries. En aquest cas sembla que la plantilla Ref-notícia ha quedat obsoleta (en favor de Ref-publicació), i potser caldria connectar a Wikidata les plantilles Cita_noticia i Ref-publicació per a que siga aquesta última la que es cree al traduïr la primera. Això, o proporcionar les metadades a Ref-notícia per a que els paràmetres puguen copiar-se.

En qualsevol cas, no s'hauria de generar una plantilla buida i estem treballant per a detectar aquestos casos i evitar incloure la referència buida quan no es puga convertir (més detalls). Aquesta també es una millora a resoldre abans d'exposar l'eina a més usuaris.

___

La resta d'errors que comentes els he d'analitzar amb més detall. Però respecte el tema de les referències i les plantilles el que volia transmetre és hi ha més factors dels que sembla a simple vista, per el que és important compartir els detalls dels problems el més específic possible (gracies de nou!), i que estem d'acord en considerar aquestes millores essencials abans d'exposar l'eina a més usuaris.


Pginer-WMF (discussiócontribucions)

A partir dels exemples de @Joutbis hem identificat les següents millores a realitzar:

Respecte el cas dels enllaços ISBN, aquestos formen part dels magic links per als que hi ha una proposta per a considerar-los obsolets i usar plantilles en el seu lloc. En quant a Cambridge University Press no he trobat cap example, però si en teniu algun a mà, puc investigar-lo amb més detall.

@Joutbis, seria aquesta una bona llista dels problemes fonamentals a resoldre?

Moltes gràcies pels comentaris, i no dubtes compartir-ne més.

Joutbis (discussiócontribucions)

De Cambridge University Press n'hi ha un exemple a Guerra d'Itàlia de 1551-1559; costa de trobar enmig dels ISBNs però hi és. Busca-ho a les versions acabades de sortir de l'eina, ara està arreglat. No sé per què, en alguns casos deixa un enllaç a la wiki original.

També hi ha el problema d'agafar URLs, traduir-les i posar-hi espais entremig, però això no sé si és un tema ja solucionat.

Sobre les plantilles que no es poden traduir, s'hauria de veure què és el millor. Si l'esperit és fer-ho fàcil, ho deixes en blanc i passa que t'he vist, però això va contra la qualitat de l'article. Però estem parlant de gent que edita una enciclopèdia: hem de suposar que tenim usuaris espavilats i implicar-los en la solució: aturar la traducció, avisar que hi ha una plantilla que s'ha de traduir, posar-hi metadades, donar-li enllaços a on ho ha de fer, amb ajuda, ... A partir d'això, l'usuari ideal hauria d'aturar la traducció, solucionar el problema de les plantilles (ell sol, o demanant ajuda a la comunitat), i després tornar-hi.

A mi també em molesta molt tot el codi innecessari que surt a la traducció de les referències, sobretot si vénen de la wiki francesa, que està farcit de tags span, que si la data porta un span type=date, que si la abreviatura porta un tag abbr, ... Mira't per exemple aquesta versió.

Paucabot (discussiócontribucions)

A veure si puc ajudar en qualque cosa. Jo som dels que revís traduccions automàtiques. Algunes de les coses que he detectat, ja les hi vaig comentar a Maria Fullana de València a Usuari Discussió:Maria Fullana de València#Nous articles amb etiqueta millores de traducció. Concretant:

Som conscient que no és fàcil per una màquina detectar quan simplement ha d'eliminar tot el text si aquest enllaça a un article en vermell (casos de vegeu també i article principal), ja que l'usual és deixar l'enllaç a l'article en vermell, però per demanar, que no quedi.

Pau.

Pginer-WMF (discussiócontribucions)

Moltes gràcies per recopilar aquestos examples, @Paucabot.

Els miraré en més detall, però com ja comentes, no semblen senzills. La dificultat d'aquestos casos es troba a l'hora de definir un comportament automatic generalitzat que funcione per a tot tipus de plantilles. L'eina no té massa informació sobre el proposit de cada una dels milers de plantilles a cada idioma. Això complica prendre decisions automàticament sobre si convé traduïr els continguts de certs camps d'una plantilla o eliminar text quan aquest té forma d'enllaç depenent de l'existència de l'article corresponent o no.

En quant a solucions específiques per a plantilles concretes, l'eina dona support a definir una llista negra de plantilles. Si hi ha plantilles que son problemàtiques, es poden ocultar al carregar l'article. D'aquesta manera s'evita que es propaguen a les traduccions. Caldria determinar si és més el que es guanya o el que es perd en aquest cas. Però podem afegir plantilles comuns que apareixen a l'anglés, castellà i francés que no te sentit propagar en les traduccions per diferències d'estructura o polítiques entre diferents viquipèdies.

Maria Fullana de València (discussiócontribucions)

Hola, Pau: a veure si em pots tirar un clable: resulta que si traduïsc els peus de foto quan estan agrupades desapareixen les imatges; i si no les traduïsc no em deixa publicar la pàgina. Què faig??,

m.

Pginer-WMF (discussiócontribucions)

Moltes gràcies pels comentaris, @Maria Fullana de València.

Podríes indicar-nos en quin article has trobat el problema, de quin idioma a quin altre estaves traduïnt, i quina secció era la afectada?

Per el que comentes, les imatges desapareixen quan aquestes son imatges enmagatzemades especificament a una viquipèdia i no es troben a Commons. Com les diferents viquipedies tenen polítiques de llicències diferents no podem copiar-les automaticament. Encara que hauriem de veure el cas concret per saber si es tracta d'aquest problema.

Sobre els limits per a publicar. estem en el procés d'ajustar-los. A finals de la propera setmana s'haurien de resoldre alguns d'aquests problemes.

Maria Fullana de València (discussiócontribucions)

un CABLE

Pginer-WMF (discussiócontribucions)

Els darrers mesos hem estat millorant molts dels aspectes clau que comentaveu: evitar referències buides, suport per als enllaços ISBN, evitar que les plantilles es descomposen com a HTML, i augmentar el nombre de plantilles supportades amb una nova aproximació basada machine learning.

Durant aquest període també s'ha activat l'eina de traducció per defecte a les viquipèdies de 7 idiomes (albanés, bengalí, tagàlog, malaiàlam, javanès, mongol, i bicol central).

Després d'aquests canvis volíem conèixer la vostra impressió sobre l'estat actual de l'eina de traducció. @Joutbis, @Noemiroig, @Paputx, @Paucabot; heu notat una millora significativa en el support d'aquests aspectes clau? Teniu nous examples d'aspectes claus a resoldre abans d'exposar l'eina a més usuaris?

El proper 26 de Novembre organitzarem una trobada a Barcelona per tractar temes relacionats amb el suport d'idiomes. Esteu convidats per discutir aquests i altres assumptes amb més detall.

Moltes gràcies!

Resposta a «Moure l’eina de traducció a les preferències»