Tema de Viquipèdia:La taverna/Propostes

Traduccions automàtiques sense revisar

20
Resum per Paucabot
Paucabot (discussiócontribucions)

Arran de Viquipèdia:Petició als administradors#Qoqjan, me n'he recordat que tenim molts de problemes amb les traduccions automàtiques i que no els resolem.

Per ordre de gravetat:

Em preocupen especialment els de la segona llista i els de la primera llista que haurien d'estar a la segona i no hi són. També és preocupant que els de les dues primeres llistes no hagin deixat de pujar des que es varen crear les categories.

També em preocupen cerques com aquestes o aquesta meravella que he trobat a Viquipèdia:Traduccions/Errors comuns.

Idees per millorar aquest tema?

Paucabot (discussiócontribucions)

Alguns antecedents:

KajenCAT (discussiócontribucions)

Aquest problema amb les traduccions automàtiques sense revisar, solc trobar de molts tipus, però n'hi ha un que s'hauria d'establir el «protocol» a seguir com a comunitat i es tracta dels...

  • Usuaris «patriòtics» o «obsessionats amb algun tema», però que no són catalanoparlants i en solen fer uns quants d'una tirada. Per exemple, un turc que fa tota una sèrie d'articles relacionats amb el seu país amb traduccions automàtiques i després se n'obliden.

Desconec si és el problema major o no, però si es veu que ha fet el mateix en les altres viquipèdies, s'hauria de considerar vandalisme cross-wiki i esborrar-los directament. No té cap mena d'intenció de redactar un article en condicions, sinó en «promocionar» les seves coses d'interès: la literatura romanesa, un cantant tailandès, etc perquè popularitzar en la mesura que pot això.

I per què no usuarificar-los o intentar arreglar-lo? Per una qüestió d'eficiència. No veig cap benefici d'usuarificar-los perquè l'usuari en qüestió no sap català i pot crear duplicats i altres problemes. Per l'altra banda, el fet d'intentar arreglar-los és alimentar aquest tipus d'activitat. Una persona que crea 10 articles en 10 minuts i ens deixen el merder que ens costarà hores no és pas just per nosaltres. Obvi, que si hi ha algun article que a algun usuari l'hi interessés, els administradors els ho podríem restaurar.

Cal tenir en compte que tot això és quan és obvi com és el cas de Qoqjan, no s'ha de confondre amb algun usuari novell o oblits d'usuaris habituals.

En conclusió, davant d'actes d'aquest tipus s'hauria de perdre menys temps del que els hi ha costat embolicar-nos, ergo, esborrar-los directament.

Xavier Dengra (discussiócontribucions)

Bé, un dels problemes més greus relacionats amb això és que no podem limitar l'ús del traductor per imposició de la WMF. Com a mètode de prevenció, el més adequat seria que per defecte només es pogués emprar el traductor 3-4 cops per setmana i usuari per assegurar que qui el fa servir poleixi adequadament els articles a posteriori. I que, prèvia petició als administradors, es pogués acreditar que els articles traduïts acaben en una excel·lent qualitat en cas de voler incrementar-ne la freqüència. I evidentment, poder sotmetre usuaris que en fan un mal ús al banneig de l'eina durant un temps.

Respecte les llistes ja existents, d'acord amb desenvolupar la política perquè els articles amb avís de deficiències de traducció que porten >1 any sense corregir, siguin suprimits per via exprès o proposta (no tinc clar quina és millor però sí que sé que usuarificar no duu a bon port). El que diem sempre, qualitat vs quantitat i prou esperit crític per poder frenar usuaris que van disaparadíssims en aquest sentit.

KajenCAT (discussiócontribucions)

Realment aquesta eina no la veig útil excepte en les traduccions castellà>català. Inclús les traduccions anglès>català són infumables i a sobre tenen problemes d'estructures i de posició de referències, ... un desastre.

Entenc que tampoc es pot limitar a usuaris autoconfirmats, oi?

Paucabot (discussiócontribucions)

Només recordar que els problemes de traduccions automàtiques no comencen amb l'eina de traducció. Com podeu veure als antecedents, molt abans ja havíem tengut aquests problemes i encara hi ha usuaris anònims i registrats que tradueixen automàticament sense usar aquesta eina (i queden articles moltes vegades sense referències, sense enllaços interns, sense infotaula o sense relacionar amb els articles equivalents en altres llengües).

Respecte d'esborrar els articles que fa més d'un any que són a Categoria:Pàgines amb traduccions sense revisar, pens que aquests no tenen perquè estar malament.

Si la proposta és per esborrar els que fa més d'un any que són a Categoria:Articles amb traducció per millorar, no tots tenen el mateix grau de problemes de traducció.

El problema general és de manca de mans per revisar tots aquests articles. Però això és un fet que no només passa en aquest àmbit. És molt més general: crear articles deu donar satisfacció a més gent que revisar-los. I això diria que no té solució evident.

Pallares (discussiócontribucions)

Bé, jo soc un usuari del traductor i no n'estic descontent. Cal, però, fer alguns matisos: és necessari revisar-los després de totes totes.

Ara mateix, queda prou arregladet el resultat de la traducció anglès-->català. Han resolt fa poc alguns problemes relacionats amb referències i cites. Potser també amb imatges. Crec que treballant la traducció més tard, pot quedar un article digne.

No passa el mateix en la relació castellà-->català. Si bé el traductor funciona bé, el problema és l'article origen: o està mal traduït al castellà, o està esbiaixat ideològicament, o té un redactat barroc, o tot plegat, que fa que la feina posterior sigui ingent. Jo, @KajenCAT, per això, no tradueixo gairebé res del castellà.

El cas del francès és diferent: No tradueix molt malament, però hi ha una pila de qüestions que has de resoldre després amb molta feina: Ubicació de les referències, no traducció i/o desestructuració de les dates, puntuacions mal posades, no sap què fer amb els "modèles" (plantilles), etc.

En tot cas, tant als articles que tenen etiquetes de mal traduït o mal redactat com a molts que no en tenen, els fa falta una correcció lingüística: construcció de frases, pronoms febles...

Com ha dit el Pau, falten mans.

Xavier Dengra (discussiócontribucions)

Però si falten mans el que cal és crear alguna mena de coll d'ampolla o de limitació que ens serveixi com a tallafocs o com a prevenció. És evident que no augmentarem en nombre d'usuaris de manteniment màgicament, per tant haurem de desescalar d'alguna manera i fer decréixer l'entrada d'articles perquè en Pau i d'altres companys no petin.

Tiputini (discussiócontribucions)

Jo també uso aquesta eina i l'ensenyo a usar. Estaria bé que quan es dona una traducció per acabada, l'eina només te la deixés publicar a la pàgina d'usuària. perquè només quan es publica es poden veure els errors, com per exemple les referències.

Xavier Dengra (discussiócontribucions)

Tens tota la raó @Tiputini, potser en aquest sentit el més lògic seria que pels usuaris sense autopatrullar acabi a l'espai usuarificat, i pels que ja ho siguin es publiqui directament a l'espai principal.

Cataleirxs (discussiócontribucions)

Hi ha un problema addicional: sovint, les errades que fa el Content Transl. requereixen ser resoltes des de l'editor de codi i un bon grapat d'usuaris no el saben fer anar -també d'autoverificats. Tenim una eina molt útil per a què els novells facin el 95% d'un article en condicions, però que no els capacita per completar l'obra.

Usuarificar per decret, sense que la gent aprengui a resoldre aquest 5% d'incidències, farà que els moguin a la pàgina principal sense corregir o que els deixin usuarificats i pleguin frustrats de la Viquipèdia.

Tiputini (discussiócontribucions)

Potser tens raó, però en el meu cas no tinc necessitat d'usar el codi. Per exemple si una referència no em funciona, me'n vaig a l'original i la creo de nou. El que si és molt recomanable per a qui fa servir aquesta eina és que 1. Faci una lectura atenta per veure si 'sona' a català, ja que sovint s'arrosseguen gir i expressions no genuïnes 2. Eimini biaixos, sobretot en el cas de biografies de dones on s'acostuma a posar èmfasis en temes sexistes i no enciclopèdics. I aquestes recomanacions és millor aplicar-les a la pàgina d'usuària.

Xavier Dengra (discussiócontribucions)

El que és evident és que necessitem prendre alguna decisió i limitar l'aixeta de 1) l'ús del traductor o 2) dels resultats del traductor d'alguna manera, perquè tots els articles que esmenta en @Paucabot suposen ara mateix el 0,6% del total de la Viquipèdia.

I recordem que les usuarificacions també poden aparèixer als cercadors d'internet, per tant tampoc interessa que tinguem milers de "semicadàvers" escampats durant anys i sense acabar d'enllestir.

Paucabot (discussiócontribucions)

Ja us vaig dir que teníem un problema, però la solució no és evident. Tancar l'aixeta del traductor no evitarà les traduccions sense revisió: ara mateix, les pitjors traduccions, i que acaben esborrades directament, ni tan sols usen aquesta eina. A més, no sabem si, suposant que volguéssim, podríem limitar aquesta eina.

Bonus track. No sé si us va passar per alt, però aquesta consulta diu moltes coses: Tenim 46 pàgines que haurien de dir Time i que diuen Estafi. Són pàgines traduïdes del castellà amb l'eina de Content Translation. Això ens hauria de donar una idea de la quantitat de problemes de traducció que devem tenir i que ni tan sols tenim detectats.

Paucabot (discussiócontribucions)
Barcelona (discussiócontribucions)

Potser es poden fomentar projectes monogràfics com els d'esborranys per reduir els articles de les categories, a banda de la QQ.

Paucabot (discussiócontribucions)

La quinzena de la qualitat normalment serveix per fer manteniment senzill. Amb relativament poc temps, es poden fer baixar ràpidament els números de qualcunes categories.

Però aquestes tasques de revisió de traduccions automàtiques sense revisar, jo crec, precisament duen una feinada a cada article i, és per això que, normalment se solen quedar més o manco igual.

Barcelona (discussiócontribucions)

Per això he dit que es facin projectes monogràfics, de focus únic si pot ser

Paucabot (discussiócontribucions)

Rectific. Ara em mirava els resultats de la QQ de l'any passat i sí que s'hi va fer una mica de feina. El 2020, no gaire. El 2019, també se'n va fer. El problema és que, ni d'enfora, aquesta feina no basta per compensar tots els articles que s'han afegit a aquestes categories durant l'any.

Cataleirxs (discussiócontribucions)

M'he trobat un altre cas similar al de Qoqjan: @Xacòina. Una vintena llarga d'articles nous en el que portem de novembre, sense revisar ni la traducció ni el format.

Més que restringir l'ús del Content Translator, restringiria l'accés a la VP dels usuaris que la vandalitzen omplint-la repetidament d'errors, amb total indiferència davant de les indicacions dels revisors, cruspint-se el temps que tenim disponible.

Resposta a «Traduccions automàtiques sense revisar»