Vés al contingut

Viquipèdia:Viquitrobada 2009/Taller de bots/Bot de suport a la traducció

De la Viquipèdia, l'enciclopèdia lliure

La idea general és que qui vulgui traduir un article es posi una plantilla en una subpàgina del seu propi usuari del següent estil:

{{Petició de traducció|id|Títol|Pàgina ER|La vostra signatura}}

Això fa aparèixer la pàgina en una categoria especial i el bot de suport a les traduccions detecta la petició i executa els corresponents mòduls.

En acabar o si hi ha incidències deixa un missatge a la pàgina de discussió del usuari que ha signat la petició.

Prestacions:

  • Traducció automàtica del text respectant el metacaràcters.
  • Traducció dels enllaços interns a traves dels de l'article original i les interwikis al català
  • Traducció de les plantilles a partir d'una pàgina editable (sense haver de modificar el bot).
  • Millora de la traducció corregint errors sistemàtics en funció del tema del article (pàgina d'ER seleccionable)
  • Gravar intercalades les frases del article original amb les frases de l'article traduït per tal de facilitar-ne el repàs.
  • Afegir automàticament la interwiki al article original, eliminar la plantilla de petició i afegir automàticament la plantilla de traducció.

Passos[modifica]

  1. Preprocés.
    • Hi ha caràcters que fan que el traductor automàtic falli, per exemple ''' o un salt de línia en una frase sense punt final o caràcters grecs que desapareixen de la traducció. Aquests caràcters se substitueixen per cadenes que no afecten al traductor automàtic i que despres es pot desfer la substitució.
  2. Traductor automàtic.
    • Es tradueix la pàgina en mode edició de forma que tots els meta caràcters surten al text traduït.
  3. Postprocés.
    • Es desfà la acció del preprocés i s'eliminen codis de colors introduïts pel traductor per identificar les paraules que no ha pogut traduir.
  4. Traducció d'Enllaços interns.
    • A partir dels enllaços interns de l'article original es busquen els interwikis al català de cada article enllaçat.
  5. Traducció de plantilles.
    • A partir d'una pàgina de descripció de com s'han de traduir les plantilles, pàgina ampliable sense modificar el bot.
  6. Millorar la traducció.
    • Es corregeixen els errors sistemàtics de traducció, poden ser específics de cada tema al que pertany larticle. Es fa executant una llista d'expressions regular emmagatzemada en una pàgina que es pot editar específicament per cada categoria o cada tipus d'article.
  7. Intercalar el text de l'article original.
    • Grava el text del article original intercalat amb el de l'article traduir per facilitar el repàs.
  8. Accions finals:Afegir interwiki a l'idioma original, canviar la plantilla petició de traducció per la de traducció.

De moment desenvolupo mòduls i després els ajuntaré en un únic programa.

Mòduls[modifica]

Executa expressions regulars sobre l'article traduit[modifica]

Aquest mòdul es fa servir en: Preprocés, Postprocés i Millorar la traducció. Només que executant-se amb pàgines diferents de expressions regulars.

L'exemple penjat obre la pàgina d'expressions regulars de Usuari:Jrgoma/Post i les executa modificant el contingut de la pàgina que hi ha a Usuari:Jrgoma/Laboratori.

Les expressions de postprocessat estan a:

Tradueix enllaços interns[modifica]

Aquesta versió tradueix els enllaços interns a posteriori de la traducció del article. Així s'eviten problemes de retraduccions (paraules catalanes que també existeixen en el diccionari del idioma original i que el traductor automàtic retradueix). Però cal que l'article original i l'article traduït tinguin exactament el mateix nombre d'enllaços interns i exactament emb el mateix ordre.

Crida al traductor automàtic de Gencat[modifica]

Traducció de plantilles[modifica]

Fa servir una pàgina on es donen les instruccions per traduir les plantilles de cada idioma.

  • Pàgina amb les instruccions per traduir les plantilles del anglès.
    • Exemple de plantilles traduides automàticament.

Intercalar l'article original[modifica]

Bot complert[modifica]

Feines pendents[modifica]

  • Notradueix els enllaços interns quan són redireccions. Arreglar-ho.
  • Plantilla “a” per a articles en idiomes no suportats per GENCAT. Fet Fet!
  • Plantilla “e” per peticions errònies.
  • Implementar nova sintaxi de definició de plantilles.Fet Fet!
  • Implementar el reconeixement dels errors. (en curs)
  • Acabar de polir les ER de pre i post:
    • Problemes amb espais abans i desprès de ‘’ o ‘’’ Fet Fet!
    • Caràcters grecs i especials.
    • Els “..” només del final de línia.
  • Millorar la traducció de les fórmules matemàtiques:
    • Al intercalar agafar la versió original Fet Fet!
    • Substituir els textos de dins de les expressions matremàtiques pels de la versió traduïda.
  • Traduir categories emprant els interwikis.
  • Escriure Manual d'usuari.(Fet Fet! primera versió)
  • Canviar-lo a amical-bot. Fet Fet!
  • Demanar flag de bot.
  • Millorar eficiència del traductor d'enllaços interns no repetint cerques del mateix article. (construir un diccionari amb els articles ja cercats abans) Fet Fet!
  • Admetre plantilles indentades dins de plantilles. Fet Fet! (un nivell)
  • Respectar el mateix nombre de línies en les plantilles per facilitar la intercalació. Fet Fet!
  • No intercalar les categories ni les interwikis. Fet Fet!
  • En fórmules matemàtiques que ocupen un línia única no intercalar la "traducció" deixar només la fórmula original. Fet Fet!