Vés al contingut

Viquipèdia Discussió:AutoWikiBrowser/Fòrum/Arxiu 1

El contingut de la pàgina no s'admet en altres llengües.
De la Viquipèdia, l'enciclopèdia lliure

Hola, sembla que estem tenint una conversa a tres cantons. Us proposo si us sembla bé que parlem tots els dubtes sobre l'AWB aquí i així no hem d'anar duplicant les converses. Us fa?--Xtv (que dius que què?) 16:42, 4 set 2006 (UTC)

Typos

Les darreres versions de l'AWB inclouen una opció que consisteix en agafar directament una llista de buscar - reemplaçar de la wikipedia per tal de corregir errors habituals, de tal manera que així no els has de tenir tu en el fitxer de settings i tothom pot anar engrandint aquest fitxer i així els canvis repercuteixen per a tothom. El llenguatxe d'aquesta llista és similar al del find replace però no exactament. Podeu veure'n el llenguatge aquí.

Tanmateix, aquest fitxer només existia per la wiki anglesa i jo li vaig dir ahir al programador que en volia un també per la catalana, de tal manera que em va dir que d'acord i va treure una nova versió de l'AWB, la 3029 que és la que ja busca la llista de Typos corresponent a la viquipèdia que estiguis usant. És a dir, si useu una versió anterior de l'AWB no podeu beneficiar-vos d'aquesta llista. I sí, des de fa unes setmanes, les noves versions de l'AWB inclouen un munt de possibilitats. L'apartat de find and replace està molt ampliat amb booleans i moltes coses noves. Jo encara no he tingut temps de mirar-m'ho bé, però promet.--Xtv (que dius que què?) 16:50, 4 set 2006 (UTC)

Segur? jo me'l vaig baixar ahir, i res de res! No puc dir-li que la pàgina que vull no és la de en:Wikipedia:AutoWikiBrowser/Typos sinó ca:Viquipèdia:AutoWikiBrowser/Typos, em deies que era a la pestanya More Options (entre la (2) Set Options i la (3) Strat i que devia tenir l'opició Enable RegExTypoFix activada, quan la seleccione em diu clarament que l'arxiu és el de la Viqui en anglès. Per si hi ha algun dubte, l'arxiu comprimit que m'he baixat es diu AutoWikiBrowser3029.zip. –Pasqual · bústia 17:12, 4 set 2006 (UTC)
És molt estrany. Suposo que has posat que l'idioma amb el que treballes és ca i has fet el log-in des de l'AWB... A mi quan clico aquesta pestanya em diu que l'arxiu és el de ca.wiki... Has mirat de clicar després d'haver fet el log-in a la ca? no sé no sé... si no funciona després et puc enviar el meu fitxer de settings... però ara he de marxar... a veure si ho podem solucionar...--Xtv (que dius que què?) 18:36, 4 set 2006 (UTC)
Ara sí! Es clar, no coneixia els passos, primer triar idioma, i després clicar l'opció Enable RegExTypoFix. Crec que aniria bé crear unes instruccions.
On s'indicaria d'on s'ha de baixar l'arxiu, i el Frame.Net (es diu així?) en cas de no tindre'l instal·lat, posteriorment els passos que s'han de seguir, triar el projecte (la llengua), i registrar-se (log-in). I inclús afegir enllaços cap als regular expressions. Què en dieu? –Pasqual · bústia 20:43, 4 set 2006 (UTC)

Expressions regulars

Hola Xtv, acabo de veure que em vas deixar un missatge el 27-abr, però jo no feia servir aquest compte des del febrer... en fi, encara tens cap dubte sobre les expressions regulars?
Vaig veure l'altre dia (ahir) una llista de les paraules que pensaves canviar (per cert, podries fer un enllaç?) i et vaig deixar un missatge (amb la IP), crec que hauries de desar una llista dels articles a on facis canvis, i enxanxar-la a Viquipèdia:Orgotrafia/noseque així si algú en té ganes pot comprovar si hi havia més faltes. Ho dic perque sovint on hi ha una falta hi han més. --Razor Ramon HG 16:58, 4 set 2006 (UTC)


Bitàcora

Proposo que si feu canvis amb l'AWB deseu una bitàcora (log en anglès) i que pengeu tots els canvis relacionats amb l'ortografia a un subdirectori de Viquipèdia:Ortografia, així algú que s'avorreixi pot comprovar si hi havia més errades als articles que heu canviat (on hi trobeu una és probable que hi hagi més).

  • Com que el programet aquest sembla només per a windows (i jo faig servir GNU/Linux) no puc mirar cóm es desa la bitàcora... --Razor Ramon HG 17:22, 4 set 2006 (UTC)
En tot cas, com que la majoria de canvis que faci els faré amb el bot que tinc XtvBot, es poden mirar les correccions mirant les contribucions del bot en qüestió. Miraré si es poden guardar logs, però en tot cas no sé si sempre seran útils perquè llevat del cas en concret que portem ara entre mans que és purament de correcció ortogràfica de certes col·laboracions, en general el programa no s'usa com a correcció orto sinó que és per fer altres coses i que de passada corregeixi una mica d'orto...--Xtv (que dius que què?) 17:27, 4 set 2006 (UTC)

[Rr]odejar -> [Ee]nvoltar

Crec que n'hauràs de fer un parell per aquesta, no crec que es pugui modificar només amb regex
find="\bRode[gj]" replace="Envolt"
find="\brode[gj]" replace="envolt" --Razor Ramon HG 17:34, 4 set 2006 (UTC)

Word \b oundaries

Si tenim aquesta regex "\b(N|n)omes\b"
I la fem passar per un text que contingui "autònomes", depenent de la definició de \b que tingui el llenguatge que estem fent servir, la regex trobarà "autònomes"
això es sol·luciona (en Python) posant re.UNICODE al compilar la regex, no se si l'AWB tindrà aquest problema --Razor Ramon HG 17:45, 4 set 2006 (UTC)

Tens tota la raó. Ja vaig pensar en una cosa així però em va semblar llegir a no sé on que depenent de la definició també incloien els caràcters amb accents dins la \b. En tot cas potser podríem canviar totes les \b per \W (perquè sinó no veig la diferència que hi ha. En tot cas ara miraré com es comporta l'AWB amb les autònomes.--Xtv (que dius que què?) 17:57, 4 set 2006 (UTC)
Sembla que això ho fa bé. M'ha trobat un parell d'altres errors, però aquest (són me'l canviava a só, i a fórmula hi sobrava el segon $2), però a autònomes no troba problema.--Xtv (que dius que què?) 18:08, 4 set 2006 (UTC)
Llavors ja deu fer servir les definicions d'Unicode de "bondària" de paraula, cap problema --Razor Ramon HG 20:53, 4 set 2006 (UTC)


Anirem afegint a la llista oi? Viquipèdia:AutoWikiBrowser/Typos

He vist que a la en: wiki en tenen un munt (més de 1000 diuen), si en recopilo unes quantes entre les faltes que em trobi a la Viqui i les poso al sub-apartat de "Noves entrades" el programa les farà servir directament? o s'hauria de fer una pàgina apart per comprovar primer que no donen falsos positius en altres paraules? --Razor Ramon HG 20:59, 4 set 2006 (UTC)

Dubte

Ací hi ha hagut canvis però no és mostren, es tracta d'espais? –Pasqual · bústia 21:01, 4 set 2006 (UTC)

això és extrany --Razor Ramon HG 21:10, 4 set 2006 (UTC)

En Laminium

és que aquesta norma <Typo word="à" find="á" replace="à" /> (á -> à) és una mica laxa :P --Razor Ramon HG 21:24, 4 set 2006 (UTC)
  • "Es la..." ha donat "és la ...", s'ha perdut la majúscula. –Pasqual · bústia 21:08, 4 set 2006 (UTC)
això ara m'ho miro --Razor Ramon HG 21:10, 4 set 2006 (UTC)
fa servir: <Typo word="és+article ATENCIÓ: es..." find="\b[Ee]s (un|el|la|una|més|mes|molt)\b" replace="és $1" />
hauria de ser (crec): <Typo word="és+article ATENCIÓ: es..." find="\b(E|e)s (un|el|la|una|més|mes|molt)\b" replace="$1s $2" /> vaig a canviar-ho, per que tingui efecte hauràs de recarregar programa (al menys això em sembla haver llegit abans) --Razor Ramon HG 21:16, 4 set 2006 (UTC)
Errr... NO, haurien de ser 2 entrades, vaig a canviar-ho --Razor Ramon HG
  1. Els noms llatins acabats en ii els canvia per , com les terminacions verbals, ahí no podrem ver res.
  2. Hi ha codis com <i> i </i> que podríem canviar per els dos apòstrofs, és una simple suggerència. –Pasqual · bústia 21:33, 4 set 2006 (UTC)

Respostes

Caram, surto una tarda i em trobo una fotralada de comentaris nous!!! Això és bo ;-)

A veure, respondré els que sé:

  • Crear les instruccions em semblaria perfecte, però he de dir que jo mateix de vegades encara estic un quart d'hora per poder fer el log-in perquè de vegades li dic de fer-lo i no el fa i aleshores quan es posa a mirar un article em diu: has de fer el log-in i es penja i... bé, que és encara un programa en fase beta. Sí que és cert que aquests trucs anirien bé d'explicar.
  • Sí, totes les possibilitats que vegis per ampliar la llista són benvingudes. No sé si cal posar-les a noves entrades o directament a dintre. Com que la llista en sí dóna molts falsos positius, potser no passa res que la posis a dintre. Em sembla que la llista anglesa és una llista molt més estricta que no dóna mai problemes i per això s'asseguren abans de posar-los a la llista, que el canvi funcioni. Jo a la llista que he creat (i aprofitant per respondre ja la següent pregunta) efectivament he sigut molt més lax, i segons la meva opinió és millor que doni falsos positius i aleshores corregir-los (amb l'opció del "find" que hi ha a sota a la dreta, és molt fàcil posar Alcatràz find i corregir-lo) que no pas que Alcatráz no et dóni fals positiu però que aleshores se t'escapi una altra á a un altre lloc. Però bé, això es pot discutir (igual que la del ...ii, ...ó, etc...). També comentava avui la possibilitat de fer dues llistes, una de laxa i una d'estricta i copiar a Typos la que en aquell moment es vulgui usar...
  • Efectivament a l'article que em mostres, hi havia dobles espais a davant i darrera la paraula grega. Per un canvi tant petit no val la pena apretar "save" i potser es pot apretar "ignore" i anar al següent. Ara bé, si a l'article hi ha algunes altres correccions, també va bé que tregui doles espais.
  • Efectivament, totes les paraules que comencen amb [Aa] (o Bb o...) s'haurien de fer dues entrades. No sé si val la pena, però fer-les tampoc està de més.
  • Sobre els iï ja ho he dit. Jo crec que aniria bé tenir una llista específica per cada tipus de fitxer: quan treballem amb textos llatins, aquesta entrada és una putada, i si tractem amb francesos, la que corregeix vr ens anirà malament... no sé què penseu. Tot depèn de com vulgueu usar el programa: si voleu no haver de fer gaires correccions (i que alhora corregeixi poc), hem de ser més estrictes. Si volem que corregeixi molt però que ens doni falsos posistius, acceptem aquestes... (s'ha de dir que jo quan un dia estava arreglant articles sobre la Roma antiga, fart que el ii em donés falsos posititus, vaig carregar-me'ls i després vaig tornar-lo a afegir...

En fi, Salut!--Xtv (que dius que què?) 00:20, 5 set 2006 (UTC)

He ampliat una mica la llista dels que començaven amb [Aa] i per l'estil, però encara falten tots els barbarismes i els tenir que... mira, a mi em fa pal i per mi ja ho corregiré directament de l'AWB. Si algú en té ganes, ja sap (crec que no trobarem tan sovint la paraula Chandal amb justament amb majúscules, no sé si m'enteneu...)--Xtv (que dius que què?) 00:47, 5 set 2006 (UTC)

Expressions en altres idiomes

Hola :-) en primer lloc, felicitar-vos per la llista de typos que heu creat, avui he tre la pols de l'AWB i crec que pot anar molt bé!! Només una cosa, per evitar corregir expressions en altres idiomes, no sé si podríem arribar a un consens amb altres viquipedistes sobre l'estil de les cites, noms propis i títols de llibres, de manera que quedés bonic i alhora un bot podés saber que aquell text no està en català...

Resumint, no sé si és útil, fàcil i/o factible afegir a les expressions regulars de les correccions d'apòstrofs, accents i i greges que no es facin si estan entre algun dels següents grups de caràcters; « i », “ i ” , " i ", [[ i ]], '' i '', ''' i ''' --Joanjoc (discussió) 15:54, 9 set 2006 (UTC)

Em sembla un punt interessant a estudiar. Ja he dit unes quantes vegades que la llista que he fet dóna potser massa falsos positius. Jo crec que el millor que es pot fer és fer-lo córrer i sobre el terreny veure quines correccions són les més adequades. L'altre dia per cert vaig veure un cas que hauríem de corregir: "comprar-la avui" me la va "corregir" a "comprar l'avui". És a dir, que el "\bla (vocal)" hauria de considerar també el cas que \b sigui guionet i aleshores no fer el canvi. Un altre error que vaig veure és el de complexes -> complexos. El masculí és complexos i el femení complexes. Aquí intentava resoldre l'error habitual que és prendre complexes pel masculí (nombres complexes), però veig que la fórmula no és del tot encertada. Potser s'hauria d'afegir alguna cosa de l'estil (nombres|altres paraules masculines) complexes -> $1 complexos. En fi, encara hi ha molta feina a fer...--Xtv (que dius que què?) 18:33, 9 set 2006 (UTC)
Per cert, en els casos on apareix una frase en castellà com a 1768, no s'hauria de posar també la traducció al català per aquells catalanoparlants que no saben aquest idioma? (val sí, sé que aquest conjunt és quasi nul, però és la viquipèdia en català...)--Xtv (que dius que què?) 18:36, 9 set 2006 (UTC)

Al Manual d'estil d'en Josep Mestres (UB, UPF i Rosa Sensat), proposa la utilització de les cometes baixes (« i ») per a les citacions, comentaré a la taverna si els sembla bé que ho incorpori al llibre d'estil de la viqui VP:LE com a norma per a les citacions. Potser també s'hauria de plantejar la possibilitat de traduïr les citacions de les llengües estrangeres al català... --Joanjoc (discussió) 19:41, 9 set 2006 (UTC)

Pàgina de comprovació

Hola! Per a coordinar millor els que l'utilitzem i per a que els qui vulguin fer-lo servir ho hagin d'anunciar i de passada llegir-se algunes de les discussions que tenim sobre quin ús s'ha de fer de l'AWB. Crearé una pàgina de comprovació del programa de manera que només els qui siguin dins la llista el puguin utilitzar a l'estil de la de en:, nl:, pt:, ru:. De moment la llista serà la següent:

  • Bots: Albertbot, JoanjocBot, SMP AWB BOT, XtvBot
  • Usuaris: Albertsab, Pasqual, Xtv
  • Admins: Joanjoc, SMP

Si hi falta algú aviseu-me. En Razor Ramon HG no l'he afegit perquè m'ha semblat entendre que no l'usa.--SMP​·d​·+ 13:01, 8 febr 2007 (CET)

Pasqual, et falta el bot! ;-)--Xtv (que dius que què?) 16:07, 8 febr 2007 (CET)
Per què la distinció entre usuaris i admins? ja sé que a l'anglesa es fa perquè hi ha molts més usuaris i sysops, però diria que en la nostra petita wiki no cal...--Xtv (que dius que què?) 17:04, 16 març 2007 (CET)
Què vols dir? Han d'estar amb una marca especial (<code><!--adminsbegins--></code>) perquè se'ls activin les opcions addicionals. --SMP​·d​·+ 18:10, 16 març 2007 (CET)
Ah, no ho sabia... (per a poder eliminar pàgines i tal, suposo)--Xtv (que dius que què?) 15:36, 20 març 2007 (CET)
L'AWB permet esborrar pàgines? De tota manera qui hauria de tenir la marca és el bot no el seu control·lador, oi?--Iradigalesc (discussions) 00:51, 28 ago 2007 (CEST)

Problemes de versions

Ahir a la nit, en en:User:Mets501 em va dir a la meva discussió que les noves versions de l'AWB no requereixen ser activades a la Viquipèdia en català ja que la seva activació es fa centralment. També em va demanar que esborres la secció de versions actives. Com que això suposava denegar l'accés a les versions antigues de l'AWB, no ho vaig fer. Què us sembla?--Iradigalesc (discussions · +) 06:43, 3 març 2007 (CET)

Generalment les millores milloren (ovació!) molts aspectes que crec interessant de tenir: que no modifiquin els interwikis, que els ordenin correctament, etc... jo crec que no costa gens descarregar la versió més actualitzada tenint en compte que tampoc s'actualitza cada dia...--Xtv (que dius que què?) 11:14, 3 març 2007 (CET)
Jo també estic d'acord amb obligar a anar actualitzant-nos constantment. He estat molt temps treballant amb l'AWB desfassat i realment vaig adonar-me que no és gens recomanable fer-ho. --SMP​·d​·+ 15:58, 16 març 2007 (CET)