Vés al contingut

Tema de Viquipèdia:La taverna/Tecnicismes

Eina per obtenir automàticament l'enllaç arxivat vàlid més recent

5
Wecoc (discussiócontribucions)

Provant l'API de Wayback Machine m'he adonat que era fàcil obtenir automàticament l'enllaç arxivat vàlid més recent, i he pensat que això podria ser útil pels editors. Tot i que convé comprovar que l'enllaç resultant funcioni bé igualment, l'eina permet saltar-se la tasca de buscar-ho dins del calendari tal com funciona normalment la web. A més, es pot combinar amb altres tasques, com ara la de buscar tots els articles de la Viquipèdia que continguin una font que ja no està disponible i retornar els enllaços a aquesta que encara no estiguin arxivats (cosa que també he implementat).

Trobareu l'eina aquí: ViquiArchive. A més, és de codi obert i lliure (aquí), així que el podeu fer servir per fer el que vulgueu.

També accepto idees per fer-la una eina més útil, per si hi trobeu a faltar alguna cosa. De moment em plantejo ampliar-la de manera que a part d'en la Viquipèdia també pugui fer cerques a projectes germans com ara Viquillibres o Viquidites.

Salut!

Xavier Dengra (discussiócontribucions)

Aquesta eina ja s'està fent servir en algun bot, @Wecoc?

Wecoc (discussiócontribucions)

Cap bot utilitza l'eina directament, @Xavier Dengra, però és possible que algun utilitzi la mateixa API.

Xavier Dengra (discussiócontribucions)

Crec que seria el primer pas; que un dels bots actius actualment incorpori aquesta tasca de manera rutinària. Altrament sap greu que tinguem usuaris amb talent fent ginys que no tenen cap aplicació real i acaben en repositoris. Tenim moltes mancances tècniques i sempre fa patxoca si us podeu coordinar entre els perfils més tècnics. Has contactat cap botaire que s'hagi mostrat partidari a incorporar l'eina?

Wecoc (discussiócontribucions)

Per aquest cas concret prefereixo mantenir la part de comprovació de forma manual, perquè a vegades Wayback Machine marca en blau (vàlid) enllaços que tenen versions més antigues en verd o taronja (invàlids), així que pot donar falsos positius.

Crec que sense bot pot ser una eina útil igualment, especialment si s'amplia segons convingui; per exemple, si passa un cas com el de l'hemeroteca de La Vanguardia i ens acabem veient forçats a utilitzar versions arxivades d'una determinada font. Aquesta eina funciona com una cerca query dels casos en tots els articles afectats, però identificant en concret aquells que encara no tenen versió arxivada i intentant oferir un enllaç per posar-hi remei. En casos complicats també ens permetria anar més enllà del que permet la cerca amb expressions regulars que faríem servir normalment.

Tornant al tema dels bots, crec que la millor opció en aquest cas és un bot que identifiqui enllaços trencats i els marqui amb la plantilla Enllaç no actiu, per tal de tenir-los llistats i poder-ho arreglar "a mà". Aquest pas ja no té a veure amb aquesta API i és més complex. Tot i això, tinc entès que ja hi ha algun bot que s'encarrega d'aquest tipus de patrulles periòdiques.

Resposta a «Eina per obtenir automàticament l'enllaç arxivat vàlid més recent»