Vés al contingut

Tema de Viquipèdia:La taverna/Tecnicismes

Paucabot (discussiócontribucions)

Bon dia. Qualcú coneix qualque mecanisme per exportar els resultats d'aquesta cerca (o de qualsevol altra) a un fitxer de text per poder usar els resultats amb el Pywikibot?

Vriullop (discussiócontribucions)
Paucabot (discussiócontribucions)

Gràcies. Ara ho acab de provar. El problema és que no em permet usar el paràmetre "insource" per a detectar plantilles, per exemple.

Pere prlpz (discussiócontribucions)

Fa temps que no remeno bots, però suggereixo el que jo intentaria per si serveix, tot i que és una solució molt d'estar per casa.

Si aquesta cerca només surt amb la url manual i no amb pagegenrators, jo faria servir la url per baixar el codi html de la pàgina (per 500 resultats) i aleshores dels enllaços miraria d'extreure el nom dels articles. Del mateix codi html també s'ha de poder treure la url de la següent pàgina de cerca i repetir el procés. Un exemple que feia una cosa semblant (amb un altre web que no és la Viquipèdia) és Usuari:PereBot/robot xucla arbres, però segur que hi ha paquets de Python per treure elements d'una pàgina web d'una manera més sofisticada (googlejant "Python web scrapping" surten milions de resultats).

La solució alternativa (i més bona) és mirar els manuals de l'API com fer una cerca com aquesta, que és probable que es pugui fer amb una url però ningú l'hagi implementat encara al pagegenerators.

Paucabot (discussiócontribucions)

He fet l'extracció dels noms dels articles a partir de la pàgina HTML de 500 resultats amb aquesta eina, que simplifica moltíssim la tasca. Gràcies, Pere.

Resposta a «Exportar resultats d'una cerca»