Vés al contingut

Tema de Viquipèdia:La taverna/Propostes

Seguiment de les llistes automàtiques de topònims de municipis

28
Isidre blanc (discussiócontribucions)

Antecedents: Veure Tema:Wijh1060e7w4iy3g

Mercats i publicacions (traslladat de Discussió:Llista de topònims de l'Hospitalet de Llobregat)

@Isidre blanc, @Amadalvarez: M'acabo d'endur una altra sorpresa amb les classes de Wikidata. Ara resulta que els mercats són una subclasse de l'arbre de Publicació (Q732577) (no em pregunteu a sant de què, que no he aconseguit esbrinar-ho) i desapareixen de les llistes per MINUS { ?item wdt:P31/wdt:P279* wd:Q732577. } que hauria d'eliminar diaris i revistes. A l'Hospitalet ho he arreglat canviant Q732577 per Publicació periòdica (Q1002697) però em temo que el mateix problema ens el trobarem a més llocs. Pere prlpz (disc.) 12:46, 26 març 2024 (CET)

Aquest és el punt flac de les llistes de topònims: la seva consistència depèn de la solidesa de les dades de Wikidata i aquestes es poden modificar amb molta facilitat. També en algun lloc, ara no recordo on, ja vàrem comentar que aquesta instrucció de "MINUS" que cerca subclasses de l'arbre de Instància de (P31) era molt perillosa perquè pot treure de la llista topònims que hi haurien de ser, com en aquest cas. Per això és millor, sempre que es pugui, aplicar el "MINUS" només a Instància de (P31) de l'ítem, de forma que una modificació només pot fer que surti a la llista una cosa que no hi hauria de ser, lo qual és un mal menor i fàcilment detectable. Caldrà tindre-ho en compte en altres llistes i aplicar, si cal, la solució que ha practicat en @Pere prlpz en aquest cas. Isidre blanc (disc.) 19:23, 31 març 2024 (CEST)

Més sorpreses: desaparició de monestirs i convents (traslladat de Discussió:Llista de topònims de Sant Cugat del Vallès)

@Isidre blanc, @Amadalvarez: Avui estan desapareixent monestirs i convents perquè d'alguna manera es deuen haver convertit en institucions educatives. La meva solució és fer que no elimini les institucions educatives que siguin en subclasses d'edificis.

  MINUS { ?item wdt:P31/wdt:P279* wd:Q5341295. 
         MINUS {?item wdt:P31/wdt:P279* wd:Q41176}
        }

Fins ara, aplicar això no m'ha permès recuperar monestirs i convents sense efectes secundaris. A més estic veient que algunes cerques que normalment es penjarien, quan són dins d'un MINUS MINUS no es pengen. Suposo que és cosa de que s'executa a l'inrevés de manera que està automàticament optimitzada. A veure quan dura aquesta solució. Pere prlpz (disc.) 20:53, 2 abr 2024 (CEST)

Gràcies, @Pere prlpz. Les subclasses són un malson quan es produeixen canvis benintencionats amb uns efectes secundaris no previstos. No m'havia passat pel cap fer un MINUS MINUS. Cada dia una cosa nova a aprendre. Salut ! amador (disc.) 05:30, 3 abr 2024 (CEST)
Isidre blanc (discussiócontribucions)

Deixaré el que estic fent i em dedicaré fer un manteniment de les llistes per a resoldre aquests cassos. Com que tinc`totes les llistes de topònims en la meva llista de seguiment, revisaré, en un principi, les que hagin sofert una disminució en bytes en la seva última actualització per bot. Aplicaré el MINUS MINUS només quan no trobi cap altra solució. Aniré informant.

Amadalvarez (discussiócontribucions)

Quan la informació és força estable, una solució per evitar ensurts és desconnectar el bot (posant tot el codi del Wikidata list com a comentari) i deixar la darrera llista generada.

Òbviament, sempre es pot tornar a activar i fer un refresc controlat i, si surt bé, tornar-lo a desconnectar.

Pere prlpz (discussiócontribucions)

Això que diu l'Isidre és també el que vaig fent, seguir les contribucions del ListeriaBot i mirar els canvis, en part per trobar errors d'aquests (més el vandalisme a Wikidata) i en part per admirar el que anem fent entre tots plegats completant les dades a Wikidata.

Com que avui he vist que això dels monestirs està passant en moltes llistes més, crec que deixaré de corregir-ho a mà i intentaré fer el canvi del MINUS MINUS amb bot a totes. Espero enganxar la majoria de llistes sense carregar-me res.

Per cert, a les primeres llistes que vaig corregir els posava el MINUS MINUS d'edifici, però a les darreres els hi poso el d'estructura arquitectònica, que és més genèric.

Pere prlpz (discussiócontribucions)

I això de congelar les llistes no m'acaba de convèncer per les de topònims i similars, perquè van creixent. Només cal veure que la majoria d'edicions del ListeriaBot no són problemàtiques, i gran part de les que sí que són problemàtiques ho són perquè estan detectant un problema a Wikidata (com el vandalisme). De fet, les llistes automàtiques són el més semblant que podem tenir a una llista de seguiment de les coses que ens afecten a Wikidata.

Quelet (discussiócontribucions)

Jo no aturaria l'actualització automàtica de les llistes fetes amb el Listeria. És convenient veure les noves dades de WD a la llista de topònims. Això em fa pensar en una altrea cosa: aquestes llistes de cada municipi són de topònims, però també d'elements ubicats al municipi que no són topònims, per exemple "mercats" o "molins". Potser seria millor, tal com s'ha dit a aquesta discussió, explicitar quins element de toponímia es volen, i quins elements no topònims es volen, sense haver de recórrer a les classes. Entenc que estem parlant de geografia física, no pas política.

Isidre blanc (discussiócontribucions)

@Quelet: El propòsit és que els ítems que no siguin pròpiament topònims només figurin en les llistes si formen part del patrimoni arquitectònic. Precisament, aquí, estem tractant la forma d'aconseguir-ho.

També penso que no s'ha d'aturar l'actualització automàtica del bot. Al contrari: lamento que el bot actui d'una manera tan aleatòria, no sistemàtica. Hauria d'actuar, com té indicat a la llista, cada 30 dies.

Pere prlpz (discussiócontribucions)

I de fet, els mercats i molins, com a edificis, són topònims.

D'acord amb l'Isidre que estem intentant explicitar què es vol i fer-ho de manera que sigui robusta davant dels canvis a Wikidata. La dificultat són els arbres canviants de subclasses a Wikidata, però en general és más fàcil explicitar què no volem que què volem (cosa que dura fins que algú classifica el que volem amb el que no volem i ens desapareix).

Quelet (discussiócontribucions)

Ara que hi som, una pregunta: a la crida SPARQL hi ha un wdt:P131+ - vol dir això que, per a un municipi, és acceptable (a WD) que un topònim o element georefenciat tingui P131 un nivell inferior al municipal?

Pere prlpz (discussiócontribucions)

En general, qualsevol propietat hauria de tenir el valor més concret possible. En el cas de Localitzat a l'entitat territorial administrativa (P131), hauria de ser la divisió administrativa més concreta que contingui l'element, i en municipis que tenen divisions administratives més petites hauria de ser aquesta.

Sobre si és bo o dolent deixar altres divisions administratives redundants amb la més concreta, em temo que els participants en aquesta discussió tenim visions diferents, de manera que no et puc donar una resposta gaire clara.

Pere prlpz (discussiócontribucions)

I sobre topònims i divisions administratives: ara m'he trobat amb aquesta bajanada d'un editor traient la vegueria del Tarragonès tot i les referències, amb l'arguments imaginatiu que no és una divisió administrativa d:Talk:Q15360.

Pere prlpz (discussiócontribucions)

@Isidre blanc Veient que estava fent la mateixa edició a tot arreu, he provat de fer el canvi amb bot al Barcelonès i ha funcionat prou bé. Ho puc fer a tot arreu i ens estalviarem feina, encara que seguim havent de clicar el botonet i comprovar què està sortint.

Isidre blanc (discussiócontribucions)

D'acord, @Pere prlpz, fes-ho. Si segueixo fent-ho manualment, m'en podria descuidar algun. Ja hi donaré una ullada després.

Pere prlpz (discussiócontribucions)

@Isidre blanc Per prudència, he fet ara el Solsonès i la Segarra i si no hi trobem cap pega ja l'engegaré per la resta.

En aquestes dues comarques el bot ha trobat 12 articles. Idealment, els altres són els que tu ja has fet a mà i els que no tenien el MINUS problemàtic, però també podria ser que se n'hagi saltat que tinguin el MINUS escrit de manera lleugerament diferent i el bot no l'hagi reconegut.

Isidre blanc (discussiócontribucions)

@Pere prlpz Això últim ho veig possible però molt poc probable. Els MINUS els tinc en una llista i només em calia copiar i empegar. Ara ho repasso, partint de la llista d'edicions del teu bot. Parlant de tot: el Listeria em fa anar de corcoll. Exigeix molta paciència.

Pere prlpz (discussiócontribucions)

Et diria que d'acord en això de la paciència, fins que me'n recordo de la paciència que cal per mantenir les llistes que no fan servir ListeriaBot. Les llistes automàtiques de masies i de topònims les vaig ampliant, però les llistes manuals de rellotges de sol gairebé mai i les d'arbres singulars les tinc pràcticament abandonades fins que les pugui pujar a Wikidata i fer-les automàtiques.

Sí que de vegades esgoten el vandalisme i els trolls a Wikidata i els altres canvis sobtats, però en tot això les llistes fan una mica el paper del canari de la mina. Sense les llistes, alguns problemes de Wikidata ens passarien desapercebuts i seguirien tenint conseqüències.

Quelet (discussiócontribucions)

Fent proves amb llistes automàtiques, ara veig que quan demano centres docents també em surten els (o alguns) monestirs. Suposo que tot plegat està relacionat. I per què no es discuteix si un monestir és un centre educatiu? Algú pot, així de sobte, posar subclasse Institució educativa (Q2385804) a Complex institucional (Q19691007)? I no és pas el mateix el conjunt d'edificis d'un antic monasteri que un monasteri en funcionament.

Pere prlpz (discussiócontribucions)

Si vols discutir si un monestir és un centre educatiu, el lloc és Wikidata. En qualsevol cas, el primer hauria de ser buscar a l'arbre de subclasses on hi ha una afirmació dubtosa o equivocada i anar a veure si es va debatre en algun lloc o va ser cosa d'un usuari despistat.

A més, tingues en compte que la separació entre edifici i institució que se segueix molt al peu de la lletra pels hotels i per la majoria d'escoles, no sempre se segueix per altres coses. Segurament el consens, si es plantegés, seria separar la institució monàstica de l'edifici monàstic, però falta algú que ho implementi.

Isidre blanc (discussiócontribucions)

@Quelet Ja més amunt en @Pere prlpz va comentar que "estan desapareixent monestirs i convents perquè d'alguna manera es deuen haver convertit en institucions educatives". Lògicament a tú et passa que, quan demanes "centres educatius" t'agafa també "monestirs" i altres similars.

També veuras més amunt que el Pere ho va solucionar afegint un

  
         MINUS { ?item wdt:P31/wdt:P279* wd:Q811979}
        

amb molt bon resultat. Prova-ho

Pere prlpz (discussiócontribucions)

I si algú té ganes d'anar a discutir a Wikidata, em temo que l'origen de tot plegat és l'edició https://www.wikidata.org/w/index.php?title=Q19691007&diff=prev&oldid=2116312755 del dia 1 d'abril que va posar els complexos institucionals com a subclasse d'institució educativa. Suposo que es deu poder discutir a la seva pàgina de discussió notificant l'usuari, al viquiprojecte d'ontologia o en alguna de les tavernes de Wikidata.

Pere prlpz (discussiócontribucions)

I us deixo una eina que fa anys que tenia ganes de fer i no me n'he sortit fins ara: la xarxa de subclasses que relaciona monestirs i centres educatius.

# xarxa de subclasses de centre educatiu a monestirs
SELECT DISTINCT ?classe ?classeLabel ?classepare ?classepareLabel
WITH { SELECT ?classe WHERE { ?classe wdt:P279* wd:Q5341295 . } } AS %1
WITH { SELECT ?classe WHERE { wd:Q44613 wdt:P279* ?classe. } } AS %2
WHERE {
  INCLUDE %1
  INCLUDE %2
  ?classe wdt:P279 ?classepare.
  SERVICE wikibase:label {
    bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ca,en,es,an,eu" .
  }
}
#defaultView:Graph

Prova-ho !

Canviant els dos elements hauríem de poder trobar d'on surten les coses estranyes que ens trobem en el futur.

Quelet (discussiócontribucions)

Magnífica eina! Trobo que caldria serparar l'edifici (una cosa concreta) de la institució, igual que es separa "edifici escolar" d'"escola". I de passada, es podria repassar que no és el mateix "església" que "monestir", per exemple Monestir de Sant Esteve de Banyoles (Q3510006)

Pere prlpz (discussiócontribucions)

En teoria completament d'acord amb tu. A la pràctica ja no ho sé.

O sigui, si per les escoles de Catalunya encara no hem acabat d'enllaçar les escoles amb els edificis escolars que ocupen (si ja els tenim), la perspectiva de separar tots els monestirs en un element per la comunitat i un altre per l'edifici em sembla una tasca immensa comparada amb els mitjans que s'hi dediquen i el profit que en traurem. Ara bé, si algú s'hi vol dedicar, endavant. Jo només li suggeriria que mirés o preguntés a Wikidata com s'està fent en altres llocs per tal d'evitar acabar com amb els arbres individuals que a cada lloc duen una instància diferent.

Quelet (discussiócontribucions)

L'usuari que va fer el canvi, després de la petició que li vaig fer de discutir-ho, l'ha revertit. Així que els monestirs tornen a no ser subclasse de centres educatius.

Quelet (discussiócontribucions)

Hi ha una diferència entre monestirs i escoles: de centres docents a Catalunya potser n'hi ha 3000 o 4000 o més, i dels edificis que ocupen - molt pocs, els protegis patrimonialment. En canvi, hi ha molts de monestirs que ja no en fan, de monestirs: Sant Pere de Rodes, Sant Miquel de Cruïlles, etc etc. Gairebé tots els edificis de monestirs existents o que han existit estan protegits patrimonialment. I en tot cas, es podria diferenciar si un monestir o escola funciona encara. El mateix val per a "mercat" (l'edifici i la funció).

Pere prlpz (discussiócontribucions)

@Quelet Això de modificar les llistes per recuperar els monestirs té un efecte secundari positiu que és que estan resorgint alguns elements que són a la vegada escola i edifici escolar, com ara Escola Ocata (Q24055029). Amb les darreres modificacions no perjudica les llistes de topònims, però si volem tenir les escoles com deies de tenir els monestirs potser caldria separar-los. Si convé, no crec que costi gaire fer una consulta amb els elements que siguin les dues coses.

Quelet (discussiócontribucions)

Sí, caldria separar-los. Perquè l'edifici de l'Escola Ocata té pàgina a la VP no pas per escola, sinó per edifici. N'hi ha molts de separats ja, però encara en queden d'units. Això a OSM també és recomanat: una cosa és l'edifici físic (building=yes, tipus way) i una altra l'escola ubicada a l'edifici (amenity=school, tipus node).

Resposta a «Seguiment de les llistes automàtiques de topònims de municipis»