Vés al contingut

Tema de Viquiprojecte Discussió:Monuments

Pere prlpz (discussiócontribucions)
Vriullop (discussiócontribucions)

Això prové d'una de les campanyes WLM on teníem un projecte amb el Museu Etnològic Valencià. En algunes llistes, especialment de les tres Hortes, vam afegir els Béns Immobles d'Etnologia (BIE). Es pot veure en l'enllaç http://www.ceice.gva.es/va/web/patrimonio-cultural-y-museos/etnologia que és tractat com un "inventari sectorial no inclòs en l'IGPCV". Com que és un altre inventari, i per evitar duplicats, els BRL que també són a l'inventari etnològic els vam marcar com a "BRL etnològic". El projecte amb el Museu incloïa uns i altres.

En resum, els BRL etnològics són com el altres on no distingim la categoria, es poden marcar igual. Els BIE són d'un altre inventari sense cap figura de protecció específica. Aquests els deixaria estar, no són a totes les llistes i algun dia potser els separo dels monuments.

Una qüestió afegida amb els etnològics és que no tots tenen un codi estàndard i l'hem inventat pel principi WLM de codis únics. Per exemple el primer BRL etnològic de Llista de monuments de l'Horta Sud és 46.16.007-E2 quan en la fitxa diu codi=2. Els afectats són tots els que inclouen una E.

Vriullop (discussiócontribucions)

Una cosa més, segons es.wiki tots els BRL són a Wikidata. Bé això segons les seves llistes perquè n'he vist algun que no el tenen. El que ens falta és identificar el Qid en les nostres llistes per evitar crear duplicats.

Pere prlpz (discussiócontribucions)

Pot ser que hi siguin tots. Diria que a la llista de monuments del Baix Maestrat, que és la primera que he trobat, a tots els BRL el bot els ha trobat un element a Wikidata buscant per l'IGPCV. Els que falten són tots BIC, sobretot escuts.

Vriullop (discussiócontribucions)

Faltaran els BIC amb codi IGPCV que no tenen article. Aquests no estan inclosos en llistes a es.wiki.

Pere prlpz (discussiócontribucions)

Em sembla que hi ha una mica de tot, però em temo que els BRL que el bot no troba és perquè els han pujat a Wikidata sense el codi i així costa de trobar-los. Si més no, això passa amb dos d'Aiora. Segons com sigui de general ja veuré com evitar els duplicats.

Vriullop (discussiócontribucions)

Quan ho reviso manualment, amb baixa prioritat molt de tant en tant, comparo amb la llista d'eswiki. A es:Anexo:Monumentos de la comarca del Valle de Ayora hi ha els dos BRL d'Aiora amb el seu Qid. Com que els han pujat ells és una altra forma de localitzar-los.

Pere prlpz (discussiócontribucions)

Per aquí anava. Si són pocs copiar-los a mà i si són molts preguntar al que els va pujar i que després ha actualitzat dades si vol pujar els codis que falten, i si cal adaptar el meu codi per llegir les llistes d'eswiki.

Vriullop (discussiócontribucions)

Són molts. Faig ping a B25es que ho coordina. Deu tenir extraccions de l'inventari.

Pere prlpz (discussiócontribucions)
Pere prlpz (discussiócontribucions)

M'he muntat una eina per copiar i enganxar. Si no són gaires centenars, que crec que no, pot ser viable. Ara bé, seria més ràpid i més exacte si hi hagués manera d'identificar-los automàticament.

B25es (discussiócontribucions)

Explique per on vaig ara i potser trobareu coses ja fetes i altres que es podrien encarrilar fàcilment. Estic repassant els aprox. 6000 monuments utilitzant una consulta en sparql en Wikidata Query Service

La consulta és

SELECT ?item ?itemLabel ?foto ?coordenades ?p131 ?p1435

WHERE

{

   {?item wdt:P131 wd:Q1771181.}

   {

     {?item wdt:P1435 wd:Q11910247.}

     UNION

     {?item wdt:P1435 wd:Q23712.}

      UNION

     {?item wdt:P1435 wd:Q41477381.}

   }

  OPTIONAL {?item wdt:P18 ?foto}

  OPTIONAL {?item wdt:P625 ?coordenades}

  OPTIONAL {?item wdt:P131 ?p131}

  OPTIONAL {?item wdt:P1435 ?p1435}

  {SERVICE wikibase:label { bd:serviceParam wikibase:language "ca" }}

}


Això vol dir que estic llistant el BIC, els BRL i els BIE.

Noteu que a WD no estan tots els BIE, però els he afegit al llistat perquè no costa tant. I afegir-hi un altre wdt:P1435 wd:Qxxxxxx més no costaria massa. Només caldria que em diguereu el Q que pertoque. Així quedarien inclosos a les llistes de monuments generades per aquest procediment. Afegir més dades ja és una altra qüestió, però ja ho estic fent (p.ex. quan falten coordenades i les puc trobar, o amb les fotos)

De moment continue amb el repàs, municipi a municipi. A mig termini hauré d'adquirir un cert coneiximent de sparql, perque a hores d'ara vaig a colps i -ja ho havia dit Asaf Bartov, i el meu enginyer de capçalera m'ho recalca- "Sparql is difficult"

Pere prlpz (discussiócontribucions)

Em sembla que es complementa bé amb el que estic fent. Jo bàsicament:

  • Comparo el que diuen les llistes amb el que diu Wikidata. Si el bot troba diferències significatives miro on és l'error i l'arreglo.
  • Pujo a Wikidata uns quants paràmetres de les llistes, si no hi són.
  • Creo a Wikidata els elements dels monuments que encara no en tinguin.

Amb el tercer punt encara no he començat amb les llistes dels monuments valencians perquè no tinc clar com assegurar-me de no crear duplicats. La situació ideal és quan existeix un codi únic (com l'IGPCV) i es pot fer servir per comprovar que un monument ja existeix, però sembla que una part dels monuments no en tenen.

I completament d'acord amb que "Sparql is difficult".

Pere prlpz (discussiócontribucions)

Si no ho arreglem amb un codi, el tema d'evitar duplicats amb els que ja són enllaçats a eswiki crec que encara és tractable, i de moment diria que ja els tinc tots enllaçats entre el riu de la Sènia i el Palància. Esperem que més avall no es compliqui.

El meu dubte més important ara mateix és quin codi pujo quan comenci a crear elements. Pels BIC no hi ha problema perquè entenc que el codi que tinguem a la llista serà bo, sigui BIC o IGPCV, però pels BRL és més complicat perquè fora dels que tenen E al codi no sé distingir quins codis són bons i quins no. Se m'ocorre fer servir l'idurl per anar a mirar el web de la Generalitat, però ho hauria de programar expressament. A més, si pujo aquests BRL sense codi hi ha més risc que en el futur es produeixin duplicats si algú els puja d'eswiki o de qualsevol altra font.

Vriullop (discussiócontribucions)

Si et serveix, he aprofitat part de scripts per fer Usuari:Vriullop/igpcv.py. Obté el codi IGPCV a partir d'idurl. Pot servir per comprovar que la fitxa existeix, per comprovar el codi i també per trobar-lo quan no el tenim en llistes en el cas dels BIC amb codi RI.

Hi ha una part final que no retorna res però comprova el format estàndard. En algun cas m'havia trobat codis mal formats per falta d'un 0 inicial.

Pere prlpz (discussiócontribucions)

Gràcies. M'anirà bé.

Només quedarà pendent acabar de concretar com deixem els que no tenen codi IGPCV.

Pere prlpz (discussiócontribucions)

L'he incorporat al meu script i confirmo que m'està anant molt bé. He pogut pujar un grapat de BRL i arreglar errors de codi a Wikidata.

B25es (discussiócontribucions)

Moltes gràcies. Jo m'estic centrant en comprovar coordenades, fotos i duplicats. No estic creant nous Q (pel moment). No és tan ràpid com pensava, però ho aconseguiré!

B25es (discussiócontribucions)

Em trobe alguns duplicats, no tants com em pensava, i són molt senzills de fussionar. Hi ha altres problemes, com les coordenades errònies. Eixos dos temes els estic tractant amb el repàs per municipis. De passada fique el P1435 que calga als monuments que no el tenen (me'n he trobats també uns pocs).

El que no tinc clar encara és com substituïr les llistes manuals actuals de ca: i es:wiki (i si s'apunta més gent, millor) per llistes fetes explotant Wikidata. A hores s'ara la informació ja està. De tota manera, vullc acabar amb el repàs per municipis abans de clavar-me en més embolics.

Pere prlpz (discussiócontribucions)

És veritat que els duplicats són fàcils de fusionar quan els trobes, però són un dels problemes greus de Wikidata, perquè n'hi ha molts i perquè en general trobar-los no és fàcil. La meva impressió és que hi ha hagut molta gent volcant-hi bases de dades senceres sense comprovar què hi ha. Per exemple, fa uns mesos em vaig dedicar a fusionar platges, que moltes estaven triplicades (un item a partir dels nostres articles, un a partir de Geonames i les botopèdies, i un altre d'algú que havia pujat la base de dades del Ministeri). Aleshores, preferiria no afegir-hi més duplicats encara.

Per les coordenades el que jo faig és calcular la distància entre les coordenades de la llista i les de Wikidata i mirar-me tot el que passi d'un centenar de metres.

I sobre automatitzar les llistes, hi tenim molta feina feta que no crec que poguéssim posar en una llista automàtica. Si haguéssim de començar les llistes ara, segur que les faríem automàtiques com han fet en basc, però mentre hi hagi algú amb ganes de seguir mantenint-les estan millor manuals. Si algun dia em poso a automatitzar la Llista d'arbres singulars del Barcelonès#Barcelona ja us explicaré com m'ha anat.

Pere prlpz (discussiócontribucions)

He començat a pujar a Wikidata els BIC. @B25es Si vols trobar-los fàcilment per enllaçar-los a eswiki, pots mirar a les meves contribucions a Wikidata o Especial:Contribucions/PereBot (des d'avui). Alternativament es pot adaptar https://github.com/pere-prlpz/monuments/blob/master/paramwd.py i deixar que un bot les busqui tot sol.

Amb els codis dels que no són BIC hi ha diferents casos.

  • Els codis IGPCV que no sabem si són bons perquè tenen la forma habitual però al web de la Generalitat no hi surten. Hi ha alguna manera de comprovar-los més eficient que mirar manualment al web de la Generalitat o construir un scraper? Si no hi ha una altra manera suposo que acabaré fent alguna de les dues coses.
  • Els codis que sabem que són dolents, o sigui, els que tenen la E (o la M a eswiki).
B25es (discussiócontribucions)

Inicialment fiquí els codis "dolents" directament com si foren IGPCV. Però després vaig parlar amb Amador i em donà la idea de ficar-li al P1435 Q11910247 (estatus patrimonial = BRL) un modificador P217 (número de catàleg). Hi ha més llocs on trobar IGPCV però no he conseguit un catàleg complet o un lloc on consultar-los (vaig escriure a la Conselleria i tot, sense resultat). Pots trobar alguns IGPCV a les fitxes dels catàlegs que acompanyen els PGOU (Plans Generals d'Ordenació Urbana). És una minoria de casos, però potser que en troves alguns. Són documents públics i teòricament accesibles. De tota manera, una certa (gran) resistència a la frustració és necessària.

B25es (discussiócontribucions)
Pere prlpz (discussiócontribucions)

@B25es Un dubte: aquests catàlegs que no són l'IGPCV, quantes sèries són? He vist que a eswiki teniu els E i els M. Només hi ha aquests dos? O comencen a comptar des de 1 a cada municipi?

Si els nombres no són únics, potser no serà suficient posar el modificador Número d'inventari (P217).

B25es (discussiócontribucions)

Del tema dels "E" i els "M", és una estandarització que ja vaig trobar feta. Sé que Amador va estar en allò i crec que també -jem- d'es:wiki. Era per poder controlar Wiki Loves Monuments.

Les numeracions no sé com són exactament. Hi ha llistats de municipis que coincideixen, altres no. També hi ha vuits. Altres tenen números combinats amb altres coses, de manera que sembla que hi ha duplicats però realment són referències distintes per a coses diferents.

Un exemple que crec que t'aclarirà. Mira la categoria de Commons Category:Plan General de Ordenación Urbana de Valencia

Les primeres fitxes totes s'anomenen 04-01. Sembla que estan repetides, ja que 04 és el districte, i les dues o tres xifres següents serien el número dins el catàleg del districte. Doncs no! Perque un és EPA SU 04.01. El segon és EPH SU 04.01. El tercer es EPA SNU 04.01... Quan vaig pujar les fitxes a Commons vaig fer servir els títols que ja tenien al llistat de pdfs de l'Ajuntament. Ja veus que no és que jo haja fet una abreviació incorrecta, sino que és el costum referir-se als últims grups de xifres en lloc que fer servir la referència completa. És un exemple de València capital, però no crec que siguen els únics en fer coses semblants.

També podem trobar números usats dues voltes de veritat, però es molt extrany, no recorde on em va passar, però al menys una volta em passà. Més corrent és que els llistats de la Generalitat estiguen equivocats i fiquen dos números a un mateix bé, normalment amb noms diferents (per exemple una ermita que esdevingué esglèsia parroquial i aleshores l'han fitxada com dos edifics distints).

Jo crec que acabarem amb un catàleg molt superior al de la Generalitat, probablement acostant-nos al nivell de la suma dels municipals, però portarà temps. Parle de la quantitat d'ítems. Obviament no tenim la seua capacitat per a fer estudis de camp i altres processos de captació de dades.

Pere prlpz (discussiócontribucions)

Un altre problema que em trobo, a València, és el dels elements que surten dos colps al catàleg de la Generalitat, amb dos números IGPCV diferents, un BIC i un BRL. A més no és un BIC petit dins d'un BRL més gran, que tindria la seva lògica, sinó que no són el mateix, el petit és el BRL. No els estic separant, tot i que les dades que queden a Wikidata són un caos.

De moment m'hi he trobat amb la muralla cristiana, amb l'església de les Escoles Pies, amb Sant Joan de l'Hospital i amb Sant Vicent de la Roqueta. A Discussió:Llista de monuments de Ciutat Vella (València) estan una mica més explicats els tres primers.

B25es (discussiócontribucions)

Els problemes de numeració, més bé, les circumstàncies de la numeració, són diverses. Per un costat, cada autoritat desconfia de les altres. Aleshores normalment si un bé té un número en una llista municipal, a la llista de la Generalitat té un altres. P.ex. la Casa de Santa Bàrbara, 46.24.184-045 de la Generalitat, es correspon amb el R-066 del catàleg d'Ontinyent. No tenim certitut de perquè ho fan així, encara que sospitem que és per tindre un sistema controlat (pensant que "els altres" no ho controlen).

Però hi ha més. Alguns ajuntaments utilitzen la numeració de la Generalitat, probablement perquè ja està feta. A més la numeració de la Generalitat no és tan consistent com sembla. Torne a l'exple. 46 és província de València, 24 és comarca de la Vall d'Albaida, 184 és municipi d'Ontinyent. Però al Vinalopó Mitjà trobem identificadors on la comarca és "29" i altres on és "93". Sembla que hi hagué alguns adjustaments.

Altra cosa és la "promoció" d'una categoria a una altra. Per això hi ha bens que són BRL i BIC. O BIE i BRL. Supose que algún dia BIE, BRL i BIC. No tinc clar com és "per dins" el sistema de promoció, si la condició de BIC implica necessàriament deixar de ser BRL.

Que els BRL o BIC inclouen altres BRL o BIC (o fragments) és relativament freqüent, en especial on hi ha "Nuclis Històrics Tradicionals", també en casos com calvaris o altres ítems que es corresponen amb "conjunts", com qualsevol séquia, muralla, camí... Una séquia segur que tindrà un assut, segur que tindrà partidors, etc.

Crec que caldrà anar fent i de quant en quant "desunir" elements que s'han unit administrativament de manera, això, administrativa.

Pere prlpz (discussiócontribucions)

En aquests casos no estem parlant d'un element de la Generalitat que no lliga amb un de l'Ajuntament, com passa en d'altres llocs, sinó en dos elements a la mateixa base de dades de la Generalitat, i no són elements de segona categoria que els poden haver passat per alt, sinó que això passa amb alguns dels monuments més importants de València. Mirant un altre cas que m'acabo de trobar, que és l'església de Santa Mònica i l'asil a la Saïdia, nosaltres tenim encara dos elements a la llista (enllaçats al mateix element de Wikidata i a dos fitxes diferents de la Generalitat) i en castellà crec que n'heu deixat només un. No sé com s'hauria de quedar.

Vriullop (discussiócontribucions)
Pere prlpz (discussiócontribucions)

Sí, em referia a aquests dos.

Vriullop (discussiócontribucions)

Cal pensar que les administracions funcionen per processos administratius. Registren "expedients" i quan un BRL passa a ser BIC aquest és el que preval sense necessitat de cap expedient de baixa de BRL. Això si són exactament el mateix i no una part d'un conjunt.

B25es (discussiócontribucions)

He fusionat els Q de les esglésies de Teresa (Alt Palància) perque de fet només hi ha que una església, segons ens informaren a l'ajuntament.

Vriullop (discussiócontribucions)

Les discrepàncies entre llistes i fitxes va bé anotar-les a Viquiprojecte:Monuments/Revisió del registre, així tenim una referència en cas d'actualització per no repetir errades. En el seu moment aquesta pàgina la seguien els responsables de patrimoni de Catalunya per revisar i corregir el seu inventari. Del País Valencià no vam aconseguir cap interlocutor.

Pere prlpz (discussiócontribucions)

Al final em sembla que pels monuments sense codi IGPCV aplicaré la mateixa solució prudent que estic aplicant a Menorca: pujar només allò de que estigui segur. En aquest cas, la protecció BRL si hi és sí, però el codi no.

Un altre tema és que molts d'aquests codis ja estan pujats a Wikidata i donen una pila de repeticions :d:Wikidata:Database_reports/Constraint_violations/P2473#Unique_value. Per exemple, hi ha desenes d'elements amb el codi "1" o "2". Jo crec que s'haurien d'eliminar.

Pere prlpz (discussiócontribucions)
Pere prlpz (discussiócontribucions)
Resposta a «BRL etnològic a Wikidata»