Vés al contingut

Tema de Viquiprojecte Discussió:Viquirepte/GEC

Pere prlpz (discussiócontribucions)

Em temo que aviat ens acabarem els emparellaments fàcils, però n'hi ha uns que es podrien tornar fàcils de cop amb una mica de feina a Wikidata. Molts topònims catalans porten feina perquè el Mix'n'match no mostra l'etiqueta de Wikidata, i si no m'equivoco això és perquè l'eina no mostra l'etiqueta en català sinó l'etiqueta en anglès i castellà i molts topònims només tenen l'etiqueta catalana.

Si no podem tunejar l'eina per que mostri les etiquetes en català, potser es podria fer el mateix copiant l'etiqueta catalana a l'etiqueta castellana o anglesa dels items de topònims catalans que no en tinguin. Suposo que es podria fer amb una consulta primer i el Wikistatements després, però jo fa molt que no remeno aquestes coses.

KRLS (discussiócontribucions)

Hola Pere. No sabia que contestar-te. Si es miren les darreres 10 pàgines de "persones" aparellades automàticament tenen tots de serres i cursos fluvials de Catalunya. El problema és que no disposen de Localitzat a l'entitat territorial administrativa (P131) i llavors és difícil de saber si són el mateix objecte malgrat tenir el mateix nom. L'única minisolució que veig és afegir el P131 amb la comarca (sé que seria millor el municipi, però és més difícil de determinar) en aquells que pertanyin a Categoria:Rius de Catalunya per comarca i que no tinguin ara per ara P131 https://petscan.wmflabs.org/?psid=10654849. Es poden fer petites modificacions per llevar aquells que tinguin P131 amb la Q de Catalunya i substituir-la per la comarca en concret. Si fem això, no tindrem la millor solució, però podríem facilitar-nos la feina. Algú s'anima.

Pere prlpz (discussiócontribucions)

Sense filtrar persones, jo he trobat molts topònims que tenen descripcions raonables (per exemple, a la GEC la comarca i a Wikidata el municipi) i que lliguen, però que no mostra el label de Wikidata, suposo que perquè només hi és en català. Són casos que jo crec que si veiéssim els noms i coincidissin, crec que podríem acceptar amb tranquil·litat (si més no, els que tinguin noms poc repetibles).

Un altre tema són els que a la descripció de Wikidata només tenen "riu in Espanya" o "riu in Catalunya", i suposo que és perquè no tenen municipi ni comarca a Wikidata. Per aquests serviria la teva solució.

KRLS (discussiócontribucions)

He començat a omplir les etiquetes en anglès en el cas que no en tinguessin prèviament a tots aquells articles presents a Categoria:Rius de Catalunya per comarca. Tens alguna categoria així acotada que pugui abordar paral·lelament?

Pere prlpz (discussiócontribucions)
KRLS (discussiócontribucions)

Crec que hi ha hagut un canvi substancial amb aquestes 3 categories (i algunes altres menors). He afegit més de 10.000 etiquetes en anglès. He estat jugant una mica amb el Mix'n'match i crec que hi ha un canvi substancial; ara hi ha pàgines i pàgines amb l'etiqueta visible. Gran part dels emparallaments són amb noms molt locals i no crec que generem pràcticament errors. I els pocs falsos positius que puguin aparèixer es detectaran quan tinguem dos registre duplicats.

Pere prlpz (discussiócontribucions)

Fantàstic. Bona feina.

Mirant els que ja tenen nom i municipi (o comarca) en trobo bastants amb noms que semblen molt locals però que estan en llocs allunyats. Amb els que només diu coses com "location in Espanya" o "serra in Catalunya" jo aniria amb molt de compte.

I posats a demanar una bona solució per aquests seria pujar a Wikidata els municipis o comarques que tenim a les infotaules dels articles. De fet, això seria una millora més gran que posar-hi l'identificador de la GEC.

KRLS (discussiócontribucions)

Ho sé. És el primer que vaig començar a programar ahir, però hi ha masses casuístiques i no tinc temps per dedicar-m'hi ara. A la llarga s'hauria de traslladar la informació a WD.

Resposta a «Copiar etiquetes»