Viquipèdia:La taverna/Propostes

Salta a la navegació Salta a la cerca

Sobre aquest tauler

Propostes

A l'apartat de propostes de la Taverna busquem millorar la Viquipèdia, interpretar criteris i normes o aplicar noves idees que encara no s'han dut a terme.

(Vegeu els arxius anteriors i l'arxiu de l'historial)

La taverna:
Novetats | Propostes | Ajuda | Multimèdia | Tecnicismes
Paucabot (discussiócontribucions)

He estat revisant les categories que no tenim relacionades amb ítems de Wikidata. Ara mateix n'hi ha 904, però fa uns dies n'hi havia més de 1400. La majoria de les que queden ara diria que són categories susceptibles d'existir en altres viquipèdies i s'hi hauria de fer la feina de cercar-los l'equivalent.

Us voldria demanar (a part de si qualcú vol ajudar a cercar les categories equivalents d'aquests 900, evidentment) si, en crear una categoria, podríeu mirar de fer l'esforç d'enllaçar-la amb les seves equivalents per tal d'evitar arribar a aquests nombres.

Gràcies!

Pere prlpz (discussiócontribucions)

Està previst incloure aquesteses categories a la quinzena de la qualitat? Pot ser un bon moment per fer neteja.

Paucabot (discussiócontribucions)

Podria ser una bona idea ...

Amadalvarez (discussiócontribucions)

Sabeu que tenim una llista reduïda perquè el Panotxa està d'any sabàtic i en @Townie ha fet un inventari de mínims. Ara bé, no hi ha cap problema si hom hi afegeix noves activitats.

Kippelboy (discussiócontribucions)

Em sembla una bona pràctica, Pau. Ho intentaré dur a terme quan generi noves categories.

Paucabot (discussiócontribucions)

Després de la quinzena de la qualitat, ja només queden 65 categories sense ítem. A veure si entre tots podem acabar de buidar la llista!

Paucabot (discussiócontribucions)
Paucabot (discussiócontribucions)

Bé, ara que hem aconseguit fer neta aquesta llista, es veu que ens hem equivocat. Segons d:Wikidata:Notability/ca, només hauríem de crear l'ítem de la categoria si aquesta existeix en una altra llengua:

A més, els enllaços de lloc en elements de categoria a pàgines de categoria de Wikimedia Commons estan permesos solament si i només si estan enllaçats amb pàgines de categoria d'altres llocs de Wikimedia.

Hauríem de mirar de seguir aquesta directiva a partir d'ara, idò. O sigui: si trobam interwikis, els enllaçam i si no, deixam l'ítem de la categoria sense crear.

Yuanga (discussiócontribucions)

Només s'aplica a les categories?

Paucabot (discussiócontribucions)

Ara no sé si ho estic interpretant malament. Això només seria vàlid per a les categories de Commons?

Yuanga (discussiócontribucions)

Posa: "An item is acceptable if and only if it fulfils at least one of these two goals, that is if it meets at least one of the criteria below". I el primer punt diu: "It contains at least one valid sitelink to a page on Wikipedia, Wikivoyage, Wikisource, Wikiquote, Wikinews, Wikibooks, Wikidata, Wikispecies, Wikiversity, or Wikimedia Commons."

O s'han equivocat o no ho estic entenent...

Resposta a «WD a les categories noves»
Stonsking (discussiócontribucions)

Buenas tardes a todos.

A finales del año pasado había realizado pequeñas ediciones en algunas banderas que identifican el país o la federación de procedencia de equipos y deportistas. En concreto había modificado la entrada de Rafa Nadal, así como algunas relacionadas con el Mundial de Clubes de la FIFA y con las últimas ediciones de la UEFA Champions League.

Todas las modificaciones o casi todas consistían en poner la bandera de España en lugar la de la comunidad autónoma respectiva al lado de los deportistas de determinadas comunidades autónomas para guardar la uniformidad de las entradas y no mezclar banderas de comunidades autónomas y de países soberanos aleatoriamente y sin justificación aparente.

Mi sorpresa ha venido cuando todas estas ediciones han sido revertidas sin ninguna aclaración. Así que expondré por qué me parecen adecuadas.

En estos hilos a los que me refiero no se sigue un criterio lógico a la hora de identificar países o federaciones. En los hilos correspondientes a las competiciones internacionales de clubes de fútbol se hace lo siguiente: A los equipos catalanes y vascos se les identifica prácticamente siempre con una bandera de Cataluña o del País Vasco al lado respectivamente, aunque de forma paradójica en algunas tablas se les cuenta dentro del total de españoles y en otras no. A los equipos de la Comunidad Valenciana, de las Islas Baleares y de Galicia se les coloca una bandera de su comunidad o de España según cuadre, sin criterio aparente. Y a los del resto de comunidades se les coloca la de España, que es también lo que se hace con los del resto de países, salvo casos muy concretos. Lo mismo ocurre en artículos en los que figuran deportistas, personalidades y eventos deportivos, como el Conde de Godó.

Si esta contradicción ocurriese entre artículos distintos sería un problema pero menor, la cuestión es que ocurre dentro de los mismos artículos.

He buscado a ver si había alguna norma al respecto y no he encontrado ninguna (si existe agradecería alguien me la pasase).

Mientras tanto, ante este problema yo veo tres criterios lógicos que se podrían seleccionar:

1- Si lo que se pretende es identificar a los equipos, deportistas, ciudades, eventos… con su región/comunidad autónoma/estado federado, se habría de poner la bandera de su región a todos, y por tanto ponerle al Bayern de Munich la de Baviera, a la Juventus de Turín la del Piamonte y al Atlético de Madrid la de la Comunidad de Madrid, etc.

2- Si lo que se pretende es hacer la identificación por federaciones nacionales (esto tendría lógica para deportistas y clubes deportivos) habría que poner al Barcelona la de España, dado que Cataluña no cuenta con federación nacional integrada directamente en la UEFA ni en la FIFA. Sin embargo, sí que tendría sentido mantener a los equipos escoceses con la bandera de Escocia, etc.

3- Si lo que se pretende es hacer la identificación por países soberanos, carecerían completamente de sentido las banderas de Escocia, de Gales, del País Vasco o de Cataluña, entre otras muchas, para tal fin.

En consecuencia, no veo ningún motivo riguroso para identificar a los equipos bávaros con la bandera de Alemania mientras se identifique a los valencianos con la de la Comunidad Valenciana. Esto supone una contradicción porque se siguen criterios diferentes para lo mismo, creando confusión.

Entiendo que en Viquipèdia se busca la máxima rigurosidad posible y no ambigüedades, incoherencias o incorrecciones que puedan llevar a equívoco al lector. Por consiguiente, es lógico pensar que las clasificaciones se han de hacer siguiendo un patrón definido, como los tres que acabo de proponer, y no influenciado por motivos ideológicos alejados de la realidad empírica.

Saludos.

Panotxa (discussiócontribucions)
Stonsking (discussiócontribucions)

Entonces retiro el último párrafo, porque esa norma da lugar a ambigüedades (por lo que veo se asocia el término región a comunidad autonomía pero no tiene por qué ser así, de hecho la palabra casi es la más abierta que se podría poner, da pie a usar cualquier bandera), incoherencias (se ponen comunidades autónomas al nivel de naciones soberanas) e incorrecciones (como las que se muestran a continuación).


Pero bueno, al margen de que la norma es una norma política, señalo a continuación unos cuantos artículos de cierta relevancia donde no se cumple:

Lliga de Campions de la UEFA

Lliga Europa de la UEFA

Recopa d'Europa de futbol

Primera divisió espanyola de futbol

ULEB EuroCup

Selecció de futbol d'Espanya

Real Club Celta de Vigo

Real Club Deportivo de La Coruña

Athletic Club

Real Sociedad de Fútbol

Reial Club Deportiu Espanyol de Barcelona

Real Madrid Club de Fútbol

Iago Aspas Juncal

Secció d'hoquei patins del Futbol Club Barcelona

Hockey Club Liceo

Unió Esportiva Arlequins de Perpinyà

David Ferrer i Ern

Rafael Nadal i Parera

Premi Capital Verda Europea

Català

Stonsking (discussiócontribucions)

En resumen. La norma ni es adecuada si se quiere construir esto con un poco de rigor ni se está respetando.

Panotxa (discussiócontribucions)

El sistema emprat per la comunitat per decidir aquest sistema és una presa de decisió, pertant si creus que cal canviar-lo, hauràs d'iniciar un procés similar i el resultat del nou procés serà el que s'apliqui a partir d'ara.

AlbertJB (discussiócontribucions)

Pel que fa a l'article de la Primera divisió espanyola de futbol, vaig posar les banderes de les comunitats autònomes per als jugadors espanyols sense pensar que això pogués ocasionar cap maldecap a ningú. En altres paraules, no ho vaig fer amb mala fe, tot al contrari. Ja direu, però, si cal canviar-ho.

Resposta a «Banderes»
Yuanga (discussiócontribucions)
Paucabot (discussiócontribucions)

Malgrat que es va fer una votació, no es tenia molt clar el que es votava. Es parlava de "categorització per gènere", però no estava clar quins casos incloïa i quins no. Per exemple, hi havia qui deia que les categories d'esports tenien sentit perquè eren modalitats esportives diferents. És per això que, malgrat la votació, no es va implementar mai el que suposadament es va acordar. Només en algunes categories es van fer actuacions i, en cap es va implementar el tema de les consultes per gènere (que es veu que no interessava). És per això que, a hores d'ara, encara queden multitud de categories per gènere: Viquiprojecte:Categorització/Dones.

Paucabot (discussiócontribucions)

Afegesc que el fet que confirma que la demanda de poder categoritzar les dones com a tals és real, és que regularment van categoritzant-se dones directament a Categoria:Dona. Ara mateix hi ha 23 biografies.

Yuanga (discussiócontribucions)

Caldrà fer quelcom perquè biografies de dones se’n fan cada dia... com les categoritzem llavors?

Paucabot (discussiócontribucions)

Jo he fet la part fàcil, que és indicar el problema ;) La solució és la part difícil...

Resposta a «Jugadors i jugadores»
Yuanga (discussiócontribucions)

Bon dia a tothom! Fa un temps que em ronda pel cap una idea que vull compartir amb vosaltres, per veure si seria factible:

Els "rosters" dels equips (vegeu aquest per exemple) s'han d'anar actualitzant regularment amb les noves incorporacions, baixes, alçades, edats... això no és cap problema, però la feina realitzada no és aprofitable a la resta de wikis. És a dir, cal actualitzar manualment el roster a totes les wikis que tinguin aquesta mateixa plantilla, el que resulta amb una gran quantitat de plantilles desactualitzades a totes les wikis del món.

La idea seria generar una plantilla que pogués aprofitar els canvis realitzats en altres wikis, i si s'actualitza el roster d'un club en una wiki, el canvi es pugui aplicar a la resta. Penso que wikidata hauria de ser la solució, tal i com passa amb les infotaules, però no tinc clar com. Per tant, primer em caldria saber si és possible dur-lo a terme; i segon, en el cas que el primer punt fos assumible, aconseguir consens amb la resta de wikis.

Com ho veieu la resta?

Amadalvarez (discussiócontribucions)

Wikidata és (o millor dit, serà) la solució.

Per a què funcioni, els editors de les WP (nosaltres també) hem d'assumir que és millor posar-ho a WD que a WP.

Com posar-ho ?. Ara no ho sé. Per dos motius:

  1. No sé com funciona això dels rosters (cada quan es publique/actualitzen, qui és l'autoritat o font que ho fa/publica, quan el contingut canvia on es conserva l'anterior, etc.)
  2. L'àrea de coneixement d'esports és molt complexa i encara ningú s'ha arremangat per definir l'ontologia que hauria de tenir a WD. Es van fent petits avenços quan algú s'entesta a documentar els campionats mundials, per exemple, però ningú ha definit quin i com s'informa el contingut d'una temporada de l'equip d'un esport determinat d'un club, o com s'introdueix l'historial de resultats d'un jugador,... Vull dir que li falta maduració al tema dins l'àmbit WD.

A la meva pàgina de WD recullo una frase d'un editor que ens recorda que a WD hi ha molt per fer.

Si tens paciència per aportar elements que ens permetin dibuixar l'estructura que ens caldrà, podríem crear un wikiprojecte i mirar d'implicar editors de WD.

Yuanga (discussiócontribucions)

@Amadalvarez els rosters es publiquen normalment al començament de la temporada, tot i que es poden produeir canvis en el transcurs d'aquestes.

Es pot fer una "consulta" per mostrar, per exemple, els jugadors que tenen a Membre de l'equip esportiu (P54) un equip determinat amb la Data de finalització (P582) no establerta o menor que la data actual? (així ho faria amb php, no sé com es fa amb WD).

"Si tens paciència per aportar elements que ens permetin dibuixar l'estructura que ens caldrà, podríem crear un wikiprojecte i mirar d'implicar editors de WD." No sé quins elements necessites, però si puc ser d'ajuda en alguna cosa, endavant!

Amadalvarez (discussiócontribucions)

@Yuanga Quan vaig començar a migrar les bio dels esportistes cap a la infotaula persona, vaig mirar d'esquematitzar quines eren les entitats d'informació que existien o haurien d'existir i les seves relacions.

Vaig veure que moltes d'aquestes estructures no existien encara a WD i, per tant, sovint no existien definides les propietats que podrien ser menester. En aquell moment, no vaig fer la llista i em vaig limitar a ocupar-me de les que em caldrien per cobrir les necessitats de la infotaula persona. Les infotaules d'esportistes amb molt contingut de resultats, no ha estat possible migrar-les precisament perquè es mostra (manualment) una informació que, d'existir, hauria de formar part d'estructures encara no abordades.


Crec que caldria revisar la validesa de l'esquema en 3 sentits:

  • És correcte el que es va dibuixar fa 2 anys ?
  • L'esquema no contempla el vector temps (temporada, fase, partit, etc.). Com i on s'hauria d'aplicar ?
  • En quina estructura s'han d'ubicar determinades dades que pertanyen de forma lògica a més d'una (ex.: una Temporada esportiva (Q27020041) ha de tenir la llista d'equips que hi participen aquella temporada dins d'Equip participant (P1923), o bé, un equip com el Betis o el Barça ha de tenir la llista de temporades dins de Participà en (P1344) ?). Hi ha una colla d'aquestes dualitats a mida que anem passant d'estructures amb dades exclusives, a estructures que comparteixen dades o, fins i tot, altres estructures.

Bé, per començar, cal pensar en això, després veure fins on han arribat altres editors de WD, els projectes i les propietats existents.

Seguim. Merci,

Yuanga (discussiócontribucions)

@Amadalvarez Realment són preguntes que semblen no tenir una resposta clara encara, si més no fins que no ens hi posem i ens trobem amb la realitat del projecte. Intentant clarificar una mica el tercer punt amb la meva experiència penso que seria millor que les temporades esportives tinguessin el llistat d'equips que van participar; d'altra manera, clubs com el Barça amb més de cent anys d'història tindrien un llistat inacabable de propietats Participà en (P1344) entre lligues, copes, competicions europees i d'altres competicions.

Jarashi (discussiócontribucions)

Hola, @Yuanga i @Amadalvarez !

Molt interessant, aquesta discussió, encara que, com apunta l'Amadalvarez, sembla que l'estructura actual de WD (el lloc que ho gestionaria idealment) encara està molt verda per fer això. Per exemple, no crec que hi hagi una estructura o un mecanisme que lligui equip, jugadors i temporada (o competició, si volem fer, per exemple, el roster de la selecció brasilera al Mundial de Rússia).

Se m'acut que potser hi podria haver un tipus d'entrades a WD que fossin 'roster', amb un ítem d'equip (club o selecció), un ítem de temporada (o campionat) i una llista d'esportistes que la conformin. Però això requeriria anar-les fent, una per una, manualment. Potser es podria automatitzar amb un bot (no sé si és possible) que mires els esportistes, un per un, i omplís/actualitzés l'entrada de 'roster' segons quin és l'actual equip de l'esportista (per cert, hi ha alguna manera de saber de forma automàtica, en l'entrada d'un esportista, quin és el seu equip actual? Ho dic per les infotaules d'esportista…). I, potser, es podria estendre a temporades anteriors per anar creant un corpus exhaustiu… I amb una plantilla {{roster}} o {{plantilla}} o {{plantilla equip temporada}} (amb equip i temporada com a paràmetres) generaríem el quadre corresponent (llista de jugadors i les dades bàsiques del jugador, una nova cerca per cada jugador).

Si no hi ha aquestes entrades 'roster', potser es podria fer una plantilla {{roster actual}} o {{plantilla actual}} que mirés quins esportistes tenen com a equip actual l'equip on està inclosa (de nou, hi ha alguna manera de saber de forma automàtica, en l'entrada d'un esportista, quin és el seu equip actual?) i fes el quadre. Una cerca realment titànica, que no es podria fer cada vegada que es demanés la pàgina sinó un cop cada X temps (com el listeria).

Però sembla clar que, per poder fer alguna cosa d'aquestes, necessitem que l'estructura de WD, el seu format i la fortalesa de les interconnexions internes maduri encara més…

Yuanga (discussiócontribucions)

@Jarashi Gràcies per participar en aquesta discussió. Respecte a la teva pregunta "hi ha alguna manera de saber de forma automàtica, en l'entrada d'un esportista, quin és el seu equip actual?" la resposta és sí: mirem per exemple Sergi Vidal i Plana (Q2067787), veuràs que conté Membre de l'equip esportiu (P54) amb el llistat de tots els clubs en els que ha jugat. No detalla les temporades (temporada a temporada) però si que mostra les respectives Data d'inici (P580) i Data de finalització (P582). Si es pogués cercar a wikidata: "jugadors que siguin membres de tal equip esportiu amb la data de finalització X" crec que tindriem molt fet.

Jarashi (discussiócontribucions)

Hola, @Yuanga!

Ja sé que una persona pot mirar les fitxes i veure quin és l'equip actual d'un esportista... Jo preguntava si es pot fer d'una forma mecànica, que ho pugui interpretar una màquina, i per tant sigui informació que podem utilitzar (semi)automàticament...

Amadalvarez (discussiócontribucions)

Miro de respondre conjuntament:

@Yuanga Penso com tu pel que fa a la P1344 en el cas de les temporades, però, avui per avui, se està fent a l'inrevés. Suposo que perquè encara no han identificat/debatut la magnitud i la millor solució i, el que resulta més còmode és "solucionar el problema que tens per la via directa". Com que ningú ha treballat el concepte "temporada", però si el concepte "equip", doncs s'han estimat més "tenir la informació a mà".

Això em permet respondre a @Jarashi (al que agraeixo i animo a la participació): No pensem l'estructura en funció dels "outputs" que tenim o coneixem. Les estructures han de tenir entitat pròpia, amb propietats que "els pertanyen per definició" + aquelles que apunten o els vinculen amb altres estructures. El roster és una "vista" d'una situació (per això volia saber quan es publicava) on es combinen dades de la temporada de l'equip i dels jugadors; no m'ha semblat que hi hagi cap de pròpia. Si que és cert és que per "construir-lo" ho haurem de fer amb una eina (infotaula, listeriabot o ja veurem com) que reculli allò que li fa falta. Si dissenyem les estructures en funció del que volem veure, les farem amb informació redundant/incoherent o impossibles de fer servir per a uns altres usos.

Sobre l'equip actual: el model de dades actual preveu que les P54 d'un jugador tinguin les dates (P580-P582) i, com ja passa amb els càrrecs (P39), es marqui com a preferred el valor més actual. Però en el 99% dels casos aquesta informació no s'ha aportat. Això ens enllaça amb un altre problema que no ens hauria de distreure d'un bon disseny: la qualitat de les dades.


Que us sembla si ens traslladem a la Viquiprojecte:Adaptació_de_plantilles_a_Wikidata/infotaules_d'esport#Model_de_relacions_organitzatives, convidem altres experts de l'esport o de WD a participar i mirem de respondre entre tots els dubtes o forats que feia en forma de pregunta ?. Ja sé que el que us mola son els rosters, però no arribarem a destí si no desbrossem la selva. Merci,

Yuanga (discussiócontribucions)

@Amadalvarez @Jarashi Per mi endavant amb el trasllat, quantes més mans i caps experts pensant millor.

Segurament aquesta informació no s’aporta (en un 99% dels casos) per dos motius:

  1. Es fa manualment a la infotaula, el que és més rapid i visual per a un editor sense experiència a WD
  2. Fer-ho a WD no aporta res extra a la infotaula (sembla a primer cop d’ull), tot i que a la llarga acabes veient el contrari.

Així és al menys com ha evolucionat la meva experiència amb WD. No cal dir que actualment totes les dades que afegeixo a una infotaula ho faig a WD, i no com a paràmetres dins aquesta. Porta un temps adonar-se’n.

Amadalvarez (discussiócontribucions)

Quanta raó !.

La inversió que fas quan poses coses a WD la veus quan construeixes coses que abans ningú en feia per mandra i, si les feia, eren impossibles de mantenir. Ex: l'abans i el després del llistat de municipis.


Miraré de preparar un espai per seguir el debat en els propers dies. Mentre, seguim per aquí si voleu.

Yuanga (discussiócontribucions)

@Amadalvarez puc anar fent alguna cosa al respecte mentrestant?

Amadalvarez (discussiócontribucions)

@Yuanga M'he embolicat amb altres temes i tinc a mitges fer una proposta de treball. Podries mirar d'engrescar algú altra per quan toqui debatre i entrar dades.

Donem aquesta setmana de marge i tindrem camp de treball.

Merci,

Resposta a «Rosters d'equips»
Jmarchn (discussiócontribucions)

Amb l'actualització automàtica des de wikidata en la plantilla {{infotaula malaltia}} dels noms dels fàrmacs utilitzats en les malalties (el camp "Medicació"), aquests noms presenten el corresponent (i existent a wikidata) nom en anglès si no hi ha la traducció al català a wikidata.

N'he actualitzat uns quants a wikidata, però això és feina poc eficient. A TermCat n'existeix la llista corresponent dels noms del fàrmacs i la traducció catalana. Seria possible automatitzar (amb un bot) a wikidata l'assignació del nom en català dels fàrmacs?.

ESM (discussiócontribucions)

Fins on jo sé, es podria fer una càrrega massiva dels noms en català però caldria fer un treball previ (manual, al meu entendre) d'aparellar les Q ja existents amb els termes nous. Es va més ràpid, però no és una cosa 100% automàtica. Si el termcat també ofereix terminologia en anglès potser es podria fer un bot que busqués l'etiqueta en anglès i la casés amb el termcat, però jo fins aquí ja no hi arribo.

Amadalvarez (discussiócontribucions)

@Jmarchn Tens forma de tenir una simple taula nom anglès-nom català ?. A partir d'aquí crec que sabria com industrialitzar-lo

Jmarchn (discussiócontribucions)

@Amadalvarez, miraré de posar-me en contacte amb el TermCat, tot i que no ho podré fer fins d'aquí a uns 10 dies doncs no seré a casa. Ja me n'encarrego i ho tirem endavant (ja t'avisaré).

De moment vaig actualitzant (a wikidata) els noms dels Tipus, Símptomes i Causa de dels articles de malalties (camps que s'utilitzen en la infotaula malaltia) i que no es poden sistematitzar amb una traducció de forma automàtica com podrem fer amb els fàrmacs.

Amadalvarez (discussiócontribucions)

com ho fas, un a un ?.

Amadalvarez (discussiócontribucions)

@Jmarchn T'he preparat un procediment per fer càrregues massives de les traduccions manuals.

Quan vulguis t'ho explico

ESM (discussiócontribucions)

Jo també ho voldria saber!

Amadalvarez (discussiócontribucions)

@ESM

En síntesi és:

  • Fer un llistat dels ítems d'una temàtica que no tinguin label en català (amb un sparql que ara et passaré)
  • baixar-se el resultat (format CSV) en un excel. Fer les següents manipulacions:
    • A la primera columna, eliminar el codi que hi ha abans de la Q (http://www.wikidata.org/entity/) mitjançant un reemplaçar
    • Insertar dues columnes entre la primera (que té el codi Q) i la segona (que té el label en EN / ES)
    • A la columna B escriure Lca a totes les línies (que vol dir Label català)
  • Anar afegint la traducció dels textos en la columna C (calabel)
  • Quan s'acabi la feina de traducció, es copien les 3 primeres columnes (la de la Q, la que té el text Lca i la que té la traducció) com a paràmetres del Quickstatements. Si hi ha files que no s'han traduït, elimina-les abans de copiar i pegar. Ja tornaran a sortir la propera vegada que s'executi el SPARQL.

S'entén ?

Aquí passo els materials.

El SPARQL (tunejat per a que et deixi ja insertades les dues columnes de la descripció original):

SELECT ?item ?Lca ?calabel ?itemLabel ?itemDescription WHERE {
#  *******************  Les següents condicions funcionen com un AND i fan la selecció 
  ?item wdt:P31   wd:Q12136.     # és malaltia
  ?item wdt:P1995 wd:Q162606.    #especialitat: endocrinologia 
#  **************************************************************
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en,es". }
  FILTER(NOT EXISTS {
    ?item rdfs:label ?lang_label.
    FILTER((LANG(?lang_label)) = "ca")
  })
}
ORDER BY ?itemLabel
LIMIT 300

Prova-ho !

----

Per carregar amb el quickstatement: https://tools.wmflabs.org/wikidata-todo/quick_statements.php

  • T'autentifiques amb el OATH i acceptant
  • enganxes el contingut de les 3 primeres columnes (sense l'encapçalament) en la caixa que et mostra al començament
  • fes Do it !
ESM (discussiócontribucions)

Val, és el que mé so menys tenia al cap. Requereix un cert treball manual però és tremendament més ràpid que anant Q per Q. @Jmarchn, si finalment ho fas, tingues present que el text que vulguis que quedi com l'etiqueta (label) de cada Q ha d'anar entre cometes.

Amadalvarez (discussiócontribucions)

Si. Això és per fer lots de 50-70 articles.

El temps de la part manual és igual per 1 que per 100 articles i el temps de traduir i escriure és igual per cada article tant si ho fas un a un com en lot.

Per tant, en lot s'avança molt

Jmarchn (discussiócontribucions)

Hola!,

No havia tingut temps de mirar-ho (i provar-ho) fins ara. Molt pràctic i interessant!. Ja m'ho miraré amb més detall.

Podria fer-se una consulta enllaçant dos bases de dades (la de wikidata i la de cawiki) que retornés els elements del camp Tipus (P279) utilitzats en els articles de la Viquipèdia que utilitzin infotaula malaltia i (per fer-ho més complicat) que alhora no tinguin traducció al català?.

Moltes gràcies!

Amadalvarez (discussiócontribucions)

@Jmarchn em penso que la query és aquesta:

#llista les P279 sense label en català que apareguin com a property en algun ítem amb:
#  P31= malaltia i P1995 = una especialitat mèdica (a l'exemple, infectiologia)
# Mostra, com ajuda, el nom i descripció de l'ítem on es fan servir
SELECT ?tipus ?Lca ?calabel ?tipusLabel ?item  ?itemLabel ?itemDescription WHERE {
  ?item wdt:P31 wd:Q12136.      # és malaltia
  ?item wdt:P1995 wd:Q788926.    #especialitat
  ?item wdt:P279 ?tipus.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,en,es". }
  FILTER(NOT EXISTS {
    ?tipus rdfs:label ?lang_label.
    FILTER((LANG(?lang_label)) = "ca")
  })
}
ORDER BY ?tipusLabel
LIMIT 300

Prova-ho !

Prova a veure. Tingues en compte que, com que hi ha una línia per cada ítem on apareix, un mateix valor de P279 pot sortir llistat més d'un cop. Ordena per Tipuslabel per a que quedin agrupats i només ho tradueixis un cop.

La raó de posar "especialitat mèdica" dins les condicions de filtre és per poder fer seleccions més curtes o temàticament més similars, però si la vols treure s'executarà per a tots els ítems amb P31= malaltia.

El procediment és el mateix descrit abans: baixar a excel, traduir sobre columna calabel (en aquest cas el contingut de tipusLabel) i després pegar les 4 primeres columnes sobre el quickstatements.

Ja em diràs si he encertat

Amadalvarez (discussiócontribucions)

@Jmarchn hi pensaré. Lo de la infotaula em grinyola, perquè barrejar WD i contingut de VP em supera.

Hi pensaré altra via i te la proposo.

Respost més amunt.

Pere prlpz (discussiócontribucions)

Amb bot segur que es pot fer, però porta feina. Suposo que depèn que hi hagi algú que tingui temps i que serveixi per milers d'articles, perquè si no segurament no val la pena la feina de fer-ho.

Jmarchn (discussiócontribucions)

@Amadalvarez, @Pere prlpz, @ESM, Hola!.

He estat enfeinat amb altres coses i també en traduir i corregir a wikidata el contingut dels camps que es llegeixen des de wikidata de la infotaula malaltia, de tots els articles de malalties de la Viquipèdia, que no corresponen als fàrmacs (camp Medicació). Alguns milers d'edicions (detectant no pocs errors i aprofitant de traduir-ho i corregir-ho en d'altres idiomes).

També m'he adonat de no poques associacions poc convenients en el camp Medicació, i que convindria canviar a wikidata. Per exemple, si mireu Inflamació i al camp Medicació (objecte de la proposta) hi podeu veure una molt llarga llista de fàrmacs, quan el que convindria seria que constés solament antiinflamatori.

Vaig parlar per telèfon i vaig enviar una carta al TermCat. La resposta després de donar una explicació ben detallada ha estat:

"En relació amb les denominacions del Lèxic de Fàrmacs, ens hauríeu de fer una petició per escrit, al director del TERMCAT,  i nosaltres us respondríem autoritzant la cessió de les dades amb les condicions següents:

“Us autoritzem a utilitzar les denominacions catalanes i angleses per a fer una obra derivada sense finalitat comercial i d’accés obert.

Aquesta cessió es fa amb caràcter gratuït, únicament per a usos no comercials i amb reconeixement de l’autoria de l’obra.”

Cap de l’Àrea de Projectes Terminològics"

No sé com es pot garantir que algú no recuperi la correspondència de wikidata per a usos no comercials i com fer el reconeixement de l'autoria de l'obra. Algú pot fer aquesta gestió, ara que ja està explicada i el TermCat està al cas?. Moltes gràcies!!

Amadalvarez (discussiócontribucions)

@Jmarchn Lo de l'autoria s'arregla via referències fent servir el "afirmat per" + "URL de la referència", si la tenim.

L'altre tema ho responc més avall. Bona feina !

Vriullop (discussiócontribucions)

Nota: eliminades dades personals del correu.

ESM (discussiócontribucions)

@Jmarchn: T'agraeixo la feina que estàs fent en aquest àmbit tan sensible, on tanta gent consulta la Viquipèdia quan alguna cosa no rutlla amb la seva salut. Ara bé, no oblidis que la llicència de Wikidata és CC0, i per tant es permet gairebé qualsevol ús que s'imagini, inclòs el comercial, perquè les metadades no tenen drets d'autor. És més, la llicència de la Viquipèdia (BY SA) permet usos comercials, així que l'autorització del termcat no acaba d'encaixar. De totes maneres, no acabo d'entendre que el termcat tingui els drets d'autor sobre la terminologia. Pensava que els termes (que no les definicions) no tenien drets d'autor. Lamento no poder-te ajudar més en aquest aspecte.

Amadalvarez (discussiócontribucions)

@ESM Potser no és tant el dret sobre la terminologia, com sobre el catàleg. En alguns casos la propietat que es vol protegir no és el nom de la cosa, sinó l'esforç de sistematitzar el catàleg raonat de les coses. Si no és això, no ho entenc; i si fos això, la solució passaria per demanar-li la terminologia oficial a partir d'una llista aportada per nosaltres.

En tot cas, em poso malalt quan responen d'aquesta forma des d'entitats que es paguen amb diners públics. Els diners es paguen per a que facin una cosa d'utilitat pública. Aquesta resposta podria ser vàlida si qui ho demana és una empresa privada per a ús privat, però li estem demanant per accelerar la difusió del coneixement normalitzat per ells.

Una solució seria enviar-los-hi (passant per registre d'entrada) una llista de conceptes amb traduccions barroeres i plenes de barbarismes indicant-los que, llevat que ells ho corregeixin, aquesta serà la versió que publicarem.

Pere prlpz (discussiócontribucions)

Wikidata té la llicència de domini públic. Aleshores, fins i tot si demanéssim al Termcat que publiquin aquestes dades amb la mateixa llicència genèrica de dades obertes de la Generalitat (si no és que ja ho estan fent) i que fins ara ens ha servit per carregar imatges a Commons, no seria prou per carregar-ho a Wikidata.

On sí que podem tenir èxit és mirant què és el que té drets d'autor. No estem fotocopiant un diccionari, i la informació és lliure però hi ha un dret de bases de dades. Tinc bastant clar que copiar unes quantes traduccions a Wikidata no deu vulnerar cap dret d'autor, però pujar el diccionari sencer paraula per paraula potser sí, perquè el Termcat no té drets d'autors sobre les paraules (com diu l'@ESM), però si sobre el recull.

Probablement, valdria la pena preguntar a Wikidata, perquè no crec que sigui el primer cas com aquest que es troben.

Notifico en @Vriullop, que potser ens pot ajudar.

Vriullop (discussiócontribucions)

La llicència genèrica de gencat no serveix per Wikidata. Demanen atribució que és incompatible amb CC-0.

Jo mateix he carregat traduccions de Termcat al Viccionari. En uns casos per col·laboració amb cessió de fitxers CC-BY-SA. En altres casos puntualment per camps temàtics genèrics. Amb la introducció de lexemes a Wikidata hi ha un debat sobre el copyright dels diccionaris. Per fer-ho simple, s'entén que una definició té copyright i que una traducció no en té. Ara bé, les bases de dades, com a recull de termes sistemàtic i organitzat, estan protegides a la Unió Europea i hi ha seriosos dubtes de si es respecta a Wikidata. Tot plegat fa que el desenvolupament dels lexemes es faci amb peus de plom i amb els Viccionaris alarmats. No veig viable la càrrega de fitxers de Termcat a Wikidata, tot i que és possible fer-ho puntualment.

Vriullop (discussiócontribucions)

No sé de quin diccionari del Termcat estem parlant, però per exemplificar-ho. A la Terminologia Oberta cerco "medicaments" i em surt el Diccionari de recerca clínica de medicaments. Ofereix dos fitxers amb diferents llicències: HTML amb CC-BY que inclou només traduccions i XML amb CC-BY-ND que inclou les definicions. El primer el puc carregar al Viccionari, però no es pot importar del Viccionari a Wikidata. Demanar-los que canviïn a CC-0 em sembla demanar-los la lluna.

Jmarchn (discussiócontribucions)

M'he posat novament en contacte telefònic amb la responsable del TermCat, mostrant a la pràctica com funciona wikidata i les limitacions de Creative Commons que utilitza. Ho ha comprès i m'ha dit que s'ho estudiaran.

Jmarchn (discussiócontribucions)

@Vriullop@Pere prlpz@Amadalvarez@ESM. Hola!. Resposta del Cap de de l’Àrea de Projectes Terminològics del Termcat:

"No hem oblidat la teva petició i fa dies que vam fer la gestió amb el Col·legi de Farmacèutics, que són coautors del diccionari.

Seguirem el cas i tan aviat com et puguem respondre ho farem."

Jmarchn (discussiócontribucions)

@Vriullop@Pere prlpz@Amadalvarez@ESM. Hola!.

  1. S'ha acceptat el traspàs de les equivalències, només s'ha de formalitzar (i com que estem en vacances, serà pel setembre).
  2. TermCat està interessat a que les relacions de la Viquipèdia siguin més intenses i volen articular una reunió pel setembre.
  3. Diversos membres de l'Acadèmia de Ciències Mèdiques (amb qui vaig contactar amb el Congrés de Metges i Biòlegs de parla catalana a Manresa) segurament voldran un taller.
Amadalvarez (discussiócontribucions)

@Jmarchn Molt bones notícies !!!.

li faig ping al @Kippelboy per a que vagi agendant

Jmarchn (discussiócontribucions)

@Kippelboy@ESM@Vriullop@Pere prlpz@Amadalvarez.

Perdoneu el retard en la resposta, he estat de baixa per la intervenció del meu condrosarcoma del genoll, ja vaig amb una crossa i millorant.

He parlat amb la responsable del TermCat per fer l'actualització dels noms a WikiData de fàrmacs i ja tinc la llista (amb 3173 fàrmacs). No solament hi ha el terme en anglès i el corresponent en català, sinó que a més hi ha el grup (o, infreqüentment grups) al que pertany cada fàrmac (denominat en el fitxer com "areatematica") i que es podria (a més d'actualitzar el nom en català) afegir o actualitzar en la Descripció de WD.

Exemples:

amoxicillin -> amoxicil·lina. On consta la descripció amb un inespecífic "compost químic". En aquest cas es podria substituir per "antibiòtic penicil·línic sensible a la penicil·linasa".

befunolol -> befunolol. No hi és en català i, per tant, no hi ha descripció. La descripció podria ser la unió de les dues àrees que (aquest fàrmac) conté, i que quedés així "blocador d'adrenoreceptors beta; emprat en el tractament del glaucoma".

Podeu veure, descarregar els fitxer de:

http://www.saniwiki.cat/farmacs/LexicFarmacs.xml

http://www.saniwiki.cat/farmacs/LexicFarmacs.zip (l'anterior comprimit, per descarregar, junt amb l'innecessari descriptor).

Pere prlpz (discussiócontribucions)

Bona feina. Ara bé, tornant al tema de les llicències, està documentat quin permís han donat els del Termcat per l'ús d'aquest fitxer?

Vriullop (discussiócontribucions)

Diria que aquest és el Lèxic de fàrmacs fet pel Col·legi de Farmacèutics de Barcelona i el Termcat. La llicència normalment la indica en l'opció de descàrrega, però en aquest cas remet a la secció de Terminologia Oberta i allà no es troba. En general, les obres del Termcat fetes en col·laboració tenen restriccions. També en general, en la Terminologia Oberta estan protegits els fitxers que inclouen definicions però no els fitxers amb traduccions.

ESM (discussiócontribucions)

Bona feina @Jmarchn! Si et cal un cop de mà per fer la importació a WD un cop estigui clar el tema de les llicències, demana! Ànims amb la recuperació!

Jmarchn (discussiócontribucions)

Tal com us vaig dir, TermCat va parlar amb el Col·legi de Farmacèutics i han donat el vist i plau per tal de que nosaltres (Viquipèdia) utilitzem les dades. Jo no sé com posar-m'hi a fer el bolcat.

Pere prlpz (discussiócontribucions)

Quan carreguis les dades a Wikidata estàs donant permís per que absolutament qualsevol en faci qualsevol ús absolutament sense cap limitació i sense ni esmentar el TermCat ni el Col·legi de Farmacèutics. És aquest el vist-i-plau que tens ben documentat?

Jmarchn (discussiócontribucions)

No tinc cap document, només la paraula de qui va fer els tràmits (de TermCat al Col·legi de Farmacèutics). De tota forma saben que a la Viquipèdia tot està sobre Creative Commons, i així es va transmetre al Col·legi de Farmacèutics. Van respondre afirmativament per tal de que en féssim l'ús explicat (actualitzar WD automàticament), Per això m'han facilitat el fitxer.

Vriullop (discussiócontribucions)

Només es tracta d'afegir les etiquetes en català. Si ho faig manualment consultant el Termcat no hi ha cap problema. Si es fa amb QuickStatements és el mateix.

Jmarchn (discussiócontribucions)

La gràcia és fer-ho automàticament, és clar....

Resposta a «Nom dels fàrmacs»

Transcripció del grec modern

19
Resum per Paucabot

Sobre aquestes transcripcions

Leptictidium (discussiócontribucions)

Bona tarda.

Fa unes setmanes, en MALLUS i jo vam tenir una discussió amistosa sobre quin criteri hauríem de seguir per a la transcripció del grec modern i, més concretament, del nom Κωνσταντίνος.

En MALLUS apunta que la proposta de transcripció de l'Associació Catalana de Neohel·lenistes encara no té valor normatiu. Per aquest motiu, prefereix seguir el criteri de la grafia més habitual, que en molts altres idiomes i la gran majoria de versions lingüístiques de la Viquipèdia és "Konstantinos".

Jo, en canvi, defenso que cada idioma té els seus propis criteris de transcripció i, per tant, el que facin en altres idiomes és poc rellevant per a la Viquipèdia en català. Tot reconeixent que la proposta de l'ACN encara no té valor normatiu, subratllo que es tracta tanmateix d'una font fiable i, per tant, hauríem de seguir el seu criteri (Konstandinos) mentre no hi hagi una font encara més fiable que la contradigui.

En MALLUS i jo vam acordar dur el tema a la comunitat per tal d'assolir un consens que serveixi no només per a aquest article en concret, sinó per a tots els articles en situació similar. Gràcies pels vostres comentaris.

Amadalvarez (discussiócontribucions)

No us enfadareu si opto per l'abstenció, oi. Confesso que em supera. Disculpeu.

Pau Colominas (discussiócontribucions)

A mi també em va gran el tema, però intentaré opinar. Per fer-ho, necessito saber...

1. MALLUS, quines són les fonts (en català) que sostenen el teu punt?
2. Leptictidium, se sap per què la proposta de l'ACN, tot i ser de 2009, encara no ha estat aprovada?

Leptictidium (discussiócontribucions)

Bon dia. Fins on he pogut esbrinar, és degut purament als tempos organitzatius de l'IEC. De fet, quan vaig enviar un correu electrònic per preguntar-ho fa un mes o així, em van respondre que està prevista la votació de la proposta per l'IEC, sense que em poguessin donar més informació quant a terminis.

Pere prlpz (discussiócontribucions)

El cas d'Andonis/Antonis Samaràs és el mateix? Si ho fos, aquest té l'avantatge que podem mirar què fan habitualment les fonts fiables en català i ens pot servir de guia.

Leptictidium (discussiócontribucions)

Sí, es tracta de la transcripció del dígraf ντ en posició intervocàlica, per tant és el mateix cas.

Pere prlpz (discussiócontribucions)

Em pensava que amb aquest ho podríem resoldre, però com a mínim al Punt-Avui sembla que no es decideixen, perquè hi ha resultats amb d i amb t.

Leptictidium (discussiócontribucions)

És veritat que els mitjans de comunicació no solen ajudar gaire amb aquestes coses perquè el mateix diari pot publicar el mateix nom de manera diferent segons el periodista que escrigui l'article. Mireu els noms dels esportistes de l'espai postsoviètic, per exemple.

L'única font en català que em consta que ha establert uns criteris consolidats per a la transcripció del grec modern és, precisament, l'ACN.

Envio també una consulta a l'Optimot a veure si ens poden ajudar a treure'n l'entrellat.

Leptictidium (discussiócontribucions)

La meva pregunta a l'Optimot, i la resposta que m'han enviat:

----------------------------------------------------------------------------------------------------------------------

Benvolguts,

Quan transcrivim noms propis del grec modern al català, com es transcriu el dígraf "ντ" en posició intervocàlica (per exemple, en els noms Αντώνης, Κωνσταντίνος o Αντύπας)?

El transcrivim com a "nt", com a "nd", o d'una altra manera?

Moltes gràcies.

----------------------------------------------------------------------------------------------------------------------

En la transcripció del grec modern al català, el dígraf que consulteu es transcriu nd quan és en posició intervocàlica.

L'Optimot és un servei de resolució de consultes que ofereix la Direcció General de Política Lingüística conjuntament amb l'Institut d'Estudis Catalans i el Centre de Terminologia TERMCAT. Per les característiques de la vostra consulta, en la resolució de la resposta hi ha intervingut l'Institut d'Estudis Catalans, que té, entre altres funcions, la d'acadèmia de la llengua catalana, i n'estableix la normativa per mitjà de la seva Secció Filològica.

Barcelona (discussiócontribucions)

Sembla llavors que haurem de posar ND , tot i que la forma tradicional NT és més freqüent

MALLUS (discussiócontribucions)

Podem posar un altre exemple: Demis Roussos Normativament, aquesta "ou" hauria de ser "u", perquè és tal com sona el dígraf. Però el personatge era conegut com a "Roussos", i es va acordar de mantenir aquesta forma (la discussió va sorgir en el moment de la mort del personatge, no fa pas tant). Potser Andonis Samaràs és més usual que "Antonis", però "Konstandinos" no ho veig pas tant usual. En tot cas, com ja vaig dir, la qüestió resta oberta, i no veig problema a mantenir "Konstantinos" com a "forma usual", tot remarcant que "Konstandinos" és la forma recomanada de transcripció del nom grec.

Pere prlpz (discussiócontribucions)

El cas de Demis Roussos és força diferent, perquè no fem servir la transcripció del seu nom grec sinó el nom artístic que ha fet servir a occident.

Leptictidium (discussiócontribucions)

Aleshores, a quina conclusió arriba la comunitat?

Leptictidium (discussiócontribucions)

Potser valdria la pena obrir una presa de decisions al respecte.

Leptictidium (discussiócontribucions)

Reobro aquest tema de l'any passat a fi de tancar-lo amb una decisió de la comunitat en un sentit o l'altre. M'agradaria conèixer especialment l'opinió de la comunitat sobre la resposta de l'Optimot citada més amunt.

Pere prlpz (discussiócontribucions)

El fil té dos anys. L'aprovació de la proposta dels neohel·lenistes ha avançat gaire en aquest temps?

En qualsevol cas, amb les dades que hi ha fins ara al fil (sobretot la resposta a l'Optimot) jo m'inclino per fer servir nd (Konstandinos, Andonis) al nom dels articles indicant la forma alternativa i fent les redireccions oportunes.

Leptictidium (discussiócontribucions)

Acabo un parell de coses i truco a l'IEC per intentar obtenir una resposta ràpida.

Leptictidium (discussiócontribucions)

Resposta: per qüestions personals dels membres de la Comissió de Transcripció i Transliteració del Grec Modern, que segurament no cal repetir aquí, el treball sobre aquest tema es va quedar estancat durant uns anys, però s'ha reconstituït la Comissió amb nous membres i confien tenir el projecte acabat "aviat" (sense poder concretar més què vol dir "aviat").

Pau Colominas (discussiócontribucions)

Opino com el Pere. Amb la informació del fil, em decanto per fer servir el criteri de l'ACN en tots els casos.

Resposta a «Transcripció del grec modern»
Enric (discussiócontribucions)

El 8 de gener de 1993 va néixer un tal Guillem Pico, boxejador, conegut com a "foca roneanta" o "wili". Voleu dir que no és un fake, això? I em sembla que fa molt que es va arrossegant...

Pcm (discussiócontribucions)

Doncs això sembla. La informació va ser entrada el 2009 per un usuari anònim. Aleshores aquesta persona tenia, si realment existia, 16 anys i hauria de ser conegut. Buscant a sant google no surt cap boxejador amb aquest nom, Bona troballa

Paucabot (discussiócontribucions)
Resposta a «8 de gener»