Usuari:Amadalvarez/categories des de WD

De la Viquipèdia, l'enciclopèdia lliure

Antecedents[modifica]

El manteniment de categories representa una càrrega important de les activitats quotidianes de la VP.

Recentment s'ha generat un debat sobre la categorització incorporant el gènere femení (no consensuat formalment dins la comunitat). Des del punt de vista exclusivament operatiu, el seu desplegament comportaria un increment molt important de l'activitat de manteniment esmentada. Actualment tenim 176.000 articles de persones.

Per mirar de reduir la càrrega funcionen des de fa uns mesos uns bots de Pere prlpz que assignen categories per origen, categories per lloc de la mort, estudiants per centre educatiu i premiats per premi.

Categorització incorporant el gènere femení[modifica]

La possibilitat de que hi hagués "categories on la seva sintaxi sigui en femení", per exemple: "Escriptores catalanes", "Metgesses estatunidenques", etc. es va abordar temps enrere i va ser objecte d'una presa de decisió desfavorable. Recentment, s'ha tornat a reclamar aquesta funcionalitat.

Atès que el debat tard o d'hora es tornarà a produir, seria convenient que, addicionalment als aspectes de dret, oportunitat, normes que ho regulen, etc., s'incorporessin els aspectes tècnics i operatius afectats, ja que la decisió afecta al disseny tècnic i les capacitats tècniques condicionen la decisió.


La definició bàsica no resolt incògnites que, tot i haver-se debatut informalment durant la Viquitrobada-2021 i altres fòrums, no resulta fàcil decidir.

Algunes punts oberts, conseqüència de l'estructura de categories:

  1. Totes les categories depenen d'una altra més global que incorpora "de facto" tots els articles que hi ha per sota. L'arbre de categories en femení, podria:
    1. dependre de les actuals categories globals (homes+dones) tal qual estan. Això generaria una redundància conceptual perquè els articles de les categories femenines ja hi són a les globals.
    2. dependre d'unes categories globals sota el que hi hagues un arbre de categories en masculí i un altre femení hauria d'haver un altre en masculí (només homes), depenent tots dos de categories globals (dones+homes) ?. Si fos així, com s'hauria de reanomenar el conjunt masculí per diferenciar-lo del global?.
  2. Mantenir independència entre l'arbre de les categories actual (masculí genèric) com a conjunt global (dones+homes), amb l'arbre de categories en femení, que es desenvoluparia des de categoria:persones. Això permetria evitar els duplicats entre el contingut del nivell global i categories depenent d'ell (el bloc en femení). NO existirien categories on només hi hagués categories només amb homes.
  3. Com tractar els casos on no hi ha diferència de nom entre gèneres. Ex: Artistes, músics., etc.
    1. Si han de seguir junts per no haver diferència de nom, no s'acompliria l'objectiu de tenir subconjunts de dones.
    2. Si es creen les categories en femení, cal decidir la forma de construcció del nom.
  4. Mantindrem un paral·lelisme exacte entre l'estructura de bloc femení i bloc global? En aquest cas, podríem trobar-nos amb categories en femení amb menys de 5 articles o fins i tot buides.


etc.

Conceptes de categorització[modifica]

Categoria: És un receptacle que conté una llista amb el nom i enllaç dels articles i subcategories que apunten cap amb ella.

Enllaços dins els articles: Són els marcadors/etiquetes que hi afegim dins els articles indicant a quina llista els volem afegir.

Arbre de categories: Totes les categories excepte "Categoria:Principal", apunten cap a una o unes altres categories, temàticament superiors

Situacions anòmales:

  • Enllaços vermells als articles: és a dir la categoria no existeix (el receptacle), però la llista existeix a l'espera que hom crei la Categoria. Apareix a Especial:Categories_demanades.
  • Categories buida: no és una anomalia tècnica, sinó organitzativa. Poden existir categories només amb subcategories, sense articles. Si no té cap de les dues coses, caldria esborrar-la
  • Categoria sense categoritzar: és un error. Sense "categoria superior" no pertany a cap arbre i tots els articles i subcategories que en depenen d'ella, queden fora de les cerques descendents.
  • Enllaç redundant: és un error. Un article pot estar a més d'una categoria, però no d'un mateix arbre. És a dir, no pot estar en una categoria i en alguna de les seves subcategories.

Funcionament:

El funcionament habitual comença per afegir els enllaços de la categorització als articles. Si la categoria existeix, el procés està finalitzat.

Si l'enllaç és vermell -i no és un error- cal crear la categoria, és a dir el receptacle i categoritzar-la, afegint-li enllaços cap a categories temàticament superiors. En aquest pas, no hauríem de tenir enllaços vermells, ja que si estem creant una nova categoria, habitualment serà per "fer créixer l'arbre" cap a una estructura de més detall que d'on partíem. Si es produeix, caldrà crear-les.

Opcions d'automatització[modifica]

Seguint el procediment descrit al punt anterior, les tasques derivades d'un canvi (el de gènere o qualsevol altre) requereix:

  • Dissenyar l'arbre de categories. A diferència de creixement del dia a dia on l'arbre evoluciona segons els articles que es creen.
  • creació de les categories segons l'estructura d'arbres que es decideixi
  • incorporació de les categories als articles

Quan parlem d'automatitzar, podem:

  1. fer una acció singular que permeti "desdoblar" els arbres de categories (amb el disseny que es decideixi, que encara no està clar), fer els canvis que calguin tant als articles com a les categories i, a partir d'aquí, continuar amb les tasques de manteniment diari com s'està fent ara.
  2. disposar d'alguna solució tecnològica categoritzadora (bot, plantilla, ..) que actuï periòdicament aplicant unes regles per posar enllaços a categories dins els articles. Amb el coneixement que tenim ara, aquesta solució no crearia categories.

La primera opció pot comptar amb alguna ajuda tecnològica, si bé cal assumir que requerirà d'una important intervenció manual, especialment en la creació dels arbres de categories.

La segona opció redueix dràsticament el temps dedicat a pensar quines categories encaixen millor en un article determinat, ja que ho farà l'eina tecnològica. També millora la qualitat i harmonització entre articles similar. Un efecte al que no estem acostumats, seria disposar d'una major categorització, ja que no requereix cap esforç fer-ho.

La part més crítica de la segona opció és que es trasllada l'esforç a la creació dels paràmetres que requerirà l'eina per saber que ha de fer. D'alguna manera, si com hem dit al capítol anterior, el circuit actualment comença per "afegir enllaços als articles" per acabar "creant categories", en aquesta fórmula definir un paràmetre va associat a crear una categoria a l'espera que els articles s'enllacin.

Les dues opcions no són excloents. La primera opció és una tasca singular per afrontar un canvi de criteri i afectació massiva. La segona opció no ve derivada de cap canvi de criteri i, per tant, ja es pot aplicar amb l'estructura que tenim.

De fet, com hem comentat als antecedents, ja s'està fent un ús discret amb 4 tipus de categories, mitjançant un bot de Pere prlpz.

Utilització de WD per la creació de paràmetres de l'eina periòdica[modifica]

El que es descriu a continuació està circumscrit als articles de persones i els seus derivats (com ara, obres).

Es basa en unes propietats, algunes creades recentment, amb el mateix objectiu que nosaltres però amb una lògica de categories diferent a la nostra. Per tant, no sabem encara fins a quin punt seran 100% útils.

Característiques:



En procés En procés...

Material de treball[modifica]

Proves: Plantilla:Amadalvarez/traduccions 2

Queries:

Relatives a Categoria relacionada (P7084), propietat comodí per no haver de crear masses propietats específiques.

Debats i funcionament:


Casos: