Tema de Viquipèdia:La taverna/Novetats

Nou cas de plagi massiu, feina per fer

36
Resum per Paucabot
Xavier Dengra (discussiócontribucions)

Bon dia,

Avui he pogut parlar per telèfon amb responsables de Festes.org per un cas de plagi reiterat de diversos fragments del seu web als nostres articles que vulneren els drets d'autor. Fa temps vam rebre un cas concret, però avui s'han mostrat molt més enfadats perquè cada cop en troben més i molt explícits. Exemples:

Ens indiquen que han vist també paràgrafs massa similars en d'altres articles i que per ells tot això ja passa de taca d'oli, atès que és el seu ofici i que la llicència és una CC-BY-NC (no comercial; no apta per a la Viquipèdia). Caldria tenir eines per poder detectar més enllà de manualment quins altres articles podrien estar afectats per plagis i parafrasejats similars. Potser es tracta de mitja dotzena o fins a una cinquantena.

Algú pot ajudar a detectar quines pàgines wiki inclouen l'enllaç URL del web Festes.org i començar per aquí? Coneixeu cap altra opció que ens permeti investigar i eliminar amb prou profunditat aquests casos? Ho poso en coneixement de VP:PA, crec que és força greu i amb certa prioritat.

Yuanga (discussiócontribucions)

Serveix això per començar?

Cataleirxs (discussiócontribucions)

Al web de la Generalitat està enllaçada, com a referència, la pàgina de festes.org. Però és evident que el text que apareix a VP és el de festes.org i no el de la Gene, com bé diu en Xavier.

Notifico a @Medol, que va crear l'article.

Vriullop (discussiócontribucions)

Aquí hi ha un problema, almenys amb el primer article citat. És la Generalitat qui fa un copyvio de festes.org, que cita com a font però ho rellicencia CC-0 sense cap més avís. Caldrà revisar-ho igualment, però segur que ens ha induït a copiar-ho confiadament. Caldrà fer-ho notar perquè no ens carreguin el mort.

Per revisar: Especial:Enllaços web/www.festes.org

Xavier Dengra (discussiócontribucions)

Gràcies als tres! @Vriullop, veig que això ens "cenyeix" a 350 cerques. Recomanes mirar-les una a una a doble pantalla i anar revisant-ho així? Sembla una feinada de vertigen... Hi ha cap possibilitat d'un bot amb codi senzill que ens pugui donar un cop de mà creant una taula de pressumptes casos (que pogués servir fins i tot per a més endavant)? Pregunto des del desconeixement, perquè 350 articles a priori són un % gros del total de cultura popular catalana de la Viquipèdia. Gràcies!

Vriullop (discussiócontribucions)

Sé que existeixen en l'àmbit acadèmic eines per detectar-ho, però no en conec cap. Tractar pàgines especials amb bot no és fàcil. Ho he copiat i netejat amb un editor regexp a Viquipèdia:Infraccions de drets d'autor/festes. Està en brut, amb articles repetits i pàgines que no són articles.

Beusson (discussiócontribucions)

Ei! M'ajudeu? Aquests últims dies només ho reviso jo, això no és problema, però tinc poc temps, i tot plegat duraria més del que voldria. Crec que és un tema que no s'hauria de dilatar en el temps.

Xavier Dengra (discussiócontribucions)

Iep @Beusson; jo estic d'exàmens de l'escola doctoral i vaig editant en les estones lliures, però ho tinc aparcat fins que acabi la setmana vinent. Tinc un pòstit groc a la pantalla per a que tan bon punt passi, hi faci una altra passada :)

Beusson (discussiócontribucions)

Ja en queden menys de 100. Fem una apretada més i ja ho tenim!

Medol (discussiócontribucions)

Aviam, això crec que va ser d'un projecte xucladors. Enteníem que el contingut de Gencat era de llicència lliure, i el vam xuclar. Pel que he mirat, sembla que ara han canviat els textos de Gencat, potser perquè els primers que van publicar eren copyvio. Potser ho podríem resoldre copiant els textos actuals de Gencat, almenys en els casos que he mirat sembla que són diferents dels de festes.org. En qualsevol cas, si s'ha d'esborrar, feu-ho sense problema. Gràcies per mirar-ho i informar-me.

Xavier Dengra (discussiócontribucions)

No són xucladors perquè la majoria de plagis són o bé directes de Festes.org, o bé és evident que la Gencat ho ha copiat de Festes.org. En el cas de l'article de mostra, la Gene cita Festes.org però és que citar li recita tot el contingut fil per randa. Suposo que la llicència CC-BY-NC ha passat mala jugada aquí.

Vriullop (discussiócontribucions)

Cercant "festes.org" a patrimonifestiu.cultura.gencat.cat no he trobat cap altre cas. N'hi ha un parell que són copyvios de festes.org però no en tenim article.

KajenCAT (discussiócontribucions)

He estat mirant quan va ser la creació de la pàgina i em consta que la pàgina de la Generalitat fa 18-19 anys que es va crear mentre que la de Festes.org fa 20 anys. Ara bé, no sé quina era el contingut de les dues pàgines. Per tant, per molt que Festes.org fos el primer que ho va publicar, no implica res.

Vriullop (discussiócontribucions)

Seria un dubte raonable en una investigació nostra, però quan un autor es queixa de copyvio se li ha de concedir la raó. No volem problemes.

Xavier Dengra (discussiócontribucions)

Exacte, davant del dubte hem de ser conservadors pel que fa al plagiarisme. Ens hi juguem molt de prestigi.

Beusson (discussiócontribucions)

He donat un cop d'ull als 4 articles que hi ha a la llista més propers geogràficament a mi (Gegant Boig i Geganta Boja de Solsona, Gegants de Cardona i Cavalcada de Reis de Cardona) i en cap dels quatre hi ha plagi. En els dos solsonins se cita festes.org com a ref. d'una frase, en el de cavalcada de reis serveix com a ref. de la lletra d'una cançó i a Gegants de Cardona com a ref. d'una dada històrica. El que no sé és com marcar-los perquè no hi perdi el temps un altre editor. No sé si és factible fer una mena de taula, llista o similar on es puguin anar marcant els ja revisats entre tots.

Amortres (discussiócontribucions)

Jo he revisat el meu proper Sant Galderic i un altre grapat d'articles, marcat al llistat. També son referències a elements del cos del text però no he trobat res mínimament considerable plagiat.

Xavier Dengra (discussiócontribucions)

Moltíssimes gràcies, @Beusson. A partir de divendres vinent que acabo un examen important, em temo que si no hi ha possibilitat d'un bot faré jo mateix una macrotaula per anar marcant-los manualment. Indagaré llavors si hi ha cap programari que em pugui ajudar.

Potser d'aquest cas se'n podria extreure de demanar alguna eina antiplagi a la Llista de Desitjos de MetaWiki, oberta fins al 23 de gener.

Vriullop (discussiócontribucions)

Llegiu més amunt. La llista està feta

Beusson (discussiócontribucions)

Gràcies @Vriullop He ratllat els que ja he revisat, hi he posat l'explicació, la meva opinió i ho he signat. Així tots podem revisar-ho alhora i si algun no agrada, podem debatre sobre que fer amb l'article en concret. Què us sembla fer-ho així?@Xavier Dengra@Cataleirxs@Medol@KajenCAT@Yuanga

Beusson (discussiócontribucions)

Per altra banda, que us sembla si eliminem directament de la llista totes les planes d'usuari / discussions?

Vriullop (discussiócontribucions)

En l'espai d'usuari tampoc hi pot haver copyvios. En les discussions és més difícil, normalment només és un enllaç, com a molt una cita breu.

Paucabot (discussiócontribucions)
Vriullop (discussiócontribucions)

És el que dèiem més amunt, a vegades es pot concedir el benefici del dubte, però davant una queixa no ens podem agafar a interpretacions. En aquell moment no especificaven "no comercial", però tampoc la GFDL que teníem llavors amb uns termes més foscos. Vist ara en perspectiva, es va tancar en fals, només calia haver-los preguntat.

Pere prlpz (discussiócontribucions)

De fet, la llicència antiga tampoc ens serviria perquè no diu res de la modificació del contingut i no se'n pot entendre que la permeti.

Xavier Dengra (discussiócontribucions)

En van sortint poc a poc. N'he revisat 15 més i n'han aparegut 2: Mag Maginet i Nyítol, copyvios força explícits i tots dos creats posteriorment al canvi de llicència. Potser podem estar parlant d'una desena o vintena llarga, però caldrà seguir mirant-los un a un...

Beusson (discussiócontribucions)

Jo n'he trobat un altre, ja corregit també.

Xavier Dengra (discussiócontribucions)

Acabem de superar la desena de plagis amb diversos viquipedistes implicats i tenint en compte que molts dels articles són de fa pocs anys i d'usuaris autopatrullats. Comença a ser amoïnant; n'hi ha que estan copiats amb frases o paràgrafs sencers i gairebé fil per randa.

Mercè Piqueras (discussiócontribucions)

Aquesta últim cap de setmana, quan vaig participar en el 50è diumenge de les referències, en què se'ns recomanava que poséssim referències a partir d'obres que tinguéssim a casa, vaig trobar un article que era un plagi del llibre de 2010 que jo consultava per posar-hi les referències: Científics d'Osona. Diccionari històric i biobibliogràfic dels científics nascuts o vinculats a Osona, de Pasqual Bernat. Per no posar-hi la plantilla de copyright, el vaig refer i vaig buscar-ne més referències, tasca que em va dur algunes hores.

Avui, fent una mica de cerca, he detectat més d'una quinzena d'articles de científics que estan copiats total o parcialment d'aquell llibre. Els que he trobat estan fets per dos editors; un, només va estar actiu el 2013 i l'altre no ha fet cap edició des de 2016. Per tant, em sembla que seria inútil advertir-los i demanar-los que modifiquin els articles perquè deixin d'infringir la llei de la propietat intel·lectual. Potser si fossin només dos o tres, els modificaria jo mateixa, però sóc lenta redactant o modificant articles i tinc altres coses per fer. Així que els he anat posant la plantilla copyright en la qual, a més de l'obra plagiada, he indicat la pàgina corresponent.

No sé quina serà la fi d'aquests articles. Per una banda, em sap greu que desapareguin, perquè són part de la història de la ciència i de la tècnica del nostre país, però, per una altra, penso que la Viquipèdia, com a projecte seriós que és, no ha de tenir articles que infringeixin la llei de la propietat intel·lectual. Per tant, sempre que em trobi copyvios, seguiré posant-hi la plantilla advertint-ho.

Pere prlpz (discussiócontribucions)

Ja és això: marcar-los quan els trobem.

Ara bé, el més preocupant és si els altres articles d'aquests editors també són copyvio.

Paucabot (discussiócontribucions)

Els dos usuaris, Marcoficial i Eliavj, tenen patrons d'edició molt similars, usen les mateixes fonts i semblen ser el mateix editor. Si fos possible, hauríem de revisar tres obres que usen molt aquests usuaris:

  • BERNAT, Pasqual. Vicgrafies. Revista de Biografies Vigatanes
  • SALARICH I TORRENTS, Miquel S., S. YLLA-CATALÀ I GENÍS, Miquel. Vigatans il·lustres. Vic, Patronat d'Estudis Osonencs, 1983, Osona a la Butxaca.
  • ROVIRÓ I ALEMANY, Ignasi. Diccionari de filòsofs, teòlegs i mestres del seminari de Vic (1749 – 1968). Temple Romà, Vic, Patronat d'Estudis Osonencs, 2000, Osona a la butxaca.

Si trobam copyvio en qualcuna d'aquestes tres obres, hauríem d'esborrar tot el que hagin escrit aquests dos usuaris.

Xavier Dengra (discussiócontribucions)

Semblen antigues i de tall local; potser serà complicat de trobar-les a Internet i es tracta de plagi a mà (des del llibre en paper). L'altra opció abans d'esborrar podria ser convèncer l'Institut d'Estudis Osonencs per a que les alliberi amb una CC-BY-SA. Si és que hi ha copyvio, ens estalvia feina i a ells visibilitat bibliogràfica i una segona vida de les obres.

Paucabot (discussiócontribucions)

En tot cas, abans de fer res, hem de comprovar si hi ha copyvio. Jo crec que el més fàcil és demanar l'obra concreta a una biblioteca i comprovar-ho. Supòs que qualcú de Vic ho tendrà relativament fàcil. I sinó, a la meva biblioteca, de vegades m'han demanat a una altra biblioteca que m'enviïn una còpia digital de la pàgina que els he sol·licitat.

Paucabot (discussiócontribucions)
Mercè Piqueras (discussiócontribucions)

El copyright del llibre Científics d'Osona. Diccionari... és compartit pel Patronat d'Estudis Osonencs (per a l'edició de 2010) i l'autor. Pel que fa a l'autor, jo podria fer una primera gestió per esbrinar si accediria a alliberar-lo amb una llicència CC-BY-SA. Conec Pasqual Bernat perquè durant uns anys vam coincidir en el Consell Directiu de la Societat Catalana d'Història de la Ciència i de la Tècnica.

Xavier Dengra (discussiócontribucions)

És complicadíssim trobar-los, marcar-los i eliminar-los/esmenar-los, però que ho acabem fent fins i tot si són passats uns anys ja és quelcom del que podem estar orgullosos. És una llàstima que, sabent que és un problema de base, no tinguem prou eines tècniques com per afrontar-lo.

Resposta a «Nou cas de plagi massiu, feina per fer»