Tema de Viquipèdia:La taverna/Tecnicismes

Jaumeortola (discussiócontribucions)

M'ha semblat observar un canvi en les cerques de la Viquipèdia. Si fas una cerca exacta (és a dir, entre cometes) de la cadena "lluia", els resultats inclouen "lluia" i "lluïa". Abans només es mostraven els resultats de "lluia". Això passa tant en el formulari de la Viquipèdia com en l'API. ¿Sabeu si hi ha hagut un canvi realment? ¿Sabeu si hi ha alguna manera de forçar una cerca exacta? És a dir, si cerques "lluia" o "lluis", que els resultats no incloguin "lluïa" o "lluís".

Vriullop (discussiócontribucions)

Fa algun temps que van canviar el motor de cerca. Ara hi ha més opcions tècniques: mw:Help:CirrusSearch. Amb regex "insource:/lluia/" surt prou bé.

Jaumeortola (discussiócontribucions)

Gràcies. Això ho resol, sí. Hauré de retocar els scripts del bot perquè ara mateix és lentíssim per a algunes cerques.

Jaumeortola (discussiócontribucions)

Veig que el fet de cercar en la font (insource) fa que es trobin possibles errors en llocs que abans no es detectaven (p. ex. etiquetes internes). Això vol dir que cal que les excepcions en el bot siguin molt més robustes. ¿Algú pot compartir llistes d'expressions regulars d'excepcions dels bots? Les que tinc jo potser no són prou completes. Parlo de coses d'aquest estil:

\{\{([Ll]ang|[Ll]iteral|[Cc]ita|[Cc]itaci[oó]) *\|.*?\}\}

\{\{ORDENA:.*?\}\}

\[\[(Fitxer|Imatge|File):.*?\|

=.*?\.(jpg|JPG|gif|GIF|png|PNG|svg|SVG|html?)

\{\{convert\|.*\}\}

\{\{Wikidata list.*\{\{Wikidata list end\}\}

Resposta a «Cerca exacta de cadenes»