Aprenentatge a classificar

De la Viquipèdia, l'enciclopèdia lliure
Una possible arquitectura d'un motor de recerca aprenent automàticament.

Aprenentatge a classificar [1] o classificació aprenent automàticament (amb acrònim anglès MLR) és l'aplicació de l'aprenentatge automàtic, normalment supervisat, semisupervisat o de reforç, en la construcció de models de classificació per a sistemes de recuperació d'informació.[2] Les dades d'entrenament consisteixen en llistes d'elements amb algun ordre parcial especificat entre els elements de cada llista. Aquest ordre s'indueix normalment donant una puntuació numèrica o ordinal o un judici binari (per exemple, "rellevant" o "no rellevant") per a cada ítem. L'objectiu de construir el model de classificació és classificar llistes noves i no vistes de manera similar a les classificacions a les dades d'entrenament.

La classificació és una part central de molts problemes de recuperació d'informació, com ara la recuperació de documents, el filtratge col·laboratiu, l'anàlisi de sentiments i la publicitat en línia.

A la figura adjunta es mostra una possible arquitectura d'un motor de cerca aprenent per màquina.

Les dades d'entrenament consisteixen en consultes i documents que les coincideixen juntament amb el grau de rellevància de cada coincidència. Pot ser preparat manualment per avaluadors humans (o avaluadors, com els anomena Google), que comproven els resultats d'algunes consultes i determinen la rellevància de cada resultat. No és factible comprovar la rellevància de tots els documents i, per tant, normalment s'utilitza una tècnica anomenada agrupació: només es comproven els pocs documents principals, recuperats per alguns models de classificació existents. Aquesta tècnica pot introduir un biaix de selecció. Alternativament, les dades d'entrenament es poden derivar automàticament mitjançant l'anàlisi dels registres de clics (és a dir, resultats de cerca que van obtenir clics d'usuaris),[3] cadenes de consultes,[4] o característiques dels motors de cerca com el SearchWiki de Google (substituït des d'aleshores). Els registres de clics poden estar esbiaixats per la tendència dels usuaris a fer clic als principals resultats de la cerca en el supòsit que ja estan ben classificats.

Exemples de mesures de qualitat de classificació:

Referències[modifica]

  1. Foundations and Trends in Information Retrieval, ISBN 978-1-60198-244-5, DOI 10.1561/1500000016. Slides from Tie-Yan Liu's talk at WWW 2009 conference are available online Arxivat 2017-08-08 a Wayback Machine.
  2. Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar (2012) Foundations of Machine Learning, The MIT Press ISBN 9780262018258.
  3. Joachims, T. (2002), "Optimizing Search Engines using Clickthrough Data", Proceedings of the ACM Conference on Knowledge Discovery and Data Mining, <http://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf>. Consulta: 11 novembre 2009
  4. Joachims T. (2005), "Query Chains: Learning to Rank from Implicit Feedback", Proceedings of the ACM Conference on Knowledge Discovery and Data Mining, <http://radlinski.org/papers/Radlinski05QueryChains.pdf>. Consulta: 19 desembre 2009