Karen Spärck Jones

De la Viquipèdia, l'enciclopèdia lliure
Infotaula de personaKaren Spärck Jones

Modifica el valor a Wikidata
Biografia
Naixement26 agost 1935 Modifica el valor a Wikidata
Huddersfield (Anglaterra) Modifica el valor a Wikidata
Mort4 abril 2007 Modifica el valor a Wikidata (71 anys)
Willingham (Anglaterra) Modifica el valor a Wikidata
Causa de mortCauses naturals Modifica el valor a Wikidata (Càncer Modifica el valor a Wikidata)
Dades personals
NacionalitatBritànica
FormacióGirton College, Cambridge
Universitat de Cambridge Modifica el valor a Wikidata
Director de tesiR. B. Braithwaite Modifica el valor a Wikidata
Es coneix pertreballar en recuperació d'informació i processament de llenguatge natural, en particular el seu model probabilístic de documents i recuperació de dades
Activitat
Camp de treballCiències de la computació Modifica el valor a Wikidata
Ocupacióinformàtica, professora d'universitat, investigadora d'intel·ligència artificial Modifica el valor a Wikidata
OcupadorNewnham College
Wolfson College Modifica el valor a Wikidata
Membre de
Família
CònjugeRoger Needham
Premis
ACL Lifetime Achievement Award, medalla BCS Lovelace, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit

Lloc webcl.cam.ac.uk… Modifica el valor a Wikidata

Karen Spärck Jones (26 d'agost de 19354 d'abril de 2007) va ser una científica britànica especialitzada en lingüística computacional. Investigadora pionera en recuperació d'informació.

Biografia[modifica]

Karen Spärck va néixer en Huddersfield (Yorkshire). Filla d'Owen Jones, professor en química, i Anada Spärck, que va escapar de Noruega al Regne Unit durant la Segona Guerra Mundial. Spärck Jones fou educada en una escola primària de Huddersfield i posteriorment en el Girton College (Cambridge) des de 1953 fins a 1956, va estudiar Història i un any addicional sobre Ciències Morales (filosofia). Llavors va començar a treballar com a mestra a l'escola, però poc després va començar a treballar en informàtica. Durant tot el temps que va estar dedicant-se a la informàtica va impulsar notablement que més dones entressin en aquesta disciplina.

Va començar la seva carrera investigadora el 1950 desenvolupant un tesaurus per a la Unitat de Recerca en Llenguatge de la Universitat de Cambridge. El 1964 es va doctorar amb una tesi titulada Sinonímia i classificació semàntica utilitzant tècniques estadístiques i probabilístiques combinades amb tècniques lingüístiques.[1] El seu enfocament va ser pioner en la matèria.

Va poder seguir investigant en recuperació d'informació gràcies a les diferents beques que li van ser concedides per institucions com la Royal Society o la Biblioteca Britànica, fins que va fitxar pel Laboratori d'Informàtica de la Universitat de Cambridge on va treballar des de 1974 fins a la seva jubilació en 2002, encara que va seguir treballant allí fins a poc abans de morir per càncer en 2007, en Willianghan (Cambridge).

Va estar casada amb Roger Needham des de 1958 fins a la defunció d'aquest en 2003.[2]

Obra científica[modifica]

Karen Spärck Jones va liderar la indexació automatitzada creant un indicador capaç de trobar la importància informativa d'una paraula per a un document; el que es cridaria a partir de llavors com indización ponderada o per pesos. Aquest algorisme anomenat ITF (inverse term frecuency o freqüència inversa del terme) obté la importància d'un terme depenent del nombre de vegades que aparegui en el document en relació amb la resta de termes que aquest tingui. Aquest algorisme rebutja les paraules que apareguin tant a l'excés (paraules funcionals de la llengua com a preposicions o conjuncions) com per defecte (paraules amb unes poques aparicions), en considerar que no aporten valor informatiu suficient com per descriure el contingut del document.[3]

Aquest indicador donaria pas a un altre més important encara: el IDF (inverse document frecuency o freqüència inversa del document) el procediment del qual és similar a l'anterior però que s'empra en tots els documents d'una base de dades documental. Amb aquest algorisme obtindríem ordenats de major a menor rellevància els documents oposats en respondre a una consulta. Aquest disseny va ser el principi del model probabilístic de recuperació d'informació, desenvolupat per Spärck Jones i Stephen Robertson, i continuat per altres investigadors com Keith van Rijsbergen, Peter Ingwersen o Ricardo Baeza-Yates.[4]

Publicacions[modifica]

Algunes de les seves obres són:

  • Automatic keywords classification for information retrieval. Londres: Butterworths, 1972
  • Information retrieval experiment. Londres: Butterworths, 1981
  • Readings in information retrieval (en coautoria amb Willett). San Francisco: Morgan Kaufmann.

Va publicar nombrosos articles en prestigioses revistes de recerca científica, entre altres:

  • A statistical interpretation of term specificity and its application in retrieval (1972) en Journal of Documentation, nº 28.
  • Index term weighting (1973) en Information Storage and Retrieval, nº 9.

Premis i condecoracions[modifica]

Va ser guardonada amb nombrosos premis, entre ells:

  • Premi Gerard Salton el 1988,
  • Premi ASIST al Mèrit Acadèmic en 2002,
  • Premi a la trajectòria d'una vida investigadora de la ACL, l'associació internacional més prestigiosa en Lingüística computacional.
  • Premi Allen Newell de l'ACM-AAAI (2007)
  • Medalla Lovelace en 2007, quan ja estava malalta de càncer.

Bibliografia[modifica]

  • «In memoriam». Journal of the American Society for Information Science and Technology, 59, 5, 2008, pàg. 852-854.

Referències externes[modifica]

Referències[modifica]

  1. Spärck Jones, Karen. Synonymy and Semantic Classification (Tesis publicada com llibre). 1. Edinburgh University Press, 1986. 
  2. Tait, John I. «Karen Spärck Jones». Computational Linguistics, 33, 3, 17-08-2007, pàg. 289–291. DOI: 10.1162/coli.2007.33.3.289. ISSN: 0891-2017.
  3. Jones, Karen Sparck «Index term weighting». Information Storage and Retrieval, 9, 11, 01-11-1973, pàg. 619–633. DOI: 10.1016/0020-0271(73)90043-0.
  4. Charting a New Course: Natural Language Processing and Information Retrieval | SpringerLink (en anglès). DOI 10.1007/1-4020-3467-9.