El problema de la màquina escurabutxaques

De la Viquipèdia, l'enciclopèdia lliure
(S'ha redirigit des de: Bandit manchot (mathématiques))

El problema de la màquina escurabutxaques es pot esquematitzar de la manera següent:

  • S'és davant dues màquines escurabutxaques
  • L'una, , està en funcionament. Retorna per tant 1 euro per fitxa amb una probabilitat coneguda.
  • L'altra, , està espatllada, i retorna per tant 1 euro per fitxa amb una probabilitat desconeguda.
  • Es disposa de fitxes. Què fer per maximitzar raonablement el guany ?

Desbastar el problema[modifica]

Algunes consideracions permeten evitar l'explosió combinatòria:

  • Només una aposta a pot aportar informació i només una aportació d'informació pot portar a canviar d'opinió. Per tant així que es deixa d'apostar per , s'està segur de no tenir mai motiu de tornar a apostar-hi.
  • El problema es resumeix en conseqüència en dir quantes fitxes s'apostarà per , en funció dels resultats, abans de canviar (definitivament) a o no. És el problema clàssic del disseny d'experiments.

Aplicació practica[modifica]

L'aplicació més típica del problema de la màquina escurabutxaques és la de la tria entre una antiga i una nova posologia d'una vacuna o medicament (o entre dos diferents): cal determinar el més de pressa possible si el nou producte ha de ser adoptat o s'ha de mantenir l'antic. Tot error es traduiria en vides humanes perdudes (o, pel capbaix, en persones sofrint trastorns o bé a un tractament incomplet, o bé en efectes secundaris excessius).

Bibliografia[modifica]

  • Michael N. Katehakis «Computing Optimal Sequential Allocation Rules in Clinical Trials». IMS Lecture Notes-Monograph Series, 8, 1986, p. 29–39. DOI: 10.1214/lnms/1215540286.

Vegeu també[modifica]