Teorema de Bayes

De la Viquipèdia, l'enciclopèdia lliure
Un rètol de neó, que mostra l'enunciat del teorema de Bayes

En la teoria de probabilitat, el teorema de Bayes és una proposició plantejada pel filòsof anglès Thomas Bayes el 1763 que expressa la probabilitat condicional d'un esdeveniment aleatori A donat B en termes de distribució de probabilitat condicional de l'esdeveniment B donat A i la distribució de probabilitat marginal de l'esdeveniment A.

En termes més generals, el teorema de Bayes és de gran rellevància perquè vincula probabilitat de l'esdeveniment A donat B amb la probabilitat de B donat A. Per exemple, sabent la probabilitat de tenir un maldecap si es té la grip, es podria saber (si es disposa d'algunes dades addicionals) la probabilitat de tenir la grip si es té un maldecap.

Teorema[modifica]

Sigui un conjunt finit o infinit numerable d'esdeveniments mútuament exclusius i exhaustius, i tals que la probabilitat de cada un d'ells és diferent de zero, és a dir,

  1. Si ,

Sigui un esdeveniment qualsevol amb del qual es coneix la probabilitat condicionada . Llavors, la probabilitat és donada per l'expressió:

Aquesta fórmula permet calcular la probabilitat condicional a partir de la probabilitat condicional i s'anomena fórmula d'inversió de condicions.[1]

Prova. S'aplica dos cops la definició de probabilitat condicionada:

Fórmula de Bayes[modifica]

Aplicant el teorema de les probabilitat totals s'obté la fórmula o regla de Bayes:

Les probabilitats s'anomenen les probabilitats a priori; és la probabilitat de donada la hipòtesi . Les probabilitats s'anomenen probabilitats a posteriori. Aquesta fórmula permet calcular la probabilitat a posteriori a partir de les probabilitats a priori i de les probabilitats de sota les diferents hipòtesis: La fórmula "ha originat moltes especulacions filosòfiques i controvèrsies".[2]

Formes alternatives del teorema de Bayes[modifica]

Teorema de Bayes per a funcions de densitat de probabilitat[modifica]

Existeix una versió del teorema de Bayes que pot aplicar-se a variables aleatòries contínues. Derivar aquesta forma del teorema és més complex matemàticament, però l'expressió del teorema és tan senzilla com la presentada anteriorment:

També podem expressar el teorema de la següent manera:

La nomenclatura és la següent: f(x, y) és la funció de densitat conjunta de X i Y, f(x|y) és la densitat de X condicional a Y=y (de vegades també anomenada com a distribució a posteriori de X), f(y|x) =  i f(x) i f(y) són les funcions de densitat marginals d'X i Y respectivament (de vegades f(x) s'anomena la distribució a priori d'X).

En la nomenclatura anterior s'abusa lleugerament de la notació, donat que s'empra emprat f per a tots aquests termes, tot i que cadascun en realitat és una funció diferent. Les funcions es poden distingir fàcilment pel nom dels seus arguments.

Teorema de Bayes emprant derivades de Radon-Nykodim[modifica]

Existeix una versió general del teorema de Bayes que és vàlid per variables aleatòries contínues i discretes, així com per qualsevol dues variables per les quals disposem de la derivada de Radon-Nykodim de la seva distribució de probabilitat respecte a una mesura sigma-finita.

Sigui la mesura de probabilitat de X, una mesura sigma-finita que domina a , i anomenem a la derivada de Radon-Nykodim de respecte a . Definim de forma anàloga , i . Considerem la mesura de probabilitat conjunta per a (X,Y), que està dominada per la mesura producte , i anomenem . Aleshores la derivada de Radon-Nykodim de la mesura de probabilitat de X condicional a la sigma-algebra originada per, , satisfa:

.

Si tant X com Y són variables aleatòries discretes, aquesta fórmula és equivalent a la versió original del teorema de Bayes. Si tant X com Y són variables aleatòries contínues, aquesta fórmula és equivalent a la versió del teorema per a funcions de densitat de probabilitat presentada anteriorment. Tanmateix, aquesta versió és més general i pot aplicar-se, per exemple, quan X és contínua i Y és discreta.

Aquesta versió del teorema pot generalitzar-se en cas de tenir més de dues variables aleatòries. De fet, la generalització és directa: tan sols cal considerar que X i Y són vectors aleatoris en lloc de variables aleatòries. Com que les versions presentades anteriorment són casos particulars, també es poden generalitzar de forma directa en cas de tenir més de dues variables aleatòries.

Exemples[modifica]

Càncer als 65 anys[modifica]

Suposem que es vol saber la probabilitat de tenir càncer d'una persona de qui no es disposa cap informació. Tot i no saber res sobre la persona, se li pot assignar una probabilitat basant-se en la prevalència general del càncer (en aquest exemple, aquesta probabilitat és suposada de l'1%). Aquesta probabilitat és la probabilitat a priori de tenir càncer, on "priori" fa referència al temps previ al plantejament del cas particular. A continuació, suposem que es descobreix que la persona té 65 anys. Si assumim que el càncer i l'edat són fenòmens relacionables, aquesta informació nova pot utilitzar-se per avaluar la probabilitat de tenir càncer. Concretament, volem obtenir la probabilitat que una persona tingui càncer quan se sap que té 65 anys. Aquesta quantitat es coneix com la probabilitat actual, on "actual" fa referència al moment en què es descobreix aquesta nova informació. Per a aplicar el coneixement d'aquesta nova informació en conjunció amb el teorema de Bayes, són necessàries dues dades addicionals, les quals no són específiques d'aquesta persona. La informació necessària és:

  1. La probabilitat de tenir 65 anys. Suposem que és del 0,2%.
  2. La probabilitat que una persona amb càncer tingui 65 anys. Suposem que és del 0,5%.

Amb aquesta informació i la probabilitat base es pot calcular la probabilitat que una persona que té 65 anys tingui càncer:

Tot i tenir 65 anys, la probabilitat és relativament baixa, ja que la probabilitat base (prevalència) del càncer és baixa. Això il·lustra tant la importància de la probabilitat base, fet que a vegades fa que es neglecti. Ometre la probabilitat base té com a conseqüència la malinterpretació d'estadístiques. La familiarització amb el teorema de Bayes és una manera de combatre la tendència natural de negligir les probabilitats base.

Ús[modifica]

El teorema de Bayes és vàlid en totes les aplicacions de la teoria de la probabilitat. No obstant, existeix controvèrsia sobre el tipus de probabilitats que fa servir. En essència, els acadèmics de l'estadística tradicional admeten probabilitats basades en experiments repetibles i avalats per una confirmació empírica únicament, mentre que els anomenats "estadistes bayesians" treballen també amb probabilitats subjectives. El teorema pot utilitzar-se per indicar com han de modificar-se les probabilitats subjectives quan es disposa d'informació addicional d'un experiment.

Aplicacions[modifica]

Una aplicació quotidiana del teorema de Bayes són els classificadors bayesians són els filtres de correu brossa. Els classificadors bayesians són emprats en l'aprenentatge automàtic i la mineria de dades.

Referències[modifica]

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Teorema de Bayes
  1. Bonet, Eduard. Espais de probabilitat finits. Editorial Lavínia, S. A., 1969, p. 67. 
  2. Teoría moderna de probablidades y sus aplicaciones de Emanuel Parzen. Limusa Grupo Noriega Edidores, ISBN 978-9681-807351