Teorema de Bayes

De Viquipèdia
Dreceres ràpides: navegació, cerca

En la teoria de probabilitat, el teorema de Bayes és una proposició plantejada pel filòsof anglès Thomas Bayes el 1763 que expressa la probabilitat condicional d'un esdeveniment aleatori A donat B en termes de distribució de probabilitat condicional de l'esdeveniment B donat A i la distribució de probabilitat marginal de l'esdeveniment A.

En termes més generals, el teorema de Bayes és de gran rellevància perquè vincula probabilitat de l'esdeveniment A donat B amb la probabilitat de B donat A. Per exemple, sabent la probabilitat de tenir un maldecap si es té la grip, es podria saber (si es disposa d'algunes dades addicionals) la probabilitat de tenir la grip si es té un maldecap.

Teorema[modifica | modifica el codi]

Sigui \{A_1, A_2, ..., A_i,   ...,   A_n\} un conjunt d'esdeveniments mútuament exclusius i exhaustius, i tals que la probabilitat de cada un d'ells és diferent a zero, i sigui B un esdeveniment qualsevol del qual es coneixen les probabilitats condicionals P(B | A_i). Llavors, la probabilitat P(A_i | B) ve donada per l'expressió:

P(A_i|B) = \frac{P(B | A_i) P(A_i)}{P(B)}

on P(A_i) són les probabilitats a priori, P(B|A_i) és la probabilitat de B donada la hipòtesi A_i i P(A_i|B) són les probabilitats a posteriori.

Fórmula de Bayes[modifica | modifica el codi]

Basant-se en la definició de probabilitat condicionada, la fórmula de Bayes, també coneguda com la regla de Bayes, és la següent:

P(A_i|B) = \frac{P(B | A_i) P(A_i)}{\sum_{k=1}^n P(B | A_k) P(A_k)}...>

Aquesta fórmula permet calcular la probabilitat condicional P(A_i|B) de qualsevol esdeveniment P(A_i) donat B. La fórmula "ha originat moltes especulacions filosòfiques i controvèrsies".[1]

Formes alternatives del teorema de Bayes[modifica | modifica el codi]

Teorema de Bayes per a funcions de densitat de probabilitat[modifica | modifica el codi]

Existeix una versió del teorema de Bayes que pot aplicar-se a variables aleatòries contínues. Derivar aquesta forma del teorema és més complex matemàticament, però l'expressió del teorema és tan senzilla com la presentada anteriorment:

 f(x|y) = \frac{f(x,y)}{f(y)} = \frac{f(y|x)\,f(x)}{f(y)} \!

També podem expressar el teorema de la següent manera:

 f(x|y) = \frac{f(y|x)\,f(x)}{\int_{-\infty}^{\infty} f(y|x)\,f(x)\,dx}.
\!

La nomenclatura és la següent: f(x, y) és la funció de densitat conjunta de X i Y, f(x|y) és la densitat de X condicional a Y=y (de vegades també anomenada com a distribució a posteriori de X), f(y|x) =  i f(x) i f(y) són les funcions de densitat marginals d'X i Y respectivament (de vegades f(x) s'anomena la distribució a priori d'X).

En la nomenclatura anterior s'abusa lleugerament de la notació, donat que s'empra emprat f per a tots aquests termes, tot i que cadascun en realitat és una funció diferent. Les funcions es poden distingir fàcilment pel nom dels seus arguments.

Teorema de Bayes emprant derivades de Radon-Nykodim[modifica | modifica el codi]

Existeix una versió general del teorema de Bayes que és vàlid per variables aleatòries contínues i discretes, així com per qualsevol dues variables per les quals disposem de la derivada de Radon-Nykodim de la seva distribució de probabilitat respecte una mesura sigma-finita.

Sigui P_X la mesura de probabilitat de X,  \mu_X una mesura sigma-finita que domina a  P_X , i anomenem  f_X= \frac{dP_X}{d\mu_X} a la derivada de Radon-Nykodim de P_X respecte \mu_X. Definim de forma anàloga P_Y, \mu_Y i  f_Y= \frac{dP_Y}{d\mu_Y} . Considerem la mesura de probabilitat conjunta per a (X,Y), que està dominada per la mesura producte \lambda=\mu_X \times \mu_Y , i anomenem  f_{(X,Y)}= \frac{dP_{(X,Y)}}{d\lambda} . Aleshores la derivada de Radon-Nykodim de la mesura de probabilitat de X condicional a la sigma-algebra originada per,  f_{(X|Y)}= \frac{dP_{(X|Y)}}{d\mu_X} , satisfa:

 f_{(X|Y)}= \frac{f_{(X,Y)}}{f_Y} .

Si tant X com Y són variables aleatòries discretes, aquesta fórmula és equivalent a la versió original del teorema de Bayes. Si tant X com Y són variables aleatòries contínues, aquesta fórmula és equivalent a la versió del teorema per a funcions de densitat de probabilitat presentada anteriorment. Tanmateix, aquesta versió és més general i pot aplicar-se, per exemple, quan X és contínua i Y és discreta.

Aquesta versió del teorema pot generalitzar-se en cas de tenir més de dues variables aleatòries. De fet, la generalització és directa: tan sols cal considerar que X i Y són vectors aleatoris en lloc de variables aleatòries. Com que les versions presentades anteriorment són casos particulars, també es poden generalitzar de forma directa en cas de tenir més de dues variables aleatòries.

Exemples[modifica | modifica el codi]

Càncer als 65 anys[modifica | modifica el codi]

Suposem que es vol saber la probabilitat de tenir càncer d'una persona de qui no es disposa cap informació. Tot i no saber res sobre la persona, se li pot assignar una probabilitat basant-se en la prevalència general del càncer (en aquest exemple, aquesta probabilitat és suposada de l'1%). Aquesta probabilitat és la probabilitat a priori de tenir càncer, on "priori" fa referència al temps previ al plantejament del cas particular. A continuació, suposem que es descobreix que la persona té 65 anys. Si assumim que el càncer i l'edat són fenòmens relacionables, aquesta informació nova pot utilitzar-se per avaluar la probability de tenir càncer. Concretament, volem obtenir la probabilitat de que una persona tingui càncer quan se sap que té 65 anys. Aquesta quanitat es coneix com la probabilitat actual, on "actual" fa referència al moment en què es descobreix aquesta nova informació. Per a aplicar el coneixement d'aquesta nova informació en conjunció amb el teorema de Bayes, són necessàries dos dades addicionals, les quals no són específiques d'aquesta persona. La informació necessària és:

  1. La probabilitat de tenir 65 anys. Suposem que és del 0,2%.
  2. La probabilitat de que una persona amb càncer tingui 65 anys. Suposem que és del 0,5%.

Amb aquesta informació i la probabilitat base es pot calcular la probabilitat de que una persona que té 65 anys tingui càncer:

0.5% \div 0.2% * 1% = 2.5%

Tot i tenir 65 anys, la probabilitat és relativament baixa, ja que la probabilitat base (prevalència) del càncer és baixa. Això il·lustra tant la importància de la probabilitat base, fet que a vegades fa que es neglecti. Ometre la probabilitat base té com a conseqüència la malinterpretació d'estadístiques. La familiarització amb el teorema de Bayes és una manera de combatre la tendència natural de negligir les probabilitats base.

Ús[modifica | modifica el codi]

El teorema de Bayes és vàlid en totes les aplicacions de la teoria de la probabilitat. No obstant, existeix controvèrsia sobre el tipus que de probabilitats que fa servir. En essència, els acadèmics de l'estadística tradicional admeten probabilitats basades en experiments repetibles i avalats per una confirmació empírica únicament, mentre que els anomenats "estadistes bayesians" treballen també amb probabilitats subjectives. El teorema pot utilitzar-se per indicar com han de modificar-se les probabilitats subjectives quan es disposa d'informació adicional d'un experiment.

Aplicacions[modifica | modifica el codi]

Una aplicació quotidiana del teorema de Bayes són els classificadors bayesians són els filtres de correu brossa. Els classificadors bayesians són emprats en l'aprenentatge automàtic i la mineria de dades.

Referècies[modifica | modifica el codi]

  1. Teoría moderna de probablidades y sus aplicaciones de Emanuel Parzen. Limusa Grupo Noriega Edidores, ISBN 978-9681-807351