Distribució de probabilitat

De Viquipèdia
Dreceres ràpides: navegació, cerca
Una funció de distribució normal, coneguda pel nom de «campana de Gauss» en honor a Carl Friedrich Gauss (1777–1855).
Percentatges de probabilitat a la distribució normal.

En matemàtiques i estadística la funció de distribució de probabilitat F_X(x) d'una variable aleatòria X és un funció matemàtica que assigna a cada succés definit sobre la variable aleatòria una probabilitat que el dit succés tingui lloc. La funció de probabilitat està definida sobre el conjunt de tots els esdeveniments -rang de valors- de la variable aleatòria.

Definició matemàtica[modifica | modifica el codi]

Quan una variable aleatòria pren valors en el conjunt de nombres reals -els que es poden definir com una fracció-, la distribució de probabilitat estarà completament especificada per la funció de distribució, el valor de la qual en cada x és la probabilitat que la variable aleatòria sigui menor o igual que x (acumulativament). Llavors la probabilitat P( X \le x ) és:

F_X(x) = P( X \le x )

Per a simplificar la notació, quan no hi ha lloc a confusió s'omet el subíndex X, i s'escriu simplement F(x)

Una funció de distribució ha de complir 3 condicions:

  1. \lim_{x \to -\infty} F(x) = 0 i \lim_{x \to \infty} F(x) = 1
  2. És contínua per la dreta
  3. És monòtona no decreixent

Interpretació i conceptes previs[modifica | modifica el codi]

Les distribucions de probabilitat s'utilitzen molt per fer estudis estadístics de diferents tipus i treure conclusions generals. Per entendre què és una distribució de probabilitat, així com el significat dels paràmetres associats, és necessari començar definint una sèrie de conceptes previs.

Seguint un ordre lògic, partirem de la idea d'experiment aleatori, que és una experiència en la qual no coneixem el resultat exacte que sortirà, però si tots els resultats possibles. Els exemples típics de llançament d'una moneda a l'aire, extreure una carta d'un joc, fer una travessa, etc. són casos clàssics d'experiments aleatoris.

Doncs bé, si consideram tots els resultats elementals d'un possible experiment aleatori, definirem variable aleatòria, com aquella funció que assigna un valor numèric a cadascun d'aquests resultats. El motiu és que això fa molt més còmode el tractament posterior de la informació i l'anàlisi dels resultats.

Per exemple, en el succés "llançar una moneda a l'aire", hi ha dos possibles resultats: cara o creu. Una variable aleatòria en aquest cas, seria una funció que assignés un 1 a treure cara i un 0 a treure creu.

Com que cada resultat elemental d'un experiment aleatori té una probabilitat d'ocórrer, podrien crear una funció que assignés a cada valor d'una variable aleatòria, la seva probabilitat. Aquesta funció s'anomena funció de probabilitat.

Una vegada definida la funció de probabilitat associada a un experiment aleatori, tindrem un conjunt de valors de probabilitat que en realitat és el conjunt imatge d'aquesta funció. Aquest conjunt és el que s'anomena distribució de probabilitat. Moltes vegades, fent un abús del llenguatge, parlem indistintament de funció de probabilitat i de distribució de probabilitat.

Una distribució de probabilitat té associada una funció de distribució, que representa la probabilitat d'obtenir un valor menor o igual que un altre prèviament fixat, i que podem calcular utilitzant la fórmula:

F(X)=\sum_{i=1}^X{p(x_i)}

a on les p(xi) representen les probabilitats d'obtenir un valor xi menor o igual a X.

Paràmetres de les distribucions probabilístiques[modifica | modifica el codi]

Les distribucions de probabilitat tenen associat uns paràmetres, que serveixen per a descriure de com es distribueixen els elements. Els paràmetres estadístics més usuals són:

Mitjana aritmètica 
 \mu=\sum_{i=1}^n{p_ix_i}

essent "pi" les probabilitats associades als valors "xi"

Variància
V=\sum_{i=1}^n{p_ix_i^2}- \mu^2
Desviació típica
 \sigma=\sqrt[]{V}=\sqrt[]{\sum_{i=1}^n{p_ix_i^2}- \mu^2}

Tipus de distribucions de probabilitat[modifica | modifica el codi]

Distribució binomial[modifica | modifica el codi]

Article principal: Distribució binomial
Ajust d'una Binomial per una Normal

Es tracta d'una distribució de probabilitat, en la qual només existeixen dos valors possibles de la variable aleatòria, que es diuen èxit i fracàs. A la probabilitat associada a cadascun d'ells se la designa per "p" i "q" respectivament. Si "n" és el nombre de vegades que es repeteix l'experiment aleatori, una distribució binomial es representa genèricament per: B(n,p).

Pel que fa al càlcul de probabilitats dins aquesta distribució, ens interessa saber la probabilitat d'obtenir k èxits quan per a n successos. Aquesta probabilitat vé donada per la fórmula següent:

P(k)=\frac{n!}{k!(n-k)!}p^kq^{n-k}

Existeixen totes formes taules de la distribució binomial, que ens donen directament els resultats numèrics d'aquesta fórmula per a valors concrets de "n", "k" i "p".

La distribució normal[modifica | modifica el codi]

Article principal: Distribució normal
Distribució Normal

Es tracta d'una distribució de probabilitat que serveix per a representar multitud de fenòmens de tipus sociològic i científic. Es caracteritza per la seva mitjana "μ" i per la desviació típica "σ", de tal manera que representarem genèricament una[1] per: N(μ,σ).

Per al càlcul de probabilitats dins el marc de la distribució normal, s'utilitza la funció densitat, coneguda com a Campana de Gauss. Aquesta funció té la particularitat que les àrees sota la corba representen valors de probabilitat, i que per tant calcular probabilitats en aquest cas és calcular àrees (càlcul d'integrals definides).

De totes maneres, per a la distribució normal estàndard N(0,1) existeix una taula amb els valors de la probabilitat ja calculats. Aquesta taula ens proporciona directament la probabilitat per a valors de la variable aleatòria z≤K, essent "K" un valor donat.

Quan el valor de probabilitat que busquem no és z≤K, sinó altres valors, o valors compresos entre altres dos, s'ha de mirar a partir del dibuix quina és l'àrea concreta a calcular i reduir el seu càlcul a un que figuri a la taula.

En el cas que la pregunta que ens plantegem sigui sobre el càlcul de probabilitats dins el marc d'una distibució normal que no sigui l'estàndard, sinó una altra N(μ,σ), llavors per poder fer els càlculs i utilitzar la taula de la N(0,1), hem de fer prèviament el que es diu "tipificar la variable", que consisteix a fer el canvi mostrat per la fórmula següent:

z=\frac{x- \mu}{ \sigma}

a on x representa la variable aleatòria en la distribució normal no estàndard, i z és la variable ja tipificada.

Ajust d'una distribució binomial per una normal[modifica | modifica el codi]

En molts casos pràctics, per calcular valors de probabilitat que responen a una distribució binomial B(n,p), pot ser interessant fer-ho realitzant un ajust per una distribució normal del tipus N(μ,σ²), essent la mitjana d'aquesta normal el producte np, i la variància el producte npq. Això simplifica molt els càlculs de probabilitats, i evita l'ús de la fórmula de la distribució binomial.

Si tenim en compte que la distribució binomial és discreta (amb un nombre finit de valors de la variable aleatòria associada), i que qualsevol distribució normal és contínua (amb infinits valors de la variable aleatòria), per poder fer l'ajust anterior i que tenguin sentit els resultats, es requereix que el nombre de valors de la variable associada a la distribució binomial de partida sigui prou elevat. Aquest cas es produeix quan els productes np i nq són majors o igual a 5.

En aquest cas, doncs, es fa l'ajust següent:

B(n,p)\longrightarrow{}N(np,npq)

i així es poden fer els càlculs de probabilitat dins l'àmbit d'una distribució normal, caracteritzada per una mitjana \mu=n\,p i una variància \ \sigma^2=npq

Referències[modifica | modifica el codi]

  1. distribució normal de probabilitats
A Wikimedia Commons hi ha contingut multimèdia relatiu a: Distribució de probabilitat Modifica l'enllaç a Wikidata