Vés al contingut

Usuari:Freutci/mixtura

De la Viquipèdia, l'enciclopèdia lliure
Figura 1. Densitat d'una mixtura de tres distribucions normals (μ=5, 10, 15, σ=2) amb iguals pesos (1/3). Cada component es representa com una funció de densitat ponderada amb àrea igual a 1/3.

En Probabilitat i Estadística, una mixtura de distribucions de probabilitat o distribució de probabilitat composta és una distribució de probabilitat que s'ha obtingut combinant diverses distribucions de probabilitat. Exemples importants són les mixtures de distribucions normals que permeten obtenir distribucions multimodals (Figura 1), o la distribució de Poisson composta que permet modelar el total de reclamacions en un període de temps d'una companyia d'assegurances o, des del punt de vista teòric, és una peça clau en l'estudi de les distribucions infinitament divisibles i els processos de Lévy. Les notacions i nomenclatures varien entre els autors.


L'expressió distribució de probabilitat composta té principalment dues accepcions: la primera la considera equivalent a mixtura de probabilitats [1], és a dir, informalment, una distribució de probabilitat que depèn d'un paràmetre, el qual també és una variable aleatòria; mentre que la segona es refereix a la distribució d'una suma d'un nombre aleatori de variables aleatòries independents, totes amb la mateixa distribució [2]; Johnson et al. [3] les anomenen distribucions de suma aturada (stopped sum distribution) i dediquen tot un capítol al cas que les variables siguin discretes. Atès que hi ha un article dedicat a les mixtures de distribucions de probabilitat, en el present article tractarem breument de la segona accepció. Un exemple especialment important és la distribució de Poisson composta que, des del punt de vista aplicat, s'utilitza com a model del total de reclamacions en un període de temps d'una companyia d'assegurances [4] o, des del punt de vista teòric, és una peça clau en l'estudi de les distribucions infinitament divisibles i els processos de Lévy [5].

Definició i primeres propietats[modifica]

Considerem una successió de variables aleatòries independents, totes amb la mateixa distribució. Definim

La successió s'anomena una passejada aleatòria.

Sigui una variable aleatòria que pren valors 0, 1, 2,... amb probabilitats

independent de La distribució de la variable aleatòria
s'anomena distribució de probabilitat composta (compound probability distribution) [2].


El cas més important és quan té una distribució de Poisson i aleshores la distribució de s'anomena distribució de Poisson composta (compound Poisson distribution) [6].

La funció de distribució d'una distribució de probabilitat composta, que designarem per , es calcula mitjançant el teorema de les probabilitats totals i la independència entre i :

on és la funció de distribució de , que és
on denota l'operació de convolució. Per tant, identifiquem una distribució de Poisson composta com una mixtura amb un nombre infinit numerable de components.

Si designem per la funció característica comuna de , i per la de , aleshores, pel teorema de les esperances totals i la independència entre i ,

En el cas de la funció de distribució de Poisson composta, si té paràmetre , és a dir, , aleshores la funció característica és

Exemples introductoris[modifica]

Mixtura de tres distribucions normals[modifica]

Considerem tres distribucions normals, amb mitjanes i , totes amb variància . Siguin i les funcions de densitats respectives:

Considerem tres nombres , tals que . Definim
Aleshores és una funció de densitat que s'anomena mixtura de les distribucions i amb pesos respectius i . Vegeu la figura 1 per un exemple.

Si designem per la funció de distribució corresponent a la densitat , aleshores tenim que la funció de distribució corresponent a la densitat és

Interpretació del paràmetre com una variable aleatòria[modifica]

En molts casos, com aquest que estem estudiant, les distribucions que considerem pertanyen a una família paramètrica de distribucions; en aquest exemple, les tres components són distribucions normals parametritzades per la mitjana . Aquest paràmetre pot ser considerat com una variable discreta que pren els valors i amb probabilitats

Aleshores

Interpretació en termes de variables aleatòries. Marginalització[modifica]

Per simplificar l'exposició ens limitarem a comentar una mixtura finita. Anem a calcular la mixtura de les funcions de distribució amb pesos . Considerem una variable aleatòria que prengui els valors amb probabilitat :

D'altra banda, considerem variables aleatòries, , tals que condicionada a tingui funció de distribució :
Aleshores, pel teorema de les probabilitats totals, la funció de distribució (no condicionada) de serà.
i per tant, coincideix amb la funció de distribució de la mixtura.

Aquest procediment s'anomena marginalització, ja que el que hem fet correspon a calcular la distribució marginal de a partir de la informació que tenim sobre el vector .

Considerem un vector aleatori on és discret i només pot prendre els valors 1, 2 i 3 amb probabilitats:

També coneixem que les distribucions de condicionada per són normals , . Aleshores, pel teorema de les probabilitats totals,
Per tant, la distribució de és la mixtura de distribucions normals que hem introduït al paràgraf anterior. Aquest procediment s'anomena marginalització, ja que el que hem fet correspon a calcular la distribució marginal de a partir de la informació que tenim sobre el vector .


En el cas general, suposem que tenim una família de funcions de distribució , i els pesos venen donats per una distribució de probabilitat (discreta o contínua) sobre . Així, en el cas discret, si , llavors . El el cas continu, la distribució de vindrà donada per una funció de densitat . Considerem una variable aleatòria tal que la distribució condicionada tingui funció de distribució Aleshores la mixtura correspondrà a la distribució (no condicionada) de la variable obtinguda per marginalització del vector . D'aquesta interpretació es dedueix la següent fórmula que permet calcular els moments o la funció característica de la mixtura. Sigui una funció tal que . Aleshores

o, escrit d'una altra manera,
Vegeu a la pàgina esperança matemàtica l'apartat corresponent a l'esperança condicionada.

Mixtura de distribucions gamma[modifica]

En aquest exemple de Dubey[7] es considera una distribució gamma on el seu paràmetre d'escala inversa té també una distribució inversa. Considerem una distribució gamma amb paràmetre d'escala , amb (també es diu que és el paràmetre d'escala inversa), i paràmetre de posició , amb funció de densitat (condicionada)

on és la funció gamma d'Euler. Suposem que el paràmetre segueix una distribució gamma amb paràmetre de posició (amb ) i paràmetre de posició , amb funció de densitat

Aleshores la funció de densitat de la mixtura és
on és la funció beta. Aquesta distribució és un cas particular d'una distribució beta prima que també s'anomena distribució gamma composta [7].

  1. Moran, Patrick A. P.. An introduction to probability theory. paperback ed. with corr., repr. Oxford: Clarendon Press, 1986, p. 98. ISBN 978-0-19-853242-2. 
  2. 2,0 2,1 Ross, Sheldon M. Introduction to probability models. 10th ed. Amsterdam Heidelberg: Elsevier, 2010, p. 167. ISBN 978-0-12-375686-2. 
  3. Johnson, Norman Lloyd; Kotz, Samuel; Kemp, Adrienne W. «Chap. 9». A: Univariate discrete distributions. 2nd ed. New York: J. Wiley & sons, 1992, p. 305. ISBN 978-0-471-54897-3. 
  4. Encyclopedia of actuarial science. Chichester: Wiley, 2004. ISBN 978-0-470-84676-6. 
  5. Satō, Ken'ichi. Lévy processes and infinitely divisible distributions. Cambridge New York: Cambridge university press, 1999. ISBN 978-0-521-55302-5. 
  6. Satō, Ken'ichi. Lévy processes and infinitely divisible distributions. Cambridge New York: Cambridge university press, 1999, p. 18. ISBN 978-0-521-55302-5. 
  7. 7,0 7,1 Dubey, Satya D. «Compound gamma, beta and F distributions» (en anglès). Metrika, 16, 1, 1970-12, pàg. 27–31. DOI: 10.1007/BF02613934. ISSN: 0026-1335.