Mixtura de distribucions de probabilitat

De la Viquipèdia, l'enciclopèdia lliure
Figura 1. Funció de densitat d'una mixtura de tres distribucions normals (μ=5, 10, 15, σ=2) amb iguals pesos (1/3). Cada component es representa com una funció de densitat ponderada amb àrea igual a 1/3.

En probabilitat i estadística, una mixtura de distribucions de probabilitat o distribució mixtura o distribució barreja és una superposició de distribucions amb diferents formes funcionals o diferents paràmetres, en proporcions especificades.[1] També es pot interpretar com la distribució de probabilitat d'una variable aleatòria que es deriva d'una col·lecció d'altres variables aleatòries de la següent manera: primer, una variable aleatòria es selecciona a l'atzar d'acord amb una certa probabilitat entre una família de variables aleatòries, i després es realitza el valor de la variable aleatòria seleccionada. O bé com una distribució que depèn d'un paràmetre que, al seu torn, segueix una distribució de probabilitat. Les variables aleatòries poden ser reals o vectorials, és a dir, vectors aleatoris, (tots amb la mateixa dimensió) i, en aquest cas, la distribució de la barreja és una distribució multivariant.[2][3]

En els casos en què cadascuna de les variables aleatòries subjacents és contínua, la variable resultant també serà contínua. Quan hi ha un nombre finit o infinit numerable de distribucions, la funció de distribució (i la funció de densitat de probabilitat si existeix) es pot expressar com una combinació convexa (és a dir, una suma ponderada, amb pesos no negatius que sumen 1) d'altres funcions de distribució i funcions de densitat. Les distribucions individuals que es combinen per formar la mixtura s'anomenen components de la mixtura, i les probabilitats (o pesos) associades a cada component s'anomenen pesos de la mixtura. El nombre de components en una distribució de mixtura sovint es limita a ser finit, però també es poden considerar mixtures amb un nombre infinit numerable o no numerable de components.

Cal fer una distinció entre una variable aleatòria la funció de distribució o densitat de la qual és la suma d'un conjunt de components (és a dir, una mixtura de distribucions) i una variable aleatòria el valor de la qual és la suma dels valors de dues o més variables aleatòries; en aquest darrer cas, quan les variables són independents, la distribució ve donada per l'operador de convolució. Com a exemple, la suma de dues variables aleatòries distribuïdes de manera conjunta normal, amb mitjanes diferents, encara tindrà una distribució normal. D'altra banda, una mixtura de dues distribucions normals amb mitjanes diferents tindrà dos pics (distribució bimodal), mostrant que aquesta distribució és radicalment diferent d'una distribució normal.

Les mixtures de distribucions sorgeixen en molts contextos de la literatura; concretament, de manera natural quan una població estadística conté dues o més subpoblacions. De vegades també s'utilitzen com a mitjà per representar distribucions no normals. L'anàlisi de dades sobre models estadístics que impliquen distribucions de mixtura es discuteix sota el títol de models de mixtura, mentre que el present article es concentra en les propietats probabilístiques i estadístiques simples de les mixtures de distribucions i com aquestes es relacionen amb les propietats de les distribucions subjacents.[4]

Mixtures finites i infinit numerables[modifica]

Donat un conjunt finit o infinit numerable de funcions de distribució , i pesos , tals que i , la mixtura de distribucions o distribució mescla té per funció de distribució:

la qual és una combinació convexa de les funcions de distribució.


Si totes les distribucions són discretes, que prenen valors respectivament en els conjunts , amb funcions de probabilitat , aleshores la mixtura també és discreta amb funció de probabilitat


Si totes les distribucions tenen densitat, que designarem per , aleshores la distribució mixtura té densitat donada per

Quan el nombre de components és finit, es diu que és una mixtura finita o una mescla finita; en moltes aplicacions, una referència a una mixtura acostuma a significar una mixtura finita.

Mixtures de tipus continu[modifica]

Quan el nombre de components és no numerable, la construcció de la mixtura té una similitud formal amb les mixtures anteriors, però substituint els sumatoris per integrals i els pesos per una distribució de probabilitat. Concretament, suposem que les funcions de distribució components tenen la mateixa forma funcional (també s'escriu ) depenent d'un paràmetre , on (en rigor, un conjunt de Borel de ): per exemple, totes les distribucions són normals parametritzades per la mitjana. Suposem que tenim una distribució de probabilitat a donada a per una funció de densitat . Aleshores la mixtura té funció distribució

Si les distribucions tenen funció de densitat (o , aleshores la mixtura té funció de densitat

Interpretació en termes de variables aleatòries. Marginalització[modifica]

Per simplificar l'exposició ens limitarem a comentar una mixtura finita. Anem a calcular la mixtura de les funcions de distribució amb pesos . Considerem una variable aleatòria que prengui els valors amb probabilitat :

D'altra banda, considerem variables aleatòries, , tals que condicionada a tingui funció de distribució :
Aleshores, pel teorema de les probabilitats totals, la funció de distribució (no condicionada) de serà.
i per tant, coincideix amb la funció de distribució de la mixtura.

Aquest procediment s'anomena marginalització, ja que el que hem fet correspon a calcular la distribució marginal de a partir de la informació que tenim sobre el vector .

Càlcul de moments i funció característica[modifica]

Per simplicitat considerarem el cas d'una mixtura amb densitats, però els resultats són generals. Sigui

Si tots els components tenen moment d'ordre , aleshores la mixtura també i

La funció característica de la mixtura, que designarem per , serà
on és la funció característica de la distribució corresponent a .

Exemples[modifica]

Mixtura de tres distribucions normals[modifica]

Considerem tres distribucions normals, amb mitjanes i , totes amb variància . Siguin i les funcions de densitats respectives:

Considerem tres nombres , tals que . Definim
Aleshores és una funció de densitat que s'anomena mixtura de les distribucions i amb pesos respectius i .

Si designem per la funció de distribució corresponent a la densitat , aleshores tenim que la funció de distribució corresponent a la densitat és

Vegeu la Figura 1 per un exemple amb .

Distribució de Poisson composta[modifica]

Considerem una successió de variables aleatòries independents, totes amb la mateixa distribució; designem per la funció de distribució comuna. Definim

La successió s'anomena una passejada aleatòria (en aquest cas surt de 0). D'altra banda, sigui una variable aleatòria de Poisson de paràmetre independent de La variable aleatòria
s'anomena distribució de Poisson composta (Compound Poisson distribution)[5] (Nota: alguns autors també suposen que ).[6] La seva funció de distribució, que designarem per , es calcula mitjançant el teorema de les probabilitats totals i la independència entre i :
on és la funció de distribució de , que és
on denota l'operació de convolució. Per tant, identifiquem una distribució de Poisson composta com una mixtura amb un nombre infinit numerable de components.

Si designem per la funció característica comuna de , i per la de , aleshores, pel teorema de les esperances totals i la independència entre i ,

Per exemple, si tenen una distribució logarítmica de paràmetre ,[7] amb funció de probabilitat
on , que té funció característica
aleshores la distribució composta de Poisson amb amb aquesta distribució té funció característica
Per tant, reconeixem una distribució binomial negativa amb paràmetres i . (Nota. la distribució binomial negativa habitual es defineix per a un nombre enter estrictament positiu (el nombre d'èxits especificat), però es pot estendre a qualsevol real estrictament positiu ).

Mixtura gamma-gamma[modifica]

En aquest exemple de Dubey[8] es considera una distribució gamma on el seu paràmetre d'escala inversa també té una distribució gamma. Considerem una distribució gamma amb paràmetre d'escala , amb (també es diu que és el paràmetre d'escala inversa), i paràmetre de posició , amb funció de densitat (es tracta com una densitat condicionada)

on és la funció gamma d'Euler. Suposem que el paràmetre segueix una distribució gamma amb paràmetre de posició (amb ) i paràmetre de posició , amb funció de densitat

Aleshores la funció de densitat de la mixtura és
on és la funció beta. Aquesta distribució és un cas particular d'una distribució beta prima que Dubey [8] anomena distribució gamma composta (compound Gamma distribution).

Definició formal general[modifica]

Designem per la -àlgebra de Borel sobre i per un espai mesurable arbitrari (en aquest context, prendrem o , Una probabilitat de transició [9] (també s'anomena nucli de Markov)[10] de en és una aplicació , tal que

1. Fixat , l'aplicació
és una probabilitat.
2. Fixat , l'aplicació
és mesurable.

Amb la mateixa definició, es pot canviar per , o més en general, canviar per un espai mesurable arbitrari.

Amb les notacions anteriors, si és una probabilitat sobre , aleshores l'aplicació

és una probabilitat a que s'anomena mixtura de amb .[11]

En el cas que cada probabilitat tingui funció de densitat i tingui funció de densitat , aleshores la mixtura també tindrà funció de densitat donada per la fórmula (1).

Referències[modifica]

  1. Johnson, Norman Lloyd; Kotz, Samuel; Kemp, Adrienne W. Univariate discrete distributions. 2nd ed. Nova York: J. Wiley & sons, 1992, p. 53. ISBN 978-0-471-54897-3. 
  2. «Mixture Distribution: Definition and Examples» (en anglès). https://www.statisticshowto.com.+[Consulta: 23 agost 2009].
  3. «Mixture Models» (en anglès). https://www.stat.cmu.edu/.+[Consulta: 23 juliol 2009].
  4. «3.3: Mixed Distributions» (en anglès). https://stats.libretexts.org,+05-05-2020.+[Consulta: 9 juliol 2023].
  5. Feller, William. Introducción a la Teoría de Probabilidades y sus aplicaciones. Limusa. Mèxic: Limusa_Wiley, S. A., p. 294. 
  6. Satō, Ken'ichi. Lévy processes and infinitely divisible distributions. Cambridge New York: Cambridge university press, 1999, p. 18. ISBN 978-0-521-55302-5. 
  7. Johnson, Norman Lloyd; Kotz, Samuel; Kemp, Adrienne W. «Chap. 7». A: Univariate discrete distributions. 2nd ed. Nova York: J. Wiley & sons, 1992. ISBN 978-0-471-54897-3. 
  8. 8,0 8,1 Dubey, Satya D. «Compound gamma, beta and F distributions» (en anglès). Metrika, 16, 1, 1970-12, pàg. 27–31. DOI: 10.1007/BF02613934. ISSN: 0026-1335.
  9. Nualart, David; Sanz, Marta. Curs de Probabilitats. Barcelona: PPU, 1990, p. 48. ISBN 84-7665-718-8. 
  10. Hoffmann Jørgensen, Jørgen. Probability with a view toward statistics. 2. Nachdr.. Boca Raton: CRC Press, 2003, p. 117. ISBN 978-0-412-05231-6. 
  11. Hoffmann Jørgensen, Jørgen. Probability with a view toward statistics. 2. Nachdr.. Boca Raton: CRC Press, 2003, p. 119. ISBN 978-0-412-05231-6.