Distribució de Wishart

De Viquipèdia
Salta a la navegació Salta a la cerca

Esperança matemàtica del logaritme de X

Distribució de Wishart
Notació X ~ Wp(V, n)
Paràmetres n > p − 1 graus de llibertat (real)
V > 0 matriu d’escala (p × p def. positiva)
Suport X(p × p) matriu definida positiva
fdp

Mitjana nV
Moda (np − 1)V per a np + 1
Variància
FC
Modifica les dades a Wikidata


En Estadística, la distribució de Wishart és una generalització de la distribució khi quadrat a múltiples dimensions, o en el cas dels graus de llibertat no sencers de la distribució gamma. S’anomena  així en honor a John Wishart, qui va formular per primera vegada la distribució l'any 1928.[1]

És una família de distribucions de probabilitat definides sobre matrius simètriques, definides no negatives amb valors de variables aleatòries ("matrius aleatòries"). Aquestes distribucions són de gran importància en l'estimació de matrius de covariància en estadística multivariant.

Definició[modifica]

Suposem que X és una matriu n × p, de la que cada fila s’obté de forma independent d'una distribució normal p-variada amb mitjana zero:

La distribució de Wishart és la distribució de probabilitat de la matriu p × p aleatòria S = XT X coneguda com la matriu de dispersió. Hom indica que S té aquesta distribució de probabilitat escrivint:

El nombre enter positiu n és el nombre de graus de llibertat. En certes ocasions això s'escriu com W(V, p, n). Per n ≥ p la matriu S és invertible amb probabilitat 1 si V és invertible.

Si p = V = 1 llavors aquesta distribució és una distribució khi-quadrat amb n graus de llibertat.

Ocurrència[modifica]

La distribució de Wishart correspon a la distribució de la matriu de covariància d’una mostra de la distribució normal multivariada. Apareix amb freqüència en les proves de la raó de versemblança en l'anàlisi estadística multivariada. També es dóna en la teoria espectral de matrius aleatòries i en l'anàlisi bayesiana multidimensional.[2] També apareix en telecomunicacions en l'anàlisi de les característiques de l’esvaniment de Rayleigh en canals MIMO.[3]

Funció densitat de probabilitat[modifica]

La distribució de Wishart es pot caracteritzar per la seva funció de densitat de probabilitat de la següent manera:

Sigui X una matriu simètrica p × p de variables aleatòries definida positiva.

Sigui V una matriu (fixada) definida positiva de mida p × p.

Llavors, si np, X segueix una distribució de Wishart amb n graus de llibertat si té una funció de densitat de probabilitat donada per:

on és el determinant i Γp (·) és la funció gamma multivariant definida com:

De fet, aquesta definició es pot estendre a qualsevol valor real n > p – 1. Si np – 1 llavors ja no segueix una distribució de Wishart sinó que en lloc seu representa una distribució singular que pren valors en un subespai de dimensió inferior a l’espai de les matrius p × p.[4]

Ús en Estadística Bayesiana[modifica]

En estadística bayesiana i en el context de la distribució normal multivariable, la distribució de Wishart és el conjugat previ de la matriu de precisió Ω = Σ -1, on Σ és la matriu de covariància.

Selecció dels paràmetres[modifica]

L’adequada distribució de Wishart prèvia s'obté fixant n = p. La mitjana prèvia de Wp (V, n) és nV, el que suggereix que una opció raonable per a V – 1 seria n Σ0, on Σ0 és una estimació prèvia de la matriu de covariància.

Propietats[modifica]

Esperança matemàtica del logaritme de X[modifica]

Considerem la següent expressió:[5]

on és la funció digamma multivariada (la derivada del logaritme de la funció gamma multivariant).

Això juga un paper important en les derivacions variacionals bayesianes per a xarxes de Bayes que involucren la distribució de Wishart.

Entropia[modifica]

L'entropia d'informació de la distribució té la següent expressió:[5]

on B(V, n) és la constant de normalització de la distribució:

Això es pot expandir com:

Entropia creuada[modifica]

L'entropia creuada de dues distribucions de Wishart amb els paràmetres p0, n0, V0 i p1, n1, V1 és:

Que quan p0 = p1 equival a l’entropia.

Divergència K-L[modifica]

La divergència de Kullback-Leibler de p1 donat p0 és

Funció característica[modifica]

La funció característica de la distribució de Wishart és

En altres paraules:

on E[⋅] indica l'esperança matemàtica. (Aquí Θ i I són matrius de la mateixa mida que V (I és la matriu identitat), i i és l'arrel quadrada de -1).[6]

Teorema[modifica]

Si una matriu p × p aleatòria X té una distribució Wishart amb m graus de llibertat i la matriu de variància V – escrita com - i C és una matriu q × p de rang q, llavors,[7]

Corol·lari 1[modifica]

Si z és un vector constant diferent de zero p × 1, llavors:[7]

En aquest cas, és la distribució de khi-quadrat i ( és una constant, és positiu perquè V és definida positiva).

Corol·lari 2[modifica]

Considerem el cas en zT = (0, ..., 0, 1, 0, ..., 0) (és a dir, l'element j-èsim és 1 i tots els altres zero). Llavors el corol·lari 1 mostra que:

dóna la distribució marginal de cada un dels elements de la matriu diagonal.

L’ estadístic George Seber assenyala que la distribució de Wishart no es diu la "distribució chi quadrat multivariant" perquè la distribució marginal dels elements fora de la diagonal no és de chi-quadrat. Seber prefereix reservar el terme multivariant per al cas en què tots els distribucions marginals univariades pertanyen a la mateixa família.[8]

Estimació de la distribució normal multivariada[modifica]

La distribució Wishart és la distribució mostral de l'estimador de màxima versemblança (MLE) de la matriu de covariància d'una distribució normal multivariada.[9] Una derivació de la MLE utilitza el teorema espectral.

Descomposició de Barlett[modifica]

La descomposició de Bartlett d'una matriu X d'una distribució Wishart de p-variables amb matriu d'escala V i n graus de llibertat és la factorització:

on L és el factor de Cholesky de V, i:

on i nij ~ N(0, 1) de manera independent.[10] Això proporciona un mètode útil per a l'obtenció de mostres a l'atzar d'una distribució de Wishart.[11]

Distribució marginal dels elements de la matriu[modifica]

Sigui V una matriu de variància 2 × 2 caracteritzada pel coeficient de correlació -1 < ρ < 1 i L el seu factor de Cholesky més petit:

Multiplicant per l’anterior descomposició de Bartlett, trobem que una mostra aleatòria de la distribució de Wishart 2 × 2 és:

Els elements de la diagonal, com és evident en el primer element, segueixen, com era d’esperar, la distribució χ2 amb n graus de llibertat (escalada per σ2). L'element de fora de la diagonal és menys familiar però pot ser identificat com una barreja normal de variància-mitja on la densitat de la mescla és una distribució χ2. Per tant, la corresponent densitat de probabilitat marginal per a l'element de fora de la diagonal és la distribució de variància-gamma

on Kν(z) és la funció de Bessel modificada de segona classe.[12] Resultats similars es poden trobar per les dimensions superiors, però la interdependència de les correlacions fora de la diagonal es fa cada vegada més complicada. També és possible escriure la funció generadora de moments fins i tot en el cas no central (essencialment l'enèsima potència de Craig[13]) tot i que la densitat de probabilitat es converteix en una suma infinita de funcions de Bessel.

Possible rang del paràmetre de forma[modifica]

Es pot demostrar[14] que la distribució de Wishart es pot definir si, i només si, el paràmetre de forma n pertany al conjunt

Aquest conjunt porta el nom de conjunt de Gindikin, que va ser qui el va introduir en els anys setanta dins el context de les distribucions gamma sobre cons homogenis.[15] No obstant això, per als nous paràmetres en l'espectre discret del conjunt Gindikin, és a dir:

la corresponent distribució Wishart no té la densitat de Lebesgue.

Relació amb altres distribucions[modifica]

  • La distribució de Wishart està relacionada amb la distribució Inversa de Wishart, , com segueix: Si X ~ Wp(V, n) i si fem el canvi de variables C = X−1, llavors . Aquesta relació es pot derivar tenint present que el valor absolut del determinant jacobià d'aquest canvi de variable és |C|p+1.[16]
  • En estadística bayesiana, la distribució Wishart és un conjugat previ per al paràmetre de precisió de la distribució normal multivariada quan el paràmetre mitja és conegut.[5]
  • Una generalització és la distribució gamma multivariant.
  • Un tipus diferent de generalització és la distribució normal de Wishart, essencialment el producte d'una distribució normal multivariada i una distribució de Wishart.

Vegeu també[modifica]

Referències[modifica]

  1. Wishart, J «The generalised product moment distribution in samples from a normal multivariate population». Biometrika, 20A, (1 - 2), 1928, pàg. 32 - 52. DOI: 10.1093/biomet/20A.1-2.32. JSTOR: 2331939.
  2. Gelman, A. Bayesian Data Analysis. Londres: Chapman & Hall, 2013. ISBN 158488388X. 
  3. Zanella, A.; Chiani, M.; Win, M. Z «On the marginal distribution of the eigenvalues of Wishart matrices». IEEE Transactions on Communications, 57, (4), 2009, pàg. 1050 - 1060. DOI: 10.1109/TCOMM.2009.04.070143.
  4. Uhlig, H «On Singular Wishart and Singular Multivariate Beta Distributions». The Annals of Statistics, 22, 1994, pàg. 395. DOI: 10.1214/aos/1176325375.
  5. 5,0 5,1 5,2 Bishop, C. M. Pattern Recognition and Machine Learning. New York (NY):: Springer-Verlag, 2006. ISBN 9780387310732. 
  6. Anderson, T. W. An Introduction to Multivariate Statistical Analysis. 3ª Ed. Hoboken (NJ): Wiley-Interscience, 2003. ISBN 0-471-36091-0. 
  7. 7,0 7,1 Rao, C. R. Linear Statistical Inference and its Applications. Hoboken (NJ): Wiley, 1965. ISBN 0-471-21875-8. 
  8. Seber, George A. F. Multivariate Observations. Hoboken (NJ): Wiley, 2004. ISBN 978-0471691211. 
  9. Chatfield., C.; Collins, A. J. Introduction to Multivariate Analysis. London: Chapman and Hall, 1980. ISBN 0-412-16030-7. 
  10. Anderson, T. W.. An Introduction to Multivariate Statistical Analysis. 3ª Ed. Hoboken (NJ): Wiley-Interscience, 2003. ISBN 0-471-36091-0. 
  11. Smith, W. B.; Hocking, R. R «Algorithm AS 53: Wishart Variate Generator». Journal of the Royal Statistical Society, Series C, 21, (3), 1972, pàg. 341 - 345. JSTOR: 2346290.
  12. Pearson, K.; Jeffery, G. B.; Elderton, E. M «On the Distribution of the First Product Moment-Coefficient, in Samples Drawn from an Indefinitely Large Normal Population». Biometrika, 21, 1929, pàg. 164 - 201. DOI: 10.2307/2332556. JSTOR: 2332556.
  13. Craig, C. C «On the Frequency Function of xy». Ann. Math. Statist., 7, 1936, pàg. 1 - 15. DOI: 10.1214/aoms/1177732541.
  14. Peddada and Richards, S. D; Richards, D «Proof of a Conjecture of M. L. Eaton on the Characteristic Function of the Wishart Distribution». Annals of Probability, 19, (2), 1991, pàg. 868 - 874. DOI: 10.1214/aop/1176990455.
  15. Gindikin, S. G «Invariant generalized functions in homogeneous domains». Funct. Anal. Appl., 9, (1), 1975, pàg. 50 - 52. DOI: 10.1007/BF01078179.
  16. Dwyer, P. S «Some Applications of Matrix Derivatives in Multivariate Analysis». J. Amer. Statist. Assoc, 62, (318), 1967, pàg. 607 - 625. JSTOR: 2283988.

Enllaços externs[modifica]