Distribució t multivariant

De la Viquipèdia, l'enciclopèdia lliure


Infotaula distribució de probabilitatDistribució t multivariant
Tipusdistribució conjunta, Distribució el·líptica i matrix t-distribution (en) Tradueix Modifica el valor a Wikidata
Notació
Paràmetres
matriu definida positiva
graus de llibertat
Suport
fdp
Esperança matemàtica, si
Mediana
Moda
Variància, si
Coeficient de simetria0

En Teoria de la probabilitat i Estadística, la distribució mutivariable o multivariant és una extensió vectorial de la distribució de Student. Aquesta distribució és una alternativa a la distribució normal multivariable quan apareixen dades atípiques (outliers) o cues pesades, com passa sovint en l'anàlisi de dades financeres. D'altra banda, també és molt utilitzada en estadística bayesiana multivariant com a distribució a priori .[1]

Definició[modifica]

Escriurem tots els vectors en columna i per una matriu o vector , escriurem per designar la seva transposada.

El cas més senzill[modifica]

Siguin variables aleatòries independents , totes amb distribució normal estàndard , i sigui una variable aleatòria amb distribució hki quadrat amb graus de llibertat, , independent de . Definim el vector

Es diu que té té una distribució multivariable amb graus de llibertat.[2] Noteu que
tenen distribució de Student amb graus de llibertat, , però no són independents ja que totes tenen el factor .

En notació vectorial, si escrivim , que és un vector normal multivariable , on és la matriu identitat de dimensió , tenim

Notació: S'escriu . La funció de densitat de és [2]

Aquest densitat es troba exactament igual que la de la funció de densitat de la distribució de Student, però fent el canvi de variables i calculant la densitat marginal de .

Per a , l'expressió (2) es redueix a la funció de densitat de la distribució de Student amb graus de llibertat.
Estudiem el cas . Tenim
Per construcció, les densitats marginals de i són

Per tant,

que és coherent amb el fet que i no són independents. Però també implica que si i són dues variables aleatòries independents ambdues amb distribució , llavors el vector no té una distribució bivariable, en contrast amb allò que passa amb les variables normals independents. Finalment, noteu que si , llavors i tindran moment de segon ordre i
i
amb la qual cosa i estan incorrelacionades

Cas general[modifica]

Sigui , on és una matriu definida positiva (en particular, simètrica i amb determinant diferent de 0) , , i , independent de . Aleshores el vector aleatori

es diu que té una distribució multivariable amb graus de llibertat, amb paràmetres i (també es diu que és el vector de posició i el paràmetre d'escala ), i s'escriu . La funció de densitat és [2]

on és el determinant de la matriu . Quan , llavors s'obté una distribució amb tres paràmetres.

De les propietats de les distribucions normals multivariables

on és l'arrel quadrada de la matriu ,[3] tindrem que
D'on es dedueix l'expressió de la densitat (4) a partir de (2) mitjançant la formula de canvi de variables per a vectors aleatoris.

Es important remarcar que aquesta distribució pertany a la família de les distribucions amb simetria el·líptica [4]

Propietats[modifica]

La distribució multivariable comparteix amb la distribució normal multivariable diverses propietats importants.

Distribucions marginals[modifica]

Sigui . Aleshores qualsevol subvector també té una distribució multivariable. Més concretament, per i (per simplificar les notacions) prenem . Llavors , on i és la submatriu de obtinguda eliminant les files i les columnes . Aquesta propietat es dedueix de la representació (3) del vector .

Transformacions afins[modifica]

Sigui , una matriu definida positiva (en particular, simètrica) i . Aleshores

Aquesta propietat es dedueix de la representació (3) i de les propietats dels vectors normals multivariables.

Combinacions lineals de les components[modifica]

Sigui . Considerem una combinació lineal de les seves components

on . Aleshores
on aquesta última és una distribució de Student amb 3 paràmetres (graus de llibertat, paràmetre de posició i quadrat del paràmetre d'escala) .


Aquesta propietat també es demostra a partir de les propietats de la distribució normal multivariable.

Distribucions condicionades[modifica]

Sigui i separem-lo en dues parts i de dimensions i respectivament, amb ,

Partim de la mateixa manera ,

i la matriu de la forma

Aleshores la distribució de condicionada a és una distribució multivariable:
on

és el quadrat de la distància de Mahalanobis de a amb matriu d'escala

.

és el complement de Schur de la matriu en .
és la regressió lineal de sobre .
Per a la demostració vegeu.[5]

Convergència a la distribució normal multivariable[modifica]

Quan , la distribució s'aproxima a una distribució normal multivariable . Concretament, si (suposem un nombre natural), i llavors

Aquesta propietat es demostra utilitzant la tècnica de Cramer-Wold, juntament amb la propietat que hem vist sobre les combinacions lineals de les components d'un vector amb distribució multivariable i la convergència de la distribució de Student a la distribució normal.

Moments[modifica]

Sigui . Les següents dues propietats es demostren a partir de la representació (3).

Esperança

Si , llavors el vector té esperança i

Matriu de variàncies-covariàncies.

Si , aleshores la matriu de variàncies-covariàncies del vector és:

Moments d'ordre superior. [4]

Ens restringirem al cas que i . Sigui i nombres naturals tals que . Aleshores

i si són parells, aleshores
Si algun dels és senar, aleshores l'esperança anterior és 0.

Aquesta propietat es demostra a partir de la representació (1), de la independència de i , i les fórmules per als moments d'una distribució i dels d'una distribució khi quadrat.

Funció característica[modifica]

La funció característica no té una expressió senzilla. Vegeu [1] o.[6][7]

Simulació[modifica]

La definició constructiva d'una distribució t multivariant serveix simultàniament com a algorisme de mostreig:

  1. Generar i , independentment.
  2. Calcular .

Mixtura[modifica]

Aquesta formulació dóna lloc a la representació jeràrquica d'una distribució t multivariant com una mixtura d'escala de normals: Si on indica una distribució gamma amb densitat proporcional a , i condicionalment segueix .


Referències[modifica]

  1. 1,0 1,1 Kotz, Samuel; Nadarajah, Saralees. Multivariate T-Distributions and Their Applications. Cambridge: Cambridge University Press, 2004, p. 36. DOI 10.1017/cbo9780511550683. ISBN 978-0-521-82654-9. 
  2. 2,0 2,1 2,2 Anderson, T. W.. An introduction to multivariate statistical analysis. 3rd ed. Hoboken, N.J: Wiley-Interscience, 2003, p. 55. ISBN 978-0-471-36091-9. 
  3. Seber, G.A.F.. A Matrix Handbook for Statisticians. Wiley, 2008, p. 221, ítem 10.2. 
  4. 4,0 4,1 Fang, Kaitai; Kotz, Samuel; Ng, Kai-Wang. Symmetric multivariate and related distributions. Reissued 2018. Milton: CRC Press, 2018, p. 32-33, 85-88. ISBN 978-1-315-89794-3. 
  5. Ding, Peng «On the Conditional Distribution of the Multivariate t Distribution». The American Statistician, 70, 3, 2016, pàg. 293–295. ISSN: 0003-1305.
  6. Sutradhar, Brajendra C. «On the Characteristic Function of Multivariate Student t-Distribution». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 14, 4, 1986, pàg. 329–337. DOI: 10.2307/3315191. ISSN: 0319-5724.
  7. «Addendum to Dagum and Sutradhar». The Canadian Journal of Statistics / La Revue Canadienne de Statistique, 16, 3, 1988, pàg. 323–323. DOI: 10.2307/3314742. ISSN: 0319-5724.