Funció de densitat de probabilitat |
Funció de distribució de probabilitat |
Tipus | família exponencial, Distribució khi quadrat no central, distribució gamma, Generalized chi-squared distribution (en) i distribució de probabilitat contínua |
---|
Notació | o |
---|
Paràmetres | (graus de llibertat) |
---|
Suport | |
---|
fdp | |
---|
FD | |
---|
Esperança matemàtica | |
---|
Mediana | |
---|
Moda | |
---|
Variància | |
---|
Coeficient de simetria | |
---|
Curtosi | |
---|
Entropia | |
---|
FGM | |
---|
FC | |
---|
EOM | Chi-squared_distribution |
---|
Mathworld | Chi-SquaredDistribution |
---|
En Teoria de la probabilitat i Estadística la distribució distribució khi quadrat (pronunciat [xi] o [ci]), també anomenada khi quadrat de Pearson, amb de llibertat és la distribució de la suma dels quadrats de variables aleatòries normals estàndard independents. És un cas particular de la distribució gamma i es pot estendre a un nombre no enter de graus de llibertat. És molt important en Estadística ja que intervé en nombrosos tests estadístics, com el de la de Student o de la de Pearson, així com en la construcció de diversos intervals de confiança.
La referència bàsica d'aquest article és Johnson et al..
Definició, funció de densitat i funció de distribució
[modifica]
Siguin variables aleatòries independents, totes amb distribució normal estàndard . La variable aleatòria es diu que té una distribució amb graus de llibertat i s'escriu o .
La funció de densitat és
on és la funció gamma. Per tant, tenim que la distribució coincideix amb una distribució gamma amb paràmetre de forma i paràmetre d'escala 2, .
Prova
Comencem pel cas
. Sigui
, amb
. La funció de distribució de
,
valdrà:
- Si , llavors òbviament .
- Si , llavors
on és la funció de distribució de .
Derivant obtenim la funció de densitat de , : per a , Per tant, identifiquem que té una distribució gamma amb paràmetre de forma 1/2 i paràmetre d'escala 2: .
Anem ara al cas general: podem escriure
on
són independents i
. Llavors, pel caràcter reproductiu de les
distribucions gamma,
, i, per tant, tindrà la densitat que hem indicat abans.
La funció de distribució es pot escriure en termes de la funció gamma incompleta: on és la funció gamma incompleta inferior.
Extensió a graus de llibertat no enters
[modifica]
La funció està ben definida i és una funció de densitat per a qualsevol : en efecte, fixat qualsevol nombre real , tenim que i . Aleshores, una variable aleatòria amb aquesta densitat es diu que té una distribució amb graus de llibertat. Alternativament, la distribució està definida per a qualsevol . A partir d'ara, suposarem que . i especificarem quan suposem que és un nombre natural.
Moments, funció generatriu de moments i funció característica
[modifica]
Aquestes propietats es dedueixen particularitzant les corresponents propietats de la distribució gamma. Si aleshores té moments de tots els ordres, que valen
Utilitzant la funció Gamma es pot escriure
En particular,
d'on
Així,
|
Si és una variable aleatòria positiva, , aleshores per a qualsevol podem calcular però pot donar . Quan dona finit, llavors es diu que la variable té moment d'ordre negatiu .[2]
Sigui . Llavors, si , té moment d'ordre negatiu i val [2]Per exemple, si , llavors té moment negatiu d'ordre -1 i val Aquesta propietat s'utilitza per a calcular els moments de distribucions de quocients (o ratios) de variables aleatòries independents quan al denominador hi ha una distribució khi quadrat, com en el cas d'una distribució de Student o una distribució .
La funció generatriu de moments és
La funció característica és
Del caràcter reproductiu de les distribucions gamma es dedueix el de les distribucions : Siguin independents, amb distribucions , . Llavors,
- Propietat.:[3] Siguin i . Suposem que és independent de . Aleshores .
Prova
Designem per
les funcions característiques de
respectivament. Llavors,
D'on
i per tant,
.
Aproximació per la distribució normal
[modifica]
En aquesta secció considerarem la distribució amb un nombre enter de graus de llibertat. D'acord amb el teorema central del límit, si , aleshoresEn altres paraules, per a gran, és aproximadament normal .
Però aquesta aproximació demana força gran. La següent aproximació, deguda a Fisher,[4] és més ràpida Equivalentment, per a gran, és aproximadament normal .
Segons Johnson et al encara és més ràpida l'aproximació deguda a Wilson and Hilferty:[6] per a gran, és aproximadament normal
Prova
Per a l'aproximació donada pel teorema central del límit, considerem una successió
de variables aleatòries independents, totes amb distribució normal estàndard
. La successió
estarà formada per variables independents, amb esperança
i variància
Pel
teorema central del límit,
Però
L'aproximació de Fisher pot deduir-se de l'aproximació de la distribució gamma a la distribució normal: sigui . Aleshores Ara, per la propietat d'escala de la distribució gamma, atès que , tenim que . Vegeu [7] pels detalls .
Per a l'aproximació de Wilson and Hilferty, consulteu la referència citada.
La distribució χ² i les mostres de poblacions normals
[modifica]
El següent resultat té una importància fonamental en la inferència estadística basada en mostres de poblacions normals.
Teorema. Sigui una mostra d'una població normal , és a dir, les variables aleatòries són independents i totes tenen distribució . Considerem la mitjana mostral Aleshores:
- Les variables aleatòries i són independents.
|
A partir d'aquest teorema i del fet que , tenim que la variable aleatòria (estadístic)
té una distribució de Sudent amb graus de llibertat: , on
és la variància mostral.
Prova
Aquesta demostració està extreta de DeGroot .
[8]
Pas previ: reducció a una mostra d'una població normal estàndard. Siguin
que son variables independents amb distribució .
Tenim que Llavors, Per tant, Així, n'hi ha prou amb demostrar que si són independents, totes amb llei , aleshores
- Les variables aleatòries i són independents.
Per demostrar aquestes propietats utilitzarem l'anomenada matriu de Helmert de dimensió :[9]que és una matriu ortogonal, és a dir, on denota la matriu transposada de . Aquesta matriu té la següent propietat: sigui (escriurem tots els vectors en columna) i Aleshores, tenim que En efecte, d'una banda, D'altra banda, desenvolupant els quadrats de l'esquerra de (1) s'obté El costat de la dreta de (1) és amb la qual cosa queda provada la igualtat (1).
Ara considerem el vector normal multidimensional , i sigui donat perPer les propietats dels vectors normals multidimensionals, del fet que són independents, totes amb llei i que és ortogonal, es dedueix que són independents, totes amb llei . Llavors,
La independència entre i es dedueix de les relacions
i de què
i
són independents.
Relació amb altres distribucions
[modifica]
- Si , aleshores té una distribució gamma .
- Si i , aleshores . En particular, per a , tenim que . Aquesta propietat és deguda a la propietat d'escala de la distribució gamma.
- Relació amb la distribució de Poisson.. Sigui amb parell. Aleshores per a qualsevol ,
on és una variable aleatòria amb una distribució de Poisson de paràmetre .
Prova
Escrivim
. Llavors,
Ara integrem per parts iteradament, començant per
i
.
Noteu que aquesta propietat és equivalent a la que es formula a la pàgina de la distribució de Poisson: Si és una variable amb distribució de Poisson de paràmetre , aleshores [11] per a ,
on .
- Si , aleshores té una distribució exponencial de paràmetre 1/2.
- Si , aleshores té una distribució d'Erlang de paràmetres i 1/2.
- Si (distribució d'Erlang) llavors .
- Si (distribució de Rayleigh) llavors .
- Si (distribució de Maxwell) llavors .
- Si i són independents, llavors (Distribució beta).
- Si (distribució uniforme contínua) llavors .
La distribució khi quadrat té moltes aplicacions en inferència estadística, per exemple en el test khi quadrat i en l'estimació de variàncies. També està involucrada en el problema d'estimar la mitjana d'una població normalment distribuïda i en el problema d'estimar el pendent d'una recta de regressió lineal, a través del seu paper en la distribució t de Student, i participa en tots els problemes d'anàlisi de variància, pel seu paper en la distribució F de Snedecor, que és la distribució del quocient de dues variables aleatòries de distribució khi-quadrat i independents. També té ús al contrast de poblacions amb els contrasts d'homogeneïtat i al d'independència.
- ↑ 2,0 2,1 David, H. A. «Moments of Negative Order and Ratio-Statistics». Journal of the Royal Statistical Society. Series B (Methodological), 17, 1, 1955, pàg. 122–123. ISSN: 0035-9246.
- ↑ Seber, G. A. F.. Linear regression analysis. 2a edició. Hoboken, N.J.: Wiley-Interscience, 2003, p. 13. ISBN 0-471-41540-5.
- ↑ Fisher, Ronald A. Stastistical Methods for Social Workers. Edimburg: Oliver & Boyd, 1925, p. 63.
- ↑ Wilson, Edwin B.; Hilferty, Margaret M. «The Distribution of Chi-Square» (en anglès). Proceedings of the National Academy of Sciences, 17, 12, 12-1931, pàg. 684–688. DOI: 10.1073/pnas.17.12.684. ISSN: 0027-8424. PMC: PMC1076144. PMID: 16577411.
- ↑ Williams, D. Weighing the odds : a course in probability and statistics. Cambridge: Cambridge University Press, 2001, p. 164. ISBN 0-521-80356-X.
- ↑ DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374. ISBN 0-201-64405-3.
- ↑ Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 149. ISBN 978-0-470-22678-0.
- ↑ Johnson, Norman Lloyd. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 162, formula (4.38). ISBN 0-471-54897-9.
|
---|
|
Distribucions discretes amb suport finit | |
---|
Distribucions discretes amb suport infinit | |
---|
Distribucions contínues suportades sobre un interval acotat | |
---|
Distribucions contínues suportades sobre un interval semi-infinit | |
---|
Distribucions contínues suportades en tota la recta real | |
---|
Distribucions contínues amb el suport de varis tipus | |
---|
Barreja de distribució variable-contínua | |
---|
Distribució conjunta | |
---|
Direccionals | |
---|
Degenerada i singular | |
---|
Famílies | |
---|