Vés al contingut

Distribució khi quadrat

De la Viquipèdia, l'enciclopèdia lliure
Infotaula distribució de probabilitat
Funció de densitat de probabilitat
Funció de distribució de probabilitat
Tipusfamília exponencial, Distribució khi quadrat no central, distribució gamma, Generalized chi-squared distribution (en) Tradueix i distribució de probabilitat contínua Modifica el valor a Wikidata
Notació o
Paràmetres (graus de llibertat)
Suport Modifica el valor a Wikidata
fdp
FD
Esperança matemàtica
Mediana
Moda
Variància
Coeficient de simetria
Curtosi Modifica el valor a Wikidata
Entropia
FGM Modifica el valor a Wikidata
FC Modifica el valor a Wikidata
EOMChi-squared_distribution Modifica el valor a Wikidata
MathworldChi-SquaredDistribution Modifica el valor a Wikidata

En Teoria de la probabilitat i Estadística la distribució distribució khi quadrat (pronunciat [xi] o [ci]), també anomenada khi quadrat de Pearson, amb de llibertat és la distribució de la suma dels quadrats de variables aleatòries normals estàndard independents. És un cas particular de la distribució gamma i es pot estendre a un nombre no enter de graus de llibertat. És molt important en Estadística ja que intervé en nombrosos tests estadístics, com el de la de Student o de la de Pearson, així com en la construcció de diversos intervals de confiança.

La referència bàsica d'aquest article és Johnson et al.[1].

Definició, funció de densitat i funció de distribució

[modifica]

Siguin variables aleatòries independents, totes amb distribució normal estàndard . La variable aleatòria es diu que té una distribució amb graus de llibertat i s'escriu o .

La funció de densitat és on és la funció gamma. Per tant, tenim que la distribució coincideix amb una distribució gamma amb paràmetre de forma i paràmetre d'escala 2, .

Funció de distribució

[modifica]

La funció de distribució es pot escriure en termes de la funció gamma incompleta: on és la funció gamma incompleta inferior.

Extensió a graus de llibertat no enters

[modifica]

La funció està ben definida i és una funció de densitat per a qualsevol : en efecte, fixat qualsevol nombre real , tenim que i . Aleshores, una variable aleatòria amb aquesta densitat es diu que té una distribució amb graus de llibertat. Alternativament, la distribució està definida per a qualsevol . A partir d'ara, suposarem que . i especificarem quan suposem que és un nombre natural.

Moments, funció generatriu de moments i funció característica

[modifica]

Moments

[modifica]

Aquestes propietats es dedueixen particularitzant les corresponents propietats de la distribució gamma. Si aleshores té moments de tots els ordres, que valen Utilitzant la funció Gamma es pot escriure

En particular, d'on Així,

Moments d'ordre negatiu

[modifica]

Si és una variable aleatòria positiva, , aleshores per a qualsevol podem calcular però pot donar . Quan dona finit, llavors es diu que la variable té moment d'ordre negatiu .[2]

Sigui . Llavors, si , té moment d'ordre negatiu i val [2]Per exemple, si , llavors té moment negatiu d'ordre -1 i val Aquesta propietat s'utilitza per a calcular els moments de distribucions de quocients (o ratios) de variables aleatòries independents quan al denominador hi ha una distribució khi quadrat, com en el cas d'una distribució de Student o una distribució .

Funció generatriu de moments

[modifica]

La funció generatriu de moments és

Funció característica

[modifica]

La funció característica és

Caràcter reproductiu

[modifica]

Del caràcter reproductiu de les distribucions gamma es dedueix el de les distribucions : Siguin independents, amb distribucions , . Llavors,

Propietat.:[3] Siguin i . Suposem que és independent de . Aleshores .



Aproximació per la distribució normal

[modifica]

En aquesta secció considerarem la distribució amb un nombre enter de graus de llibertat. D'acord amb el teorema central del límit, si , aleshoresEn altres paraules, per a gran, és aproximadament normal .

Però aquesta aproximació demana força gran. La següent aproximació, deguda a Fisher,[4] és més ràpida Equivalentment, per a gran, és aproximadament normal .

Segons Johnson et al[5] encara és més ràpida l'aproximació deguda a Wilson and Hilferty:[6] per a gran, és aproximadament normal

La distribució χ² i les mostres de poblacions normals

[modifica]

El següent resultat té una importància fonamental en la inferència estadística basada en mostres de poblacions normals.

Teorema. Sigui una mostra d'una població normal , és a dir, les variables aleatòries són independents i totes tenen distribució . Considerem la mitjana mostral Aleshores:

  1. Les variables aleatòries i són independents.

A partir d'aquest teorema i del fet que , tenim que la variable aleatòria (estadístic) té una distribució de Sudent amb graus de llibertat: , on

és la variància mostral.

Relació amb altres distribucions

[modifica]
  • Si , aleshores té una distribució gamma .
  • Si i , aleshores . En particular, per a , tenim que . Aquesta propietat és deguda a la propietat d'escala de la distribució gamma.
  • Relació amb la distribució de Poisson.[10]. Sigui amb parell. Aleshores per a qualsevol ,

on és una variable aleatòria amb una distribució de Poisson de paràmetre .

Noteu que aquesta propietat és equivalent a la que es formula a la pàgina de la distribució de Poisson: Si és una variable amb distribució de Poisson de paràmetre , aleshores [11] per a ,

on .

  • Si , aleshores té una distribució exponencial de paràmetre 1/2.
  • Si , aleshores té una distribució d'Erlang de paràmetres i 1/2.
  • Si (distribució d'Erlang) llavors .
  • Si (distribució de Rayleigh) llavors .
  • Si (distribució de Maxwell) llavors .
  • Si i són independents, llavors (Distribució beta).
  • Si (distribució uniforme contínua) llavors .

Aplicacions

[modifica]

La distribució khi quadrat té moltes aplicacions en inferència estadística, per exemple en el test khi quadrat i en l'estimació de variàncies. També està involucrada en el problema d'estimar la mitjana d'una població normalment distribuïda i en el problema d'estimar el pendent d'una recta de regressió lineal, a través del seu paper en la distribució t de Student, i participa en tots els problemes d'anàlisi de variància, pel seu paper en la distribució F de Snedecor, que és la distribució del quocient de dues variables aleatòries de distribució khi-quadrat i independents. També té ús al contrast de poblacions amb els contrasts d'homogeneïtat i al d'independència.

Referències

[modifica]
  1. Johnson, Kotz i Balakrishnan, 1994, Chapter 18.
  2. 2,0 2,1 David, H. A. «Moments of Negative Order and Ratio-Statistics». Journal of the Royal Statistical Society. Series B (Methodological), 17, 1, 1955, pàg. 122–123. ISSN: 0035-9246.
  3. Seber, G. A. F.. Linear regression analysis. 2a edició. Hoboken, N.J.: Wiley-Interscience, 2003, p. 13. ISBN 0-471-41540-5. 
  4. Fisher, Ronald A. Stastistical Methods for Social Workers. Edimburg: Oliver & Boyd, 1925, p. 63. 
  5. Johnson, Kotz i Balakrishnan, 1994, p. 426.
  6. Wilson, Edwin B.; Hilferty, Margaret M. «The Distribution of Chi-Square» (en anglès). Proceedings of the National Academy of Sciences, 17, 12, 12-1931, pàg. 684–688. DOI: 10.1073/pnas.17.12.684. ISSN: 0027-8424. PMC: PMC1076144. PMID: 16577411.
  7. Williams, D. Weighing the odds : a course in probability and statistics. Cambridge: Cambridge University Press, 2001, p. 164. ISBN 0-521-80356-X. 
  8. DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374. ISBN 0-201-64405-3. 
  9. Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 149. ISBN 978-0-470-22678-0. 
  10. Johnson, Kotz i Balakrishnan, 1994, p. 450.
  11. Johnson, Norman Lloyd. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 162, formula (4.38). ISBN 0-471-54897-9. 

Bibliografia

[modifica]

Vegeu també

[modifica]