Distribució gamma: diferència entre les revisions

Contingut suprimit Contingut afegit

En línia

Revisió del 02:53, 13 set 2007

A la teoria de la probabilitat i l'estadística, la distribució gamma és una família de distribucions contínues amb dos paràmetres. Té un paràmetre d'escala θ i un paràmetre de forma k. Si k és un nombre sencer aleshores la distribució representa la suma de k variables aleatòries exponencials, cadascuna de les quals té mitjana θ.

Caracterització

Una variable aleatòria gamma X amb escala θ i forma k es denota

X\sim \Gamma (k,\theta )\,\,\mathrm {or} \,\,X\sim {\textrm {Gamma}}(k,\theta )

Funció de densitat de probabilitat

La funció de probabilitat de densitat de la distribució gamma pot expressar-se en termes de la funció gamma:

f(x;k,\theta )=x^{k-1}{\frac {e^{-x/\theta }}{\theta ^{k}\,\Gamma (k)}}\ \mathrm {for} \ x>0\,\,\mathrm {and} \,\,k,\theta >0.

En aquesta parametrització l'esperança és $k/\theta$ Alternativament, la distribució gamma pot parameteritzar-se en termes d'un paràmetre de forma $\alpha =k$ i un paràmetre d'escala inversa $\beta =1/\theta$ , anomenat un paràmetre de tasa:

g(x;\alpha ,\beta )=x^{\alpha -1}{\frac {\beta ^{\alpha }\,e^{-\beta \,x}}{\Gamma (\alpha )}}\ \mathrm {for} \ x>0\,\!.

En la segona parametrització l'esperança és $k\theta$ . Ambdues parametritzacions són comunes perque qualsevol de les dues pot ésser més convenient depenent de la tasca a la que un s'enfronta. És possible una tercera parametrització, on es manté el paràmetre de forma $\alpha =k$ i s'introdueix l'esperança $\mu =\alpha /\theta$ . L'avantatge d'aquesta darrera parametrització és que és més fàcilment interpretable.

Funció de distribució

La funció de distribució pot expressar-se en termes de la funció gamma incomplerta,

F(x;k,\theta )=\int _{0}^{x}f(u;k,\theta )\,du={\frac {\gamma (k,x/\theta )}{\Gamma (k)}}\,\!

Propietats

Moments

Mitjana= $k\theta \,\!$

Mediana =no hi ha una expressió simple

Moda= $(k-1)\theta \,\!$ per $k\geq 1\,\!$ , 0 altrament

Variància= $k\theta ^{2}\,\!$

Asimetria= ${\frac {2}{\sqrt {k}}}\,\!$

Kurtosis = ${\frac {6}{k}}\,\!$

Entropia = $k+\ln \theta +\ln \Gamma (k)+(1-k)\psi (k)\!$

Funció generadora de moments = $(1-\theta \,t)^{-k}\,\!$ for $t<1/\theta \,\!$

Funció característica = $(1-\theta \,i\,t)^{-k}\,\!$

Suma

Si X_i segueix una distribució Γ(α_i, β) per a i = 1, 2, ..., N, aleshores

\sum _{i=1}^{N}X_{i}\sim \Gamma \left(\sum _{i=1}^{N}\alpha _{i},\beta \right)\,\!

assumint que totes les X_i són independents.

La distribució gamma és infinitament divisible.

Transformació d'escala

Per a qualssevol t > 0 es compleix que tX segueix una distribució Γ(k, tθ), demonstrant que θ és un paràmetre d'escala.

Família exponencial

La distribució gamma pertany a la família exponencial de dos paràmetres i té paràmetres naturals $k-1$ i $1/\theta$ , i estadístics naturals $X$ i $\ln(X)$ .

Entropía

L'entropia ve donada per

{\frac {-1}{\theta ^{k}\Gamma (k)}}\int _{0}^{\infty }{\frac {x^{k-1}}{e^{x/\theta }}}\left[(k-1)\ln x-x/\theta -k\ln \theta -\ln \Gamma (k)\right]\,dx\!

=-\left[(k-1)(\ln \theta +\psi (k))-k-k\ln \theta -\ln \Gamma (k)\right]\!

=k+\ln \theta +\ln \Gamma (k)+(1-k)\psi (k)\!

on ψ(k) és la funció digamma.

Divergència Kullback-Leibler

La divergència Kullback-Leibler entre una Γ(α₀, β₀) (la distribució verdadera) i una Γ(α, β) (la distribució que la aproxima) ve donada per

D_{\mathrm {KL} }(\alpha ,\beta ||\alpha _{0},\beta _{0})=\log \left({\frac {\Gamma ({\alpha _{0}})\beta _{0}^{\alpha _{0}}}{\Gamma (\alpha )\beta ^{\alpha _{0}}}}\right)+(\alpha -{\alpha _{0}})\psi (\alpha )+\alpha {\frac {\beta -\beta _{0}}{\beta _{0}}}

Transformada de Laplace

La transformada de Laplace de la distribució gamma és

F(s)={\frac {\beta ^{\alpha }}{(s+\beta )^{\alpha }}}

Estimació dels paràmetres

Màxima versemblança

La funció de versemblança per a N observacions iid $(x_{1},\ldots ,x_{N})$ és

L(\theta )=\prod _{i=1}^{N}f(x_{i};k,\theta )\,\!

de la qual podem calcular la log-versemblança

\ell (\theta )=(k-1)\sum _{i=1}^{N}\ln {(x_{i})}-\sum x_{i}/\theta -Nk\ln {(\theta )}-N\ln {\Gamma (k)}.

L'estimador màxim-versemblant s'obté maximitzant la log-versemblança, és a dir, calculant-ne la derivada i igualant a zero (es pot demostrar que la funció és convexa i que per tant té un sol extrem). Proceding d'aquesta manera trobem que:

{\hat {\theta }}={\frac {1}{kN}}\sum _{i=1}^{N}x_{i}.\,\!

Substituint aquest resultat a l'expressió de la log-versemblança dona

\ell =(k-1)\sum _{i=1}^{N}\ln {(x_{i})}-Nk-Nk\ln {\left({\frac {\sum x_{i}}{kN}}\right)}-N\ln {(\Gamma (k))}.\,\!

Per trobar el màxim respecte de k cal calcular la derivada i igualar-la a zero, amb el qual s'obté:

\ln {(k)}-\psi (k)=\ln {\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}\right)}-{\frac {1}{N}}\sum _{i=1}^{N}\ln {(x_{i})}\,\!

on

\psi (k)={\frac {\Gamma '(k)}{\Gamma (k)}}\!

és la funció digamma. No existeix cap fòrmula tancada per a k, però la funció es comporta bé numericament (és convexe), i per tant és senzill trobar-ne una solució numèrica, per exemple amb el mètode de Newton. És possible trobar un valor inicial per a k emprant el mètode dels moments, o emprant l'aproximació

\ln(k)-\psi (k)\approx {\frac {1}{k}}\left({\frac {1}{2}}+{\frac {1}{12k+2}}\right).\,\!

Si definim

s=\ln {\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}\right)}-{\frac {1}{N}}\sum _{i=1}^{N}\ln {(x_{i})},\,\!

aleshores k és aproximadament

k\approx {\frac {3-s+{\sqrt {(s-3)^{2}+24s}}}{12s}}

que és dins d'un 1.5% del valor correcte.

Estimador Bayesià

Si considerem que k es conegut i $\theta$ és desconegut, la funció de densitat a posteriori per a $\theta$ és (assumint que la distribució a priori és proporcional a $1/\theta$ )

P(\theta |k,x_{1},...,x_{N})\propto 1/\theta \prod _{i=1}^{N}f(x_{i};k,\theta ).\,\!

Definint

y\equiv \sum _{i=1}^{N}x_{i},\qquad P(\theta |k,x_{1},\dots ,x_{N})=C(x_{i})\theta ^{-Nk-1}e^{-y/\theta }.\!

Per tal de calcular l'esperança cal calcular la integral respecte &theta, el qual pot dur-se a terme emprant un canvi de variables que revela que 1/&theta segueix una distribució gamma amb paràmetres $\scriptstyle \alpha =Nk,\ \ \beta =y$ .

\int _{0}^{\infty }\theta ^{-Nk-1+m}e^{-y/\theta }\,d\theta =\int _{0}^{\infty }x^{Nk-1-m}e^{-xy}\,dx=y^{-(Nk-m)}\Gamma (Nk-m).\!

Els moments podem calcular-se especificant diferents valors per a m a la següent expressió

E(x^{m})={\frac {\Gamma (Nk-m)}{\Gamma (Nk)}}y^{m},\!

Per exemple, l'esperança +/- la desviació estàndard de la distribució a posteriori de $\theta$ és:

{\frac {y}{Nk-1}}

+/-

{\frac {y^{2}}{(Nk-1)^{2}(Nk-2)}}.

També és possible obtenir estimadors Bayesians sense assumir que k és conegut, però en general no és possible obtenir-ne una expressió senzilla.

Referències

Weisstein, Eric W., «Gamma distribution» a MathWorld (en anglès).
S. C. Choi and R. Wette. (1969) Maximum Likelihood Estimation of the Parameters of the Gamma Distribution and Their Bias, Technometrics, 11(4) 683-69

Categoría:Estadística

@@ Línia 115: / Línia 115: @@
 </math>
+== Estimació dels paràmetres ==
+=== Màxima versemblança ===
+La funció de versemblança per a ''N'' observacions
+[[variables aleatòries independents i identicament distribuïdes|iid]]
+<math>(x_1,\ldots,x_N)</math> és
+:<math>L(\theta)=\prod_{i=1}^N f(x_i;k,\theta)\,\!</math>
+de la qual podem calcular la log-versemblança
+:<math>\ell(\theta) = (k-1) \sum_{i=1}^N \ln{(x_i)} - \sum x_i/\theta - Nk\ln{(\theta)} - N\ln{\Gamma(k)}.</math>
+L'[[estimador màxim-versemblant]] s'obté maximitzant la log-versemblança,
+és a dir, calculant-ne la derivada i igualant a zero (es pot demostrar
+que la funció és convexa i que per tant té un sol extrem).
+Proceding d'aquesta manera trobem que:
+:<math>\hat{\theta} = \frac{1}{kN}\sum_{i=1}^N x_i. \,\!</math>
+Substituint aquest resultat a l'expressió de la log-versemblança dona
+:<math>\ell=(k-1)\sum_{i=1}^N\ln{(x_i)}-Nk-Nk\ln{\left(\frac{\sum x_i}{kN}\right)}-N\ln{(\Gamma(k))}. \,\!</math>
+Per trobar el màxim respecte de ''k'' cal calcular la derivada i
+igualar-la a zero, amb el qual s'obté:
+:<math>\ln{(k)}-\psi(k)=\ln{\left(\frac{1}{N}\sum_{i=1}^N x_i\right)}-\frac{1}{N}\sum_{i=1}^N\ln{(x_i)} \,\!</math>
+on
+:<math>\psi(k) = \frac{\Gamma'(k)}{\Gamma(k)} \!</math>
+és la funció digamma.
+No existeix cap fòrmula tancada per a ''k'', però la funció es comporta bé
+numericament (és convexe), i per tant és senzill trobar-ne una solució numèrica,
+per exemple amb el [[mètode de Newton]].
+És possible trobar un valor inicial per a ''k''
+emprant el [[mètode dels moments (estadística)|mètode dels moments]],
+o emprant l'aproximació
+:<math>\ln(k)-\psi(k) \approx \frac{1}{k}\left(\frac{1}{2} + \frac{1}{12k+2}\right). \,\!</math>
+Si definim
+:<math>s = \ln{\left(\frac{1}{N}\sum_{i=1}^N x_i\right)} - \frac{1}{N}\sum_{i=1}^N\ln{(x_i)},\,\!</math>
+aleshores ''k'' és aproximadament
+:<math>k \approx \frac{3-s+\sqrt{(s-3)^2 + 24s}}{12s}</math>
+que és dins d'un 1.5% del valor correcte.
+=== Estimador Bayesià ===
+Si considerem que ''k'' es conegut i <math>\theta</math> és
+desconegut, la funció de densitat a posteriori per a <math>\theta</math> és
+(assumint que la distribució a priori és proporcional a <math>1/\theta</math>)
+:<math>
+P(\theta | k, x_1, ..., x_N) \propto 1/\theta \prod_{i=1}^N f(x_i;k,\theta).\,\!
+</math>
+Definint
+:<math> y \equiv \sum_{i=1}^N x_i , \qquad  P(\theta | k, x_1, \dots , x_N) = C(x_i)  \theta^{-N k-1} e^{-y / \theta}. \! </math>
+Per tal de calcular l'esperança cal calcular la integral respecte &theta,
+el qual pot dur-se a terme emprant un canvi de variables que
+revela que 1/&theta segueix una distribució gamma amb paràmetres
+<math>\scriptstyle \alpha = N k,\ \  \beta = y</math>.
+:<math>
+\int_0^{\infty} \theta^{-N k-1+m} e^{-y / \theta}\, d\theta = \int_0^{\infty} x^{N k -1 -m} e^{-x y} \, dx = y^{-(N k -m)} \Gamma(N k -m). \!
+</math>
+Els moments podem calcular-se especificant diferents valors per a ''m'' a
+la següent expressió
+:<math>
+E(x^m) = \frac {\Gamma (N k -m)} {\Gamma(N k)} y^m, \!
+</math>
+Per exemple, l'esperança +/- la desviació estàndard de la distribució
+a posteriori de <math>\theta</math> és:
+:<math> \frac {y} {N k -1}</math> +/- <math>\frac {y^2} {(N k-1)^2 (N k-2)}. </math>
+També és possible obtenir estimadors Bayesians sense assumir que ''k''
+és conegut, però en general no és possible obtenir-ne una expressió senzilla.
+== Referències ==
+* {{MathWorld|urlname=GammaDistribution|title=Gamma distribution}}
+* S. C. Choi and R. Wette. (1969) ''Maximum Likelihood Estimation of the Parameters of the Gamma Distribution and Their Bias'', '''Technometrics''', '''11'''(4) 683-69