Funció característica (teoria de la probabilitat)

De Viquipèdia
Dreceres ràpides: navegació, cerca

En teoria de la probabilitat, la funció característica d'una variable aleatòria real és una eina matemàtica que proporciona informació completa sobre la distribució de probabilitat de la variable aleatòria i sovint en facilita l'estudi. A més, amb les funcions característiques es disposa, gràcies al teorema de continuïtat de Lévy, d'un mètode senzill i potent per estudiar la convergència en distribució d'una successió de variables aleatòries.

Donada una variable aleatòria real X : \Omega \to \mathbb{R} definida sobre un espai de probabilitat (\Omega,\, \mathcal{B},\, \mathbb{P} ), la seva funció característica és la funció \varphi_X : \mathbb{R} \to \mathbb{C} (és a dir de valors complexos) definida, per a tot real t, per la relació següent (on i \in \mathbb{C} , i^2 = -1 i \operatorname{E}(\cdot) denota l'operador esperança):

\varphi_X(t) = \operatorname{E}\left(\mathrm{e}^{i\, t\, X}\right) = \operatorname{E}\left(\cos\, (t\, X)\right) + i\, \operatorname{E}\left(\sin\, (t\, X)\right)


Expressions de la funció característica[modifica | modifica el codi]

Expressions integrals generals[modifica | modifica el codi]

Per definició de \varphi_X :

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \int_{\Omega} \mathrm{e}^{i\, t\, X}\, d\mathbb{P} = \int_{\Omega} \cos(t\, X)\, d\mathbb{P}\, +\, i\, \int_{\Omega} \sin(t\, X)\, d\mathbb{P}\;\;\,\qquad\qquad\qquad\quad (1)

Denotant per \mathbb{P}_X la distribució de probabilitat de la variable aleatòria X:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \int_{\mathbb{R}} \mathrm{e}^{i\, t\, x}\, d\mathbb{P}_X(x) = \int_{\mathbb{R}} \cos(t\, X)\, d\mathbb{P}_X(x)\, +\, i\, \int_{\mathbb{R}} \sin(t\, X)\, d\mathbb{P}_X(x) \qquad (2)
(segons el teorema de la mesura imatge)

Remarques:

  • la definició (1) té sentit perquè per a tot real t, la variable aleatòria complexa
\mathrm{e}^{i\, t\, X} = \cos\, (t\, X) + i\, \sin\, (t\, X)
és fitada (té mòdul 1) i per tant és integrable respecte a la mesura de probabilitat \mathbb{P} ;
  • l'equació (2) significa que la funció característica d'una variable aleatòria real X és la transformada de Fourier de la seva distribució de probabilitat \mathbb{P}_X, mesura de probabilitat sobre l'espai mesurable (o probabilitzable) (\mathbb{R},\, \mathcal{B}_{\mathbb{R}}), on \mathcal{B}_{\mathbb{R}} és la sigma-àlgebra de Borel de \mathbb{R}.

Casos particulars importants[modifica | modifica el codi]

  • Quan X és discreta, amb valors x_k tals que per a tot k, \mathbb{P}(X = x_k ) = p_k aleshores:
\forall\, t \in \mathbb{R},\, \varphi_X(t) = \sum_k \mathrm{e}^{i\, t\, x_k}\, p_k
(suma finita o sèrie absolutament convergent)
\forall\, t \in \mathbb{R},\, \varphi_X(t) = \int_{-\infty}^{+\infty} \mathrm{e}^{i\, t\, x}\, f_X(x)\, dx
(integral de Lebesgue; en els casos usuals coincideix amb la integral de Riemann)

Propietats elementals[modifica | modifica el codi]

La funció característica d'una variable aleatòria real X:

  • compleix la relació:
\varphi_X(0) = 1
\forall\, t \in \mathbb{R},\, |\varphi_X(t)| \leq 1
  • és hermítica:
\forall\, t \in \mathbb{R},\, \varphi_X(-t) = \overline{\varphi_X(t)} (on \overline{z} és el conjugat del nombre complex z)
  • compleix la identitat:
\forall\, a \in \mathbb{R},\, \forall\, b \in \mathbb{R},\, \forall\, t \in \mathbb{R},\, \varphi_{a\,X + b\,}(t) = \mathrm{e}^{i\, b\, t}\, \varphi_X(a\, t)
i en particular : \forall\, t \in \mathbb{R},\, \varphi_{-X\,}(t) = \varphi_X(-t) = \overline{\varphi_X(t)};
per tant si X i -X tenen la mateixa distribució (dita simètrica), la funció \varphi_X és parella amb valors reals

(la tercera propietat es dedueix del teorema de la convergència dominada; les altres són immediates)


Exemples clàssics[modifica | modifica el codi]

Distribució degenerada[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució degenerada de valor \mu (és a dir: \mathbb{P}(X = \mu) = 1; X és constant quasi segurament) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \mathrm{e}^{i\, t\, \mu}

Distribució binomial[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució binomial \mathcal{B}(n,\, p) (on n \in \mathbb{N},\, p \in [0,\, 1] ) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \sum_{k = 0}^n \mathrm{e}^{i\, t\, k}\, {n \choose k}\, p^k\, (1 - p)^{n - k} = \sum_{k = 0}^n {n \choose k}\, \left(p\, \mathrm{e}^{i\, t}\right)^k\, (1 - p)^{n - k}

d'on es dedueix (fórmula del binomi de Newton):

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \left(p\, \mathrm{e}^{i\, t} + 1 - p\right)^n

Distribució de Bernoulli[modifica | modifica el codi]

En particular, si la variable aleatòria X segueix la distribució de Bernoulli \mathcal{B}(1,\, p) (on \ p \in [0,\, 1] ) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = p\, \mathrm{e}^{i\, t} + 1 - p

Distribució geomètrica[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució geomètrica \mathcal{G}(p) (on p \in\, ]0,\, 1[\, ) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \sum_{k = 1}^{+\infty} \mathrm{e}^{i\, t\, k}\, p\, (1 - p)^{k - 1} = p\, \mathrm{e}^{i\, t}\, \sum_{k = 1}^{+\infty} \left[(1-p)\, \mathrm{e}^{i\, t}\right]^{k - 1} = \frac{p\, \mathrm{e}^{i\, t}}{1 - (1 - p)\, \mathrm{e}^{i\, t}}

Distribució de Poisson[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució de Poisson \mathcal{P}(\lambda) (on \lambda \in\, ]0,\, +\infty[\, ) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \sum_{k = 0}^{+\infty} \mathrm{e}^{i\, t\, k}\, \mathrm{e}^{-\lambda}\, \frac{\lambda^k}{k\,!} = \mathrm{e}^{-\lambda}\, \sum_{k = 0}^{+\infty} \frac{\left(\lambda\, \mathrm{e}^{i\, t}\right)^k}{k\,!} = \mathrm{e}^{-\lambda}\, \mathrm{e}^{\lambda\, \mathrm{e}^{i\, t}} = \mathrm{e}^{\lambda\, \left(\mathrm{e}^{i\, t} - 1\right)}

Distribució uniforme contínua[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució uniforme contínua \mathcal{U}([a,\, b] ) (on \ a \in \mathbb{R},\, b \in \mathbb{R} i a < b) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \int_a^b \mathrm{e}^{i\, t\, x}\, \frac{1}{b - a}\, dx = \frac{\mathrm{e}^{i\, t\, b} - \mathrm{e}^{i\, t\, a}}{i\, (b - a)\, t} si t \neq 0, i \varphi_X(0) = 1.

En particular, si X segueix la distribució \mathcal{U}([-\alpha,\, +\alpha] ) (on \alpha \in\, ]0,\, +\infty[\,) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \frac{\sin(\alpha\, t)}{\alpha\, t} si t \neq 0, i \varphi_X(0) = 1.

Distribució exponencial[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució exponencial \mathcal{E}(\lambda) (on \lambda \in\, ]0,\, +\infty[\, ) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \int_0^{+\infty} \mathrm{e}^{i\, t\, x}\, \lambda\, \mathrm{e}^{-\lambda\, x}\, dx = \lambda\, \int_0^{+\infty} \mathrm{e}^{-(\lambda - i\, t)\, x}\, dx = \frac{\lambda}{\lambda - i\, t}

Distribució normal estàndard[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució normal estàndard \mathcal{N}(0,\, 1) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \int_{-\infty}^{+\infty} \mathrm{e}^{i\, t\, x}\, \frac{1}{\sqrt{2\, \pi}}\, \mathrm{e}^{-\frac{x^2}{2}}\, dx = \mathrm{e}^{-\frac{t^2}{2}}


Distribució de Cauchy simètrica[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució de Cauchy simètrica \mathcal{C}(0,\, \gamma) (on \gamma \in\, ]0,\, +\infty[\, ) aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \int_{-\infty}^{+\infty} \mathrm{e}^{i\, t\, x}\, \frac{1}{\pi}\, \frac{\gamma}{x^2 + \gamma^2}\, dx = \mathrm{e}^{-\gamma\, |\,t\,|}

Per demostrar-ho, es pot utilitzar el teorema dels residus (anàlisi complexa).


Aplicacions[modifica | modifica el codi]

Cas de la distribució normal general[modifica | modifica el codi]

Sigui una variable aleatòria X amb distribució normal \mathcal{N}(\mu,\, \sigma^2) (on \mu \in \mathbb{R}, \sigma \in\, ]0,\, +\infty[\,). Aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \mathrm{e}^{i\, t\, \mu\, -\frac{\sigma^2\, t^2}{2}}.


Cas de la distribució de Cauchy general[modifica | modifica el codi]

Sigui una variable aleatòria X amb distribució de Cauchy \mathcal{C}(m,\, \gamma) (on m \in \mathbb{R}, \gamma \in\, ]0,\, +\infty[\,). Aleshores:

\forall\, t \in \mathbb{R},\, \varphi_X(t) = \mathrm{e}^{i\, m\, t\, -\,\gamma\, |\,t\,|}.


Perquè la funció característica és anomenada així[modifica | modifica el codi]

Com el seu nom ho indica, la funció característica d'una variable aleatòria (real) en caracteritza la distribució de probabilitat: dues variables aleatòries segueixen la mateixa distribució si i només si tenen la mateixa funció característica: és el teorema d'unicitat (vegeu infra).

Per aquesta raó, la funció característica d'una variable aleatòria X també és anomenada funció característica de la distribució d'X. Per exemple, es pot parlar de la funció característica de la distribució normal.

Teorema d'inversió[modifica | modifica el codi]

Donada una variable aleatòria real X, es denota per F_X la seva funció de distribució. Per a tot parell (a,\, b) de punts de continuïtat de F_X es compleix la relació següent:

F_X(b) - F_X(a) = \lim_{\tau \to +\infty} \frac{1} {2\pi}
 \int_{-\tau}^{+\tau} \frac{\mathrm{e}^{-i\,t\, a} - \mathrm{e}^{-i\, t\, b}} {i\,t}\, \varphi_X(t)\, dt

Això és una variant probabilista del teorema d'inversió de la transformació de Fourier.

Teorema d'unicitat[modifica | modifica el codi]

El teorema d'inversió permet reconstruir (almenys en teoria) la funció de distribució d'una variable aleatòria a partir de la seva funció característica. Una conseqüència és l'important teorema d'unicitat:

Dues variables aleatòries reals són idènticament distribuïdes si i només si tenen la mateixa funció característica.


Utilització pràctica[modifica | modifica el codi]

El més sovint, el teorema d'unicitat s'utilitza de la manera següent per determinar la distribució de probabilitat d'una variable aleatòria real X: es calcula la funció característica \varphi_X i es reconeix la funció característica d'una distribució clàssica que és, per tant, la distribució de X (per exemple, vegeu infra la prova de l'estabilitat d'algunes distribucions de probabilitat).

Funció característica de la suma de variables aleatòries independents[modifica | modifica el codi]

Suma de dues variables aleatòries independents[modifica | modifica el codi]

Donades dues variables aleatòries reals independents X i Y (definides sobre el mateix espai de probabilitat), es compleix la relació següent:

\forall\, t \in \mathbb{R},\, \varphi_{X + Y}(t) = \varphi_X(t)\, \varphi_Y(t).

En efecte,

\forall\, t \in \mathbb{R},\, \varphi_{X + Y}(t) = \operatorname{E}\left(\mathrm{e}^{i\, t\, (X + Y)}\right) = \operatorname{E}\left(\mathrm{e}^{i\, t\, X}\, \mathrm{e}^{i\, t\, Y}\right).

Atès que X i Y són independents, també ho són, per a tot real t, les variables aleatòries \mathrm{e}^{i\, t\, X} i \mathrm{e}^{i\, t\, Y} ; per tant:

\forall\, t \in \mathbb{R},\, \varphi_{X + Y}(t) = \operatorname{E}\left(\mathrm{e}^{i\, t\, X}\right) \operatorname{E}\left(\mathrm{e}^{i\, t\, Y}\right) = \varphi_X(t)\, \varphi_Y(t).

Remarca: el recíproc és fals. Existeixen variables aleatòries no independents les funcions característiques de les quals compleixen aquesta relació. Heus aquí un exemple ben conegut: donada una variable aleatòria X amb distribució de Cauchy simètrica \mathcal{C}(0,\, \gamma) :

\forall\, t \in \mathbb{R},\, \varphi_{X + X}(t) = \varphi_{2 X}(t) = \varphi_{X}(2\, t) = \mathrm{e}^{-2\, \gamma\, |\, t\, |} = \mathrm{e}^{-\gamma\, |\, t\, |}\, \mathrm{e}^{-\gamma\, |\, t\, |} = \varphi_X(t)\, \varphi_X(t)

Però és clar que X i X no són independents.

Generalització[modifica | modifica el codi]

Donades n variables aleatòries reals independents X_1,\, X_2,\, \dots, X_n (definides sobre el mateix espai de probabilitat), es compleix la relació següent:

\forall\, t \in \mathbb{R},\, \varphi_{X_1 +\, \cdots\, + X_n}(t) = \prod_{k = 1}^n\varphi_{X_k}(t)
(per consegüent, el producte de funcions característiques també és una funció característica).

Se sap que la transformada de Fourier d'un producte de convolució és el producte ordinari de les transformades de Fourier.

Tenint en compte el teorema d'unicitat, la relació precedent s'interpreta així: si les variables aleatòries X_1,\, X_2,\, \dots, X_n són independents, aleshores:

\mathbb{P}_{X_1 +\, \cdots\, + X_n} = \mathbb{P}_{X_1} \star \cdots \star \mathbb{P}_{X_n} : la distribució de probabilitat de la suma és el producte de convolució de les distribucions dels termes.

Per determinar la distribució de la suma, els dos punts de vista (producte de convolució de les distribucions de probabilitat, producte ordinari de les funcions característiques) són matemàticament equivalents. Tanmateix, el mètode de les funcions característiques és generalment més simple d'utilitzar.

Aplicació: estabilitat d'algunes distribucions de probabilitat[modifica | modifica el codi]

Siguin n variables aleatòries reals independents X_1,\, X_2,\, \dots, X_n.

  • si per a tot k, X_k segueix la distribució binomial \mathcal{B}(m_k,\, p), aleshores X_1 +\cdots + X_n segueix la distribució binomial \mathcal{B}(m_1 + \cdots + m_n,\, p)
  • si per a tot k, X_k segueix la distribució de Poisson \mathcal{P}(\lambda_k), aleshores X_1 +\cdots + X_n segueix la distribució de Poisson \mathcal{P}(\lambda_1 + \cdots + \lambda_n)
  • si per a tot k, X_k segueix la distribució normal \mathcal{N}(\mu_k,\, \sigma_k^2), aleshores X_1 +\cdots + X_n segueix la distribució normal \mathcal{N}(\mu_1 + \cdots + \mu_n,\, \sigma_1^2 + \cdots + \sigma_n^2)
  • si per a tot k, X_k segueix la distribució de Cauchy \mathcal{C}(m_k,\, \gamma_k), aleshores X_1 +\cdots + X_n segueix la distribució de Cauchy \mathcal{C}(m_1 + \cdots + m_n,\, \gamma_1 + \cdots + \gamma_n)



Funció característica i moments[modifica | modifica el codi]

Sigui una variable aleatòria real X.

Teorema directe[modifica | modifica el codi]

Si el moment d'ordre m de X existeix (finit), aleshores:

  • la funció característica \varphi_X és de classe \operatorname{C}^m en \mathbb{R}
  • \forall\, k \in \{0, \dots, m\},\, \operatorname{E}\left(X^k\right) = (-i)^k\, \varphi_X^{(k)}(0) , i per tant:
  • \forall\, t \in \mathbb{R},\,\varphi_X(t) = \left(\sum_{k = 0}^m \frac{i^k\, \operatorname{E}(X^k)}{k\,!}\, t^k\right) + t^m\, \varepsilon_m(t), on \varepsilon_m(t) \to 0\text{ quan }t\to 0 .

Recíproc (parcial)[modifica | modifica el codi]

Si \varphi_X és m vegades derivable en el punt 0, aleshores:

  • per a tot natural k tal que \ 2\, k \leq m el moment d'ordre k de X existeix i:
  • \operatorname{E}\left(X^k\right) = (-i)^k\, \varphi_X^{(k)}(0)

En particular, si \varphi_X és infinitament derivable en el punt 0, aleshores tots els moments de X existeixen.

Exemple[modifica | modifica el codi]

Si la variable aleatòria X segueix la distribució de Poisson \mathcal{P}(\lambda), la seva funció característica és infinitament derivable en \mathbb{R} : tots els moments de X existeixen. Es comprova fàcilment que:

\varphi'_X(0) = \lambda\, i\text{; }\varphi''_X(0) = -\lambda - \lambda^2.

Per tant:

\operatorname{E}(X) = -i\, \varphi'_X(0) = \lambda, \operatorname{E}(X^2) = -\varphi''_X(0) = \lambda + \lambda^2, i \operatorname{Var}(X) = \operatorname{E}(X^2) - \left[\operatorname{E}(X)\right]^2 = \lambda

(també es poden calcular directament com a sumes de sèries convergents).

Teorema de continuïtat de Lévy[modifica | modifica el codi]

Aquest teorema permet estudiar la convergència en distribució de les successions de variables aleatòries per mitjà de la convergència puntual de les seves funcions característiques.

Enunciat[modifica | modifica el codi]

Una successió \left(X_n\right)_{n\, \in\, \mathbb{N}} de variables aleatòries reals convergeix en distribució cap a una variable aleatòria real X si i només si:

\forall\, t \in \mathbb{R}, \varphi_{X_n}(t) \to \varphi(t) quan n \to +\infty, on
\varphi : \mathbb{R} \to \mathbb{C} és una funció contínua en el punt 0.

En aquest cas, \varphi és la funció característica de X.

Versió més simple[modifica | modifica el codi]

Una successió \left(X_n\right)_{n\, \in\, \mathbb{N}} de variables aleatòries reals convergeix en distribució cap a una variable aleatòria real X si i només si:

\forall\, t \in \mathbb{R}, \varphi_{X_n}(t) \to \varphi_X(t) quan n \to +\infty.

La segona versió exigeix que sigui coneguda per endavant la distribució límit.

Utilitzacions[modifica | modifica el codi]

Heus aquí unes quantes aplicacions clàssiques del teorema de continuïtat de Lévy.

Teorema del límit central[modifica | modifica el codi]

Una aplicació clàssica del teorema de continuïtat de Lévy és la prova del teorema del límit central.

Teorema de convergència de Poisson[modifica | modifica el codi]

Una segona aplicació clàssica és la prova del teorema de convergència de Poisson:

Sigui una successió real \left(\lambda_n\right)_{n\, \in\, \mathbb{N}^\ast} tal que \lim_{n \to +\infty}\lambda_n = \lambda (on \ \lambda > 0) i per a tot n, 0 \leq \lambda_n \leq n.
Si per a tot n, la variable aleatòria X_n segueix la distribució binomial \mathcal{B}\left(n,\, \frac{\lambda_n}{n}\right), aleshores la successió \left(X_n\right)_{n\, \in\, \mathbb{N}^\ast} convergeix en distribució cap a una variable aleatòria X amb distribució \mathcal{P}(\lambda).


Llei feble dels grans nombres[modifica | modifica el codi]

Una tercera aplicació clàssica és la prova de la llei feble dels grans nombres per a variables aleatòries integrables (és a dir amb esperança finita) i independents. S'enuncia així:

Donada una successió (X_n)_{\,n\, \in\, \mathbb{N}^\ast} de variables aleatòries reals (definides sobre el mateix espai de probabilitat) independents i idènticament distribuïdes (abreujadament i.i.d), amb esperança finita, es posa: \mu = \operatorname{E}(X_n).
Si es defineix per a tot n:
\overline{X_n} = \frac{X_1 + \cdots + X_n}{n} = \frac{S_n}{n}, on S_n = X_1 + \cdots + X_n,
aleshores la successió \Big(\overline{X_n}\Big)_{\,n\, \in\, \mathbb{N}^\ast} convergeix en distribució cap a la constant \mu.


Remarca: se sap que la convergència en distribució cap a una constant equival a la convergència en probabilitat cap a la mateixa constant.

Bibliografia[modifica | modifica el codi]

  • (anglès) Lukacs (Eugen) — Characteristic Functions. Griffin, London, 1960 (primera edició); 1970 (segona edició revisada i ampliada).
  • (alemany) (francès) Rényi (Alfred) — Wahrscheinlichkeitsrechnung, mit einem Anhang über Informations-theorie. — V. E. B. Deutscher Verlag der Wissenschaften, Berlin, 1962. Traducció al francès: Calcul des probabilités avec un appendice sur la théorie de l'information. Dunod, Paris, 1966.
  • (anglès) Feller (William) — An Introduction to Probability Theory and Its Applications. (vol. 2) — John Wiley & Sons, New York, 1971.

Vegeu també[modifica | modifica el codi]