Convergència de variables aleatòries

En teoria de la probabilitat, l'estudi de la convergència de variables aleatòries és fonamental, tant per la seva riquesa matemàtica (lleis dels grans nombres, teorema del límit central, llei del logaritme iterat, etc.) com per les seves aplicacions a l'Estadística. En aquest article s'estudien les convergències més habituals: en distribució o llei, en probabilitat, quasi segura i en mitjana d'ordre $p$ . La referència general d'aquesta pàgina és Serfling^[1] on es troben les demostracions o les referències corresponents, i nombrosos exemples i contraexemples.

Convergència en distribució o llei[modifica]

Introducció[modifica]

Des d'un punt de vista aplicat, la convergència en distribució és important perquè permet aproximar una probabilitat del tipus $P(Y\in B)$ , relativa a una variable aleatòria $Y$ , per $P(X\in B)$ , més senzilla de calcular, on $X$ és una altra variable aleatòria $X$ . El cas més important és el teorema central del límit, on les probabilitats relatives a una suma de variables aleatòries independents amb variància finita es poden calcular aproximadament mitjançant una variable normal. Veurem un exemple d'una altra aproximació clàssica, on la distribució de Poisson s'utilitza per aproximar una distribució binomial.

Exemple. Llencem dos daus 100 cops. Volem calcular la probabilitat d'obtenir 3 o menys vegades un doble 6 (si voleu, vegeu la pàgina variable aleatòria per la modelització i el càlcul de les probabilitats relacionades amb el llançament de dos daus). La probabilitat d'obtenir un doble 6 és 1/36 ≈0'028. Designem per $Y$ la variable aleatòria que compta el nombre de vegades que obtenim un doble 6 en llançar 100 cops dos daus, que té una distribució binomial de paràmetres $n=100$ i $p=0'028$ : $Y\sim B(100,0'028)$ . Volem calcular $P(Y\leq 3)$ :

P(Y\leq 3)=\sum _{j=0}^{3}{\binom {100}{j}}0'028^{j}\,0'972^{100-j}\approx 0'6926.\quad (*)

D'altra banda, després veurem que una distribució binomial

B(n,p)

amb

n

gran,

p

petita, i

np

petita respecte a

n

, es pot aproximar raonablement bé per una distribució de Poisson de paràmetre

\lambda =np

; en el nostre cas, tenim que

\lambda =100\cdot 0'028=2'8.

Sigui

X

una variable de Poisson de paràmetre

\lambda =2'8

, és a dir,

X\sim Poiss(2'8)

. Aleshores,

P(Y\leq 3)\approx P(X\leq 3)=\sum _{j=0}^{3}e^{-2'8}\,{\frac {2'8^{j}}{j!}}=e^{-2'8}\,\sum _{j=0}^{2}{\frac {2'8^{j}}{j!}}=0'6919.\qquad (**)

Com veiem, (*) i (**) són és molt semblants. Però l'expressió de (**) és molt més senzilla de calcular que la de (*).

Nota. La probabilitat (**) també pot calcular-se de manera molt ràpida utilitzant la relació entre la distribució de Poisson i la distribució $\chi ^{2}$ :

P(X\leq 3)=P(\chi _{2(3+1)}^{2}>2\cdot 2'8)=P(\chi _{8}^{2}>5'6)=0'6919,

on

\chi _{8}^{2}

és una variable

\chi ^{2}

amb 9 graus de llibertat.

Primera definició[modifica]

Considerem una successió de variables aleatòries $X_{1},X_{2},\dots$ i sigui $X$ una altra variable aleatòria, amb funcions de distribució $F_{1},F_{2},\dots$ i $F$ respectivament. Es diu que la successió convergeix en distribució (o llei) a $X$ si

\lim _{n\to \infty }F_{n}(t)=F(t),\quad {\text{en tot punt}}\ t\ {\text{on}}\ F\ {\text{és contínua}}.\qquad (1)

S'escriu

\lim _{n\to \infty }X_{n}=X,\ {\text{en distribució (o en llei)}}.

També s'utilitza la notació

X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{\mathcal {D}}} X\quad {\text{o}}\quad X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X,\ {\text{o expressions similars.}}

Comentaris[modifica]

1. Atès que la propietat (1) només depèn de les funcions de distribució, els espais de probabilitat on estan definides les variables no tenen cap paper; de fet, ni cal que les variables estiguin definides en el mateix espai de probabilitat. A vegades, si la distribució del límit és d'un tipus conegut, per exemple, si és una llei normal de mitjana $\mu$ i variància $\sigma ^{2}$ s'escriu

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} {\mathcal {N}}(\mu ,\sigma ^{2}).

Això fa que algunes propietats de la convergència en llei semblin antiintuïtives; per exemple, com comentarem més endavant, el límit no és únic, només ho és la seva distribució.

2. Malgrat el comentari anterior, per simplificar l'exposició, suposarem que totes les variables estan definides al mateix espai $(\Omega ,{\mathcal {A}},P)$ . La propietat (1) equival a que per tot punt $t$ on $F$ sigui contínua,

\lim _{n\to \infty }P(X_{n}\leq t)=P(X\leq t),

o, escrit d'una altra manera,

\lim _{n\to \infty }P{\big (}X_{n}\in (-\infty ,t]{\big )}=P{\big (}X\in (-\infty ,t]{\big )}.

L'objectiu de la convergència en llei és donar condicions per poder aproximar les probabilitats relatives a

X_{n}

, del tipus

P(X_{n}\in B)

, per probabilitats

P(X\in B)

, les quals se suposa que són més fàcils de calcular. Però demanar que

\lim _{n}P(X_{n}\in B)=P(X\in B)

per tot conjunt borelià

B

és massa exigent, com es veu en el següent exemple. Sigui

X_{n}=1/n

(variable degenerada en 1/n) i

X=0

(variable degenerada en 0) ; sembla molt clar que

X_{n}

hauria de convergir a

X

, però si considerem el conjunt

B=\{0\}

, tenim que

{\text{per tot}}\ n\geq 1,P(X_{n}\in B)=0,\ {\text{però}}\ P(X\in B)=1.

En canvi, aquesta successió sí que compleix la propietat (1). En efecte, la funció de distribució de

F

és

F(t)={\begin{cases}0,&{\text{si}}\ t<0,\\1,&{\text{si}}\ t\geq 0.\end{cases}}

i, per tant,

F

no és contínua en

t=0

Vegeu la Figura 1. D'altra banda,

F_{n}(t)={\begin{cases}0,&{\text{si}}\ t<{\frac {1}{n}},\\1,&{\text{si}}\ t\geq {\frac {1}{n}}.\end{cases}}

Vegeu la Figura 2. Per

t\neq 0

tenim que

\lim _{n}F_{n}(t)=F(t)

. Per tant,

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X

.

Exemple[modifica]

Sigui $X_{n}$ una variable aleatòria uniforme discreta en el conjunt $\{{\tfrac {1}{n}},{\tfrac {2}{n}},\dots ,{\tfrac {n-1}{n}},1\}$ i $X$ una variable aleatòria uniforme contínua a l'interval [0,1]. Aleshores $X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X$ . En efecte, la funció de distribució de $X_{n}$ és (vegeu la Figura 3):

F_{n}(t)={\begin{cases}0,&{\text{si}}\ t<{\frac {1}{n}},\\[8pt]{\frac {1}{n}},&{\text{si}}\ t\in [{\frac {1}{n}},{\frac {2}{n}}),\\[8pt]{\frac {2}{n}},&{\text{si}}\ t\in [{\frac {2}{n}},{\frac {3}{n}}),\\[8pt]\ \vdots &\\{\frac {n-1}{n}},&{\text{si}}\ t\in [{\frac {n-1}{n}},1),\\[8pt]1,&{\text{si}}\ t\geq 1.\end{cases}}

Equivalentment, aquesta funció es pot escriure com

F_{n}(t)={\begin{cases}0,&{\text{si}}\ t<0,\\[8pt]{\frac {[nt]}{n}},&{\text{si}}\ t\in [0,1],\\[8pt]1,&{\text{si}}\ t>1,\end{cases}}

on

[a]

és la part entera del nombre

a

. D'altra banda, la funció de distribució de

X_{n}

és (vegeu la Figura 4):

F(t)={\begin{cases}0,&{\text{si}}\ t<0,\\[8pt]t,&{\text{si}}\ t\in [0,1],\\[8pt]1,&{\text{si}}\ t>1,\end{cases}}

Atès que

F

és contínua a tot arreu, hem de veure la convergència

\lim _{n}F_{n}(t)=F(t)

per tot

t\in \mathbb {R}

, la qual cosa es dedueix del fet que

\lim _{n\to \infty }{\frac {[nt]}{n}}=t

.

Una definició alternativa[modifica]

De la següent propietat s'obté una definició alternativa:

$X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X$ si i només si per qualsevol funció $f:\mathbb {R} \longrightarrow \mathbb {R}$ afitada i contínua

\lim _{n\to \infty }E[f(X_{n})]=E[f(X)].\qquad (2)

Les convergències (1) i (2) semblen molt diferents. Per veure la seva relació, notem que

F_{n}(t)=P(X\leq t)=E{\big [}{\boldsymbol {1}}_{(-\infty ,t]}(X_{n}){\big ]}=E[f(X_{n})],

on

f(x)={\boldsymbol {1}}_{(-\infty ,t]}(x),

és la funció indicatriu del conjunt

(-\infty ,t]

; recordem que per un conjunt qualsevol

A

,

{\boldsymbol {1}}_{A}(x)={\begin{cases}1,&{\text{si}}\ x\in A,\\[5pt]0,&{\text{si}}\ x\not \in A.\end{cases}}

Però el pas de (1) a (2) no és directe ja la funció

f(x)={\boldsymbol {1}}_{(-\infty ,t]}(x)

no és contínua, i llavors cal fer una aproximació a

f

per funcions contínues.

Alguns autors prefereixen utilitzar la condició (2) per definir la convergència en distribució perquè es pot estendre directament a variables aleatòries definides en espais més generals.

Continuació de l'exemple de les variables uniformes. Sigui $f:\mathbb {R} \longrightarrow \mathbb {R}$ contínua i afitada. Llavors

E[f(X_{n})]=\sum _{i=1}^{n}{\frac {1}{n}}f{\Big (}{\frac {i}{n}}{\Big )},

que convergeix a

\int _{0}^{1}f(x)\,dx=E[f(X)]

, ja que el sumatori anterior és una suma de Riemann que aproxima a la integral. Vegeu la Figura 5.

Propietats de la convergència en distribució[modifica]

1. Unicitat del límit.

\left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X\\\\X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} Y\\\end{array}}\right\}\Longrightarrow X\quad {\text{i}}\quad Y\ {\text{tenen la mateixa distribució.}}

2. Convergència en distribució de variables que només prenen valors naturals. ^[2] Si les variables

X_{n}

i

X

només prenen valors naturals, aleshores

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X

si i només si

\lim _{n\to \infty }P(X_{n}=k)=P(X=k),\quad \forall k\in \mathbb {N} .

3. La convergència de les funcions de densitat implica la convergència en distribució. Suposem que totes les variables involucrades tenen funció de densitat, i designem per $f_{n}$ la densitat de $X_{n}$ i per $f$ la densitat de $X$ . Si per a tot $x\in \mathbb {R} ,$ $\lim _{n}f_{n}(x)=f(x),$ llavors $X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X$ .

Aquest resultat és conseqüència de l'anomenat lema de Scheffé:^[3] Siguin $f_{n}$ i $f$ funcions de densitat. Si per a tot $x\in \mathbb {R} ,$ $\lim _{n}f_{n}(x)=f(x),$ llavors

\lim _{n\to \infty }\int _{-\infty }^{\infty }\vert f_{n}(x)-f(x)\vert \,dx=0.

4. Composició amb una funció contínua.

\left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X\\\\g:\mathbb {R} \longrightarrow \mathbb {R} \quad {\text{contínua}}\\\end{array}}\right\}\Longrightarrow g(X_{n})\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} g(X).

5. Operacions amb successions convergents en distribució.

A. Si

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X

, llavors:

(a)

X_{n}+a\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X+a.

(b)

a\,X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} a\,X.

B. Teorema de Slutsky. Si

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X

i

Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} b

, on

b\in \mathbb {R}

és una constant, aleshores,

(a)

X_{n}+Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X+b.

(b)

X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} b\,X.

(c)

X_{n}/Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X/b

, si

b\neq 0

.

6. Vegeu més avall, a l'apartat de la convergència q.s., el teorema de representació de Skorohod.

Convergència en distribució i funcions característiques[modifica]

Les funcions característiques són una eina essencial per la convergència en llei. Els següents resultats són essencialment deguts al genial Paul Lévy.

Teorema. Designem per $\varphi _{n}$ i $\varphi$ les funcions característiques de $X_{n}$ i $X$ respectivament.

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X\quad \Longleftrightarrow \quad \lim _{n\to \infty }\varphi (t)=\varphi (t),\ {\text{per a tot}}\ t\in \mathbb {R} .\qquad (3)

De fet, es té una propietat encara més forta:

Teorema.^[4] Considerem una successió de variables aleatòries $X_{1},X_{2},\dots$ Designem per $\varphi _{n}$ la funció característica de $X_{n}$ . Suposem que

\lim _{n\to \infty }\varphi (t)=\gamma (t),\ {\text{per a tot}}\ t\in \mathbb {R} ,

on

\gamma

és una funció contínua en el 0. Aleshores

\gamma

és una funció característica i existeix una variable aleatòria

X

amb funció característica

\gamma

i

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X

.

Aquest últim teorema és important perquè estableix que no necessitem conèixer per endavant el límit de la successió. D'altra banda, proporciona un mètode per construir funcions característiques o reconèixer que determinada funció és una funció característica, la qual cosa no sempre és fàcil.

Exemple. Aproximació de la distribució binomial per una distribució de Poisson. Sigui $X_{1},X_{2},\dots$ una successió de variables aleatòries tals que $X_{n}$ té una distribució binomial de paràmetre $p_{n}$ ,

amb $\lim _{n}n\,p_{n}=\lambda >0.$ Aleshores $X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X$ on $X$ té una distribució de Poisson de paràmetre $\lambda$ .

La prova consisteix senzillament en utilitzar que la funció característica d'una binomial $B(n,p_{n})$ és

\varphi _{n}(t)={\big (}p_{n}e^{it}+1-p_{n}{\big )}^{n}={\big (}p_{n}(e^{it}-1)+1{\big )}^{n},

i calcular el límit tipus número e: és a dir, utilitzant que si

z_{1},z_{2},\dots

són nombres complexos tals que

\lim _{n}z_{n}=z\neq 0

, aleshores

\lim _{n\to \infty }(1+z_{n}/n)^{n}=e^{z}

. Llavors tenim

\lim _{n}\varphi _{n}(t)=\lim _{n}{\big (}p_{n}(e^{it}-1)+1)^{n}=\lim _{n}{\Big (}{\frac {np_{n}(e^{it}-1)}{n}}+1{\Big )}^{n}=e^{\lambda (e^{it}-1)},

que és, precisament, la funció característica d'una distribució de Poisson de paràmetre

\lambda

Molt sovint per construir l'aproximació es pren $p_{n}=\lambda /n$ , on $\lambda >0$ . O, més general, es parteix d'una successió $\lambda _{1},\lambda _{2}\dots$ tal que $0<\lambda _{n}\leq n$ $\lim _{n}\lambda _{n}=\lambda$ i es pren $p_{n}=\lambda _{n}/n$ .

Tal com hem comentat a l'exemple introductori, aquesta propietat també es formula dient una distribució binomial $B(n,p)$ amb $n$ gran, $p$ petita, i $np$ petita respecte a $n$ , es pot aproximar per una distribució de Poisson de paràmetre $\lambda =np$ .

Aquesta propietat és la formulació en termes de convergència en distribució de l'aproximació deguda a Poisson (1873).^[5]

Cas multidimensional[modifica]

La convergència en llei de vectors aleatoris de dimensió $k$ es formula exactament igual com el cas de les variables aleatòries, ja sigui amb la definició (1) utilitzant funcions de distribució multidimensionals, o amb la (2) amb funcions $f:\mathbb {R} ^{k}\longrightarrow \mathbb {R}$ afitades i contínues. L'equivalència amb la convergència de les corresponents funcions característiques també és certa. A la pràctica, però, el que més s'utilitza és el següent resultat degut a Cramer i Wold i que s'anomena <<Cramer-Wold device>>,^[6] que permet reduir el cas multidimensional a l'unidimensional.

Teorema. Sigui ${\boldsymbol {X}}_{1},{\boldsymbol {X}}_{2},\dots$ una successió de vectors aleatoris $k$ dimensionals i sigui ${\boldsymbol {X}}$ un altre vector aleatori de dimensió $k$ . Aleshores

{\boldsymbol {X}}_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} {\boldsymbol {X}}

si i només si tota combinació lineal de les components de

{\boldsymbol {X}}_{n}

convergeix en distribució a la mateixa combinació lineal de les components de

{\boldsymbol {X}}

.

Convergència en probabilitat[modifica]

Sigui $X_{1},X_{2},\dots$ una successió de variables aleatòries i $X$ una altra variable aleatòria definides en un espai de probabilitat $(\Omega ,{\mathcal {A}},P)$ . Es diu que la successió convergeix en probabilitat a $X$ si per qualsevol $\varepsilon >0$ ,

\lim _{n\to \infty }P(\vert X_{n}-X\vert \geq \varepsilon )=0.\qquad (4)

En aquest cas, s'escriu,

\lim _{n\to \infty }X_{n}=X,\quad {\text{en probabilitat}},

o

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X.

Observacions.

La condició (4) és equivalent a $\lim _{n\to \infty }P(\vert X_{n}-X\vert <\varepsilon )=1$ . Tant en aquesta condició com a (4) es poden canviar les desigualtats per desigualtats estrictes, ja que la condició ha de ser veritat per a qualsevol $\varepsilon >0$ .
En paraules, aquesta convergència diu que la probabilitat que les variables $X_{n}$ i $X$ siguin gaire diferents (diferència més gran que $\varepsilon$ ) es tant petita com es vulgui quan $n\to \infty$ .

Exemple. Suposem que les variables $X_{n}$ venen donades per

X_{n}={\begin{cases}0,&{\text{amb probabilitat}}\ 1-{\frac {1}{n}},\\n,&{\text{amb probabilitat}}\ {\frac {1}{n}}.\end{cases}}

Vegem que

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} 0

: en efecte, donat qualsevol

\varepsilon >0

, si

n>\varepsilon

,

P(\vert X_{n}-0\vert \geq \varepsilon )=P(X_{n}=n)={\frac {1}{n}}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }} 0.

Propietats de la convergència en probabilitat[modifica]

1. Unicitat de límit. El límit d'una successió convergent en probabilitat és únic (q.s.):

\left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} Y\end{array}}\right\}\quad \Longrightarrow \quad X=Y,\ {\text{q.s.}}

2. Propietat de Cauchy. Si

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X

aleshores la successió és de Cauchy en probabilitat, és a dir, per a qualsevol

\varepsilon >0

,

\lim _{n,m\to \infty }P\{\vert X_{n}-X_{m}\vert \geq \varepsilon \}=0.

Recíprocament, si una successió és de Cauchy en probabilitat, aleshores convergeix en probabilitat.

3. Composició amb una funció contínua.

\left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\\\g:\mathbb {R} \longrightarrow \mathbb {R} \quad {\text{contínua}}\\\end{array}}\right\}\Longrightarrow g(X_{n})\mathrel {\mathop {\longrightarrow } \limits ^{P}} g(X).

4. Operacions amb successions convergents en probabilitat.

\left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} Y\\h:\mathbb {R} ^{2}\longrightarrow \mathbb {R} \quad {\text{contínua}}\end{array}}\right\}\quad \Longrightarrow \quad h(X_{n},Y_{n})\mathrel {\mathop {\longrightarrow } \limits ^{P}} h(X,Y).

El mateix és cert per a

k

successions i

h:\mathbb {R} ^{k}\longrightarrow \mathbb {R}

contínua.

D'aquí es dedueix:

\left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}+Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X+Y\quad {\text{i}}\quad X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\,Y.

5. Relacions amb la convergència en llei

(a)

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X\quad \Longrightarrow \quad X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{\mathcal {D}}} X

.

(b)

X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{\mathcal {D}}} a\quad \Longrightarrow \quad X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} a

, on

a

és una constant.

La propietat (a) també es formula dient que la convergència en probabilitat és més forta que la convergència en distribució, o que la convergència en distribució és més feble que la convergència en probabiliat.

6. Teorema de convergència dominada (vegeu a l'apartat de convergència en mitjana una altra versió d'aquest teorema). Suposem que $X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} X$ i sigui $Y$ una variable aleatòria positiva amb $E[Y]<\infty$ tal que per a tot $n$ tenim $\vert X_{n}\vert \leq Y$ (es diu que la successió està dominada per $Y$ ). Aleshores totes les variables $X_{n}$ i $X$ tenen esperança finita i

\lim _{n\to \infty }E[X_{n}]=E[X].

Metrització de la convergència en probabilitat[modifica]

Recordem que es diu que dues variables aleatòries $X$ i $Y$ són iguals quasi segurament (o amb probabilitat 1) si existeix un esdeveniment $N\in {\mathcal {A}}$ de probabilitat zero, $P(N)=0$ , tal que per a qualsevol $\omega \in N^{c}$

X(\omega )=Y(\omega ).

S'escriu

X=Y,\quad {\text{q.s.}}

Designem per

{\mathcal {L}}^{0}

el conjunt de totes les variables aleatòries, que és un espai vectorial. Definim la relació

X\sim Y\quad \Longleftrightarrow \quad X=Y,\ {\text{q.s.}}

Es demostra que és una relació d'equivalència i designem el conjunt quocient per

L^{0}

. En general s'utilitza la mateixa notació per a una variable aleatòria i per a la seva classe d'equivalència, i tàcitament es tracten les classes d'equivalència com si fossin variables aleatòries; això es pot fer perquè moltes propietats només depenen de la classe d'equivalència: per exemple, si un element d'una classe té esperança finita, aleshores tots els elements de la classe tenen esperança finita, i l'esperança és la mateixa per a tots. A

L^{0}

definim

d_{\text{Pr}}(X,Y)=E{\Big [}{\frac {\vert X-Y\vert }{1+\vert X-Y\vert }}{\Big ]}.

Es comprova que és una distància:

$d_{\text{Pr}}(X,Y)=d_{\text{Pr}}(Y,X).$
$d_{\text{Pr}}(X,Y)\geq 0\quad {\text{i}}\quad d_{\text{Pr}}(X,Y)=0\quad \Longleftrightarrow \quad X=Y.$
$d_{\text{Pr}}(X,Y)\leq d_{\text{Pr}}(X,Z)+d_{\text{Pr}}(Z,Y).$

Finalment, es demostra que

X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{P}} X\quad \Longleftrightarrow \quad \lim _{n}d_{Pr}(X_{n},X)=0.

Es diu que la convergència en probabilitat és metritzable. Aquesta és una propietat important, ja que les convergències en espais mètrics tenen moltes propietats que es poden aplicar directament a la convergència en probabiitat. Atès que hem vist que les successions de Cauchy en probabilitat són convergents en probabilitat, tenim que

L^{0}

amb la distància

d_{Pr}

és un espai mètric complet.

Cas multidimensional[modifica]

Sigui ${\boldsymbol {X}}_{1},{\boldsymbol {X}}_{2},\dots$ una successió de vectors aleatoris $k$ dimensionals i sigui ${\boldsymbol {X}}$ un altre vector aleatori de dimensió $k$ . Es diu que la successió convegeix en probabilitat a ${\boldsymbol {X}}$ si per qualsevol $\varepsilon >0$ ,

\lim _{n\to \infty }P(\Vert {\boldsymbol {X}}_{n}-{\boldsymbol {X}}\Vert \geq \varepsilon )=0,

on

\Vert \cdot \Vert

és la norma habitual de

\mathbb {R} ^{k}

: si

z=(z_{1},\dots .z_{k})\in \mathbb {R} ^{k}

,

\Vert {\boldsymbol {z}}\Vert =(\sum _{i=1}^{k}z_{i})^{1/2}

.

Tenim la següent propietat: siguin ${\boldsymbol {X}}_{1}=(X_{1}^{(1)},\dots ,X_{1}^{(k)})$ , ${\boldsymbol {X}}_{2}=(X_{2}^{(1)},\dots ,X_{2}^{(k)})$ ,..., i ${\boldsymbol {X}}=(X^{(1)},\dots ,X^{(k)})$ . Aleshores

{\boldsymbol {X}}_{n}\mathrel {\mathop {\longrightarrow } \limits ^{P}} {\boldsymbol {X}}\quad \Longleftrightarrow \quad X_{n}^{(i)}\mathrel {\mathop {\longrightarrow } \limits ^{P}} X^{(i)},\ i=1,\dots ,k.

Convergència quasi segura[modifica]

Sigui $X_{1},X_{2},\dots$ una successió de variables aleatòries i $X$ una altra variable aleatòria definides en un espai de probabilitat $(\Omega ,{\mathcal {A}},P)$ . Es diu que la successió convergeix quasi segurament a $X$ si sexisteix un esdeveniment $N\in {\mathcal {A}}$ de probabilitat zero, $P(N)=0$ , tal que per a qualsevol $\omega \in N^{c}$ ,

\lim _{n\to \infty }X_{n}(\omega )=X(\omega ).

S'escriu

\lim _{n\to \infty }X_{n}=X,\ {\text{q.s.}}\quad {\text{o}}\quad X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} X.

Malgrat l'aparent simplicitat de la definició, en general és difícil provar la convergència q.s., ja que normalment es coneixen les probabilitats associades amb les variables, però no el seu valor per a cada

\omega

. El següent criteri és de molta utilitat. Noteu que el criteri diu que si una successió convergeix en probabilitat de manera ràpida aleshores hi ha convergència q.s.

Criteri de convergència q.s.[modifica]

Si per qualsevol $\varepsilon >0$ tenim

\sum _{n}P\{\vert X_{n}-X\vert >\varepsilon \}<\infty ,

aleshores

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} X.

Exemple 1. (Aquest exemple és trivial però ens ajudarà a veure la dificultat que comentavem abans.) Sigui $Y$ una variable aleatòria i definim

X_{n}={\frac {1}{n}}\,Y.

Aleshores és evident que

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} 0.

Exemple 2. Sigui

Y_{1},\,Y_{2},\dots ,

una successió de variables aleatòries independents, totes amb la mateixa distribució (i.i.d.), amb esperança finita. Definim

X_{n}={\frac {1}{n}}\,Y_{n}.

Anem a veure que

X_{n}\mathrel {\mathop {\longrightarrow } \limits ^{q.s.}} 0.

Aquest cas, però, és completament diferent que l'exemple 1, ja que ara el valor de

Y_{n}(\omega )

pot canviar amb

n

. Malgrat que la convergència a 0 sembla força intuitiva, la demostració ja no és directa i utilitzarem el criteri de convergència q.s. Per qualsevol

\varepsilon >0

tenim

P\{\vert X_{n}-0\vert \geq \varepsilon \}=P\{\vert X_{n}\vert \geq \varepsilon \}=P\{\vert Y_{n}\vert \geq \varepsilon n\}=P{\Big \{}{\Big \vert }{\frac {Y_{1}}{\varepsilon }}{\Big \vert }\geq n{\Big \}},

ja que totes les variables

Y_{n}

tenen la mateixa distribució. Llavors,

\sum _{n=1}^{\infty }P{\Big \{}{\Big \vert }{\frac {Y_{1}}{\varepsilon }}{\Big \vert }\geq n{\Big \}}\leq E{\Big [}{\Big \vert }{\frac {Y_{1}}{\varepsilon }}{\Big \vert }{\Big ]}={\frac {1}{\varepsilon }}E[\vert Y_{1}\vert ]<\infty ,

on hem utilitzat que per una varible aleatòria positiva

Z

(vegeu),^[7]

\sum _{n=1}^{\infty }P\{Z\geq n\}\leq E[Z].

Propietats de la convergència q.s.[modifica]

1. Unicitat del límit. Evidentment, el límit d'una successió convergent q.s. és únic q.s.

2. Operacions amb successions que convergeixen q.s. La convergència q.s. hereta moltes de les propietats de les successions de nombres reals. Per exemple,

\left.{\begin{array}{l}X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X\\Y_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} Y\\\end{array}}\right\}\quad \Longrightarrow \quad X_{n}+Y_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X+Y\quad {\text{i}}\quad X_{n}\,Y_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X\,Y.

3. Composició amb funcions contínues. També tenim

\left.{\begin{array}{c}X_{n}\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} X\\\\g:\mathbb {R} \longrightarrow \mathbb {R} \quad {\text{contínua}}\\\end{array}}\right\}\Longrightarrow g(X_{n})\mathrel {\mathop {\longrightarrow } \limits _{n\to \infty }^{q.s.}} g(X).

[1] Serfling, Robert J.. Approximation theorems of mathematical statistics. Nova York: Wiley, 1980. ISBN 0-471-02403-1.

[2] Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, ©1994-, p. 374. ISBN 0-412-05221-0.

[3] Serfling, Robert J. Approximation theorems of mathematical statistics. Nova York: Wiley, 2002, p. 17. ISBN 0-471-21927-4.

[4] Billingsley, Patrick.. Probability and measure. 2a edició. Nova York: Wiley, 1986, p. 360. ISBN 0-471-80478-9.

[5] Johnson, N. L., Kotz, S, Kemp, A. W.. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 151. ISBN 0-471-54897-9.

[6] Billingsley, Patrick.. Convergence of probability measures.. New York,: Wiley, [1968], p. 48. ISBN 0-471-07242-7.

[7] Chung,, Kai Lai. A course in probability theory. 3a edició. San Diego: Academic Press, 2001, p. 45. ISBN 978-0-08-052298-2.

[8] Chung,, Kai Lai. A course in probability theory. 3a edició. San Diego: Academic Press, 2001, p. 74. ISBN 978-0-08-052298-2.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Convergència de variables aleatòries

Convergència en distribució o llei[modifica]

Introducció[modifica]

Primera definició[modifica]

Comentaris[modifica]

Exemple[modifica]

Una definició alternativa[modifica]

Propietats de la convergència en distribució[modifica]

Convergència en distribució i funcions característiques[modifica]

Cas multidimensional[modifica]

Convergència en probabilitat[modifica]

Propietats de la convergència en probabilitat[modifica]

Metrització de la convergència en probabilitat[modifica]

Cas multidimensional[modifica]

Convergència quasi segura[modifica]

Criteri de convergència q.s.[modifica]

Propietats de la convergència q.s.[modifica]

Convergència en mitjana d'ordre p[modifica]

Propietats de la convergència en mitjana d'ordre ${\boldsymbol {p}}$ [modifica]

Espais ${\boldsymbol {L^{p}}}$ [modifica]

Quadre de les implicacions entre els diversos tipus de convergència[modifica]

Referències[modifica]

Convergència en distribució o llei[modifica]

Introducció[modifica]

Primera definició[modifica]

Comentaris[modifica]

Exemple[modifica]

Una definició alternativa[modifica]

Propietats de la convergència en distribució[modifica]

Convergència en distribució i funcions característiques[modifica]

Cas multidimensional[modifica]

Convergència en probabilitat[modifica]

Propietats de la convergència en probabilitat[modifica]

Metrització de la convergència en probabilitat[modifica]

Cas multidimensional[modifica]

Convergència quasi segura[modifica]

Criteri de convergència q.s.[modifica]

Propietats de la convergència q.s.[modifica]

Convergència en mitjana d'ordre p[modifica]

Propietats de la convergència en mitjana d'ordre p {\displaystyle {\boldsymbol {p}}} [modifica]

Espais L p {\displaystyle {\boldsymbol {L^{p}}}} [modifica]

Quadre de les implicacions entre els diversos tipus de convergència[modifica]

Referències[modifica]

Propietats de la convergència en mitjana d'ordre ${\boldsymbol {p}}$ [modifica]

Espais ${\boldsymbol {L^{p}}}$ [modifica]