Convergència de variables aleatòries

De la Viquipèdia, l'enciclopèdia lliure

En teoria de la probabilitat, l'estudi de la convergència de variables aleatòries és fonamental, tant per la seva riquesa matemàtica (lleis dels grans nombres, teorema del límit central, llei del logaritme iterat, etc.) com per les seves aplicacions a l'Estadística. En aquest article s'estudien les convergències més habituals: en distribució o llei, en probabilitat, quasi segura i en mitjana d'ordre . La referència general d'aquesta pàgina és Serfling[1] on es troben les demostracions o les referències corresponents, i nombrosos exemples i contraexemples.

Convergència en distribució o llei[modifica]

Introducció[modifica]

Des d'un punt de vista aplicat, la convergència en distribució és important perquè permet aproximar una probabilitat del tipus , relativa a una variable aleatòria , per , més senzilla de calcular, on és una altra variable aleatòria . El cas més important és el teorema central del límit, on les probabilitats relatives a una suma de variables aleatòries independents amb variància finita es poden calcular aproximadament mitjançant una variable normal. Veurem un exemple d'una altra aproximació clàssica, on la distribució de Poisson s'utilitza per aproximar una distribució binomial.

Exemple. Llencem dos daus 100 cops. Volem calcular la probabilitat d'obtenir 3 o menys vegades un doble 6 (si voleu, vegeu la pàgina variable aleatòria per la modelització i el càlcul de les probabilitats relacionades amb el llançament de dos daus). La probabilitat d'obtenir un doble 6 és 1/36 ≈0'028. Designem per la variable aleatòria que compta el nombre de vegades que obtenim un doble 6 en llançar 100 cops dos daus, que té una distribució binomial de paràmetres i : . Volem calcular  :

D'altra banda, després veurem que una distribució binomial amb gran, petita, i petita respecte a , es pot aproximar raonablement bé per una distribució de Poisson de paràmetre  ; en el nostre cas, tenim que Sigui una variable de Poisson de paràmetre , és a dir, . Aleshores,
Com veiem, (*) i (**) són és molt semblants. Però l'expressió de (**) és molt més senzilla de calcular que la de (*).

Nota. La probabilitat (**) també pot calcular-se de manera molt ràpida utilitzant la relació entre la distribució de Poisson i la distribució  :

on és una variable amb 9 graus de llibertat.

Primera definició[modifica]

Considerem una successió de variables aleatòries i sigui una altra variable aleatòria, amb funcions de distribució i respectivament. Es diu que la successió convergeix en distribució (o llei) a si

S'escriu
També s'utilitza la notació

Comentaris[modifica]

1. Atès que la propietat (1) només depèn de les funcions de distribució, els espais de probabilitat on estan definides les variables no tenen cap paper; de fet, ni cal que les variables estiguin definides en el mateix espai de probabilitat. A vegades, si la distribució del límit és d'un tipus conegut, per exemple, si és una llei normal de mitjana i variància s'escriu

Això fa que algunes propietats de la convergència en llei semblin antiintuïtives; per exemple, com comentarem més endavant, el límit no és únic, només ho és la seva distribució.

Funció de distribució d'una variable aleatòria constant igual a 0. És una funció que val 0 quan x està entre menys infinit i 0, llavors té un salt en el 0 d'alçada 1, i llavors val sempre 1.r
Figura 1. Funció de distribució d'una variable aleatòria constant igual a 0
Figura 2. Funció de distribució d'una variable aleatòria constant igual a 1/n

2. Malgrat el comentari anterior, per simplificar l'exposició, suposarem que totes les variables estan definides al mateix espai . La propietat (1) equival a que per tot punt on sigui contínua,

o, escrit d'una altra manera,
L'objectiu de la convergència en llei és donar condicions per poder aproximar les probabilitats relatives a , del tipus , per probabilitats , les quals se suposa que són més fàcils de calcular. Però demanar que per tot conjunt borelià és massa exigent, com es veu en el següent exemple. Sigui (variable degenerada en 1/n) i (variable degenerada en 0) ; sembla molt clar que hauria de convergir a , però si considerem el conjunt , tenim que
En canvi, aquesta successió sí que compleix la propietat (1). En efecte, la funció de distribució de és
i, per tant, no és contínua en Vegeu la Figura 1. D'altra banda,
Vegeu la Figura 2. Per tenim que . Per tant, .

Exemple[modifica]

Funció de distribució d'una variable uniforme en el conjunt {1/5,2/5,3/5,4/5, 1}. Es tracta d'una funció esglaonada, amb salts d'alçada 0,2 en els punts 0'2,0'4,0,6,0'8,1,
Figura 3. Funció de distribució d'una variable uniforme en el conjunt {1/5,2/5,3/5,4/5, 1}

Sigui una variable aleatòria uniforme discreta en el conjunt i una variable aleatòria uniforme contínua a l'interval [0,1]. Aleshores . En efecte, la funció de distribució de és (vegeu la Figura 3):

Equivalentment, aquesta funció es pot escriure com
on és la part entera del nombre . D'altra banda, la funció de distribució de és (vegeu la Figura 4):

Funció de distribució d'una variable uniforme en el conjunt [0,1]: es tracta d'una funció que val 0 quan la variable és menor que 0, el mateix valor que la variable entre 0 i 1, i constant igual a 1 quan la variable és més gran que 1.
Figura 4. Funció de distribució d'una variable uniforme en el conjunt [0,1]

Atès que és contínua a tot arreu, hem de veure la convergència per tot , la qual cosa es dedueix del fet que .

Una definició alternativa[modifica]

De la següent propietat s'obté una definició alternativa:

si i només si per qualsevol funció afitada i contínua

Les convergències (1) i (2) semblen molt diferents. Per veure la seva relació, notem que
on és la funció indicatriu del conjunt ; recordem que per un conjunt qualsevol ,
Però el pas de (1) a (2) no és directe ja la funció no és contínua, i llavors cal fer una aproximació a per funcions contínues.

Alguns autors prefereixen utilitzar la condició (2) per definir la convergència en distribució perquè es pot estendre directament a variables aleatòries definides en espais més generals.

Aproximació de Riemann a la integral per n=5. El gràfic consisteix en una funció contínua, juntament amb els rectangles corresponents que aproximen l'àrea a sota de la corba.
Figura 5. Aproximació de Riemann a la integral (n=5).

Continuació de l'exemple de les variables uniformes. Sigui contínua i afitada. Llavors

que convergeix a , ja que el sumatori anterior és una suma de Riemann que aproxima a la integral. Vegeu la Figura 5.

Propietats de la convergència en distribució[modifica]

1. Unicitat del límit.

2. Convergència en distribució de variables que només prenen valors naturals. [2] Si les variables i només prenen valors naturals, aleshores si i només si

3. La convergència de les funcions de densitat implica la convergència en distribució. Suposem que totes les variables involucrades tenen funció de densitat, i designem per la densitat de i per la densitat de . Si per a tot llavors .

Aquest resultat és conseqüència de l'anomenat lema de Scheffé:[3] Siguin i funcions de densitat. Si per a tot llavors


4. Composició amb una funció contínua.

5. Operacions amb successions convergents en distribució.

A. Si , llavors:
(a)
(b)
B. Teorema de Slutsky. Si i , on és una constant, aleshores,
(a)
(b)
(c) , si .

6. Vegeu més avall, a l'apartat de la convergència q.s., el teorema de representació de Skorohod.

Convergència en distribució i funcions característiques[modifica]

Les funcions característiques són una eina essencial per la convergència en llei. Els següents resultats són essencialment deguts al genial Paul Lévy.

Teorema. Designem per i les funcions característiques de i respectivament.

De fet, es té una propietat encara més forta:

Teorema.[4] Considerem una successió de variables aleatòries Designem per la funció característica de . Suposem que

on és una funció contínua en el 0. Aleshores és una funció característica i existeix una variable aleatòria amb funció característica i .

Aquest últim teorema és important perquè estableix que no necessitem conèixer per endavant el límit de la successió. D'altra banda, proporciona un mètode per construir funcions característiques o reconèixer que determinada funció és una funció característica, la qual cosa no sempre és fàcil.

Exemple. Aproximació de la distribució binomial per una distribució de Poisson. Sigui una successió de variables aleatòries tals que té una distribució binomial de paràmetre ,

amb Aleshores on té una distribució de Poisson de paràmetre .

La prova consisteix senzillament en utilitzar que la funció característica d'una binomial és

i calcular el límit tipus número e: és a dir, utilitzant que si són nombres complexos tals que , aleshores . Llavors tenim
que és, precisament, la funció característica d'una distribució de Poisson de paràmetre


Molt sovint per construir l'aproximació es pren , on . O, més general, es parteix d'una successió tal que i es pren .

Tal com hem comentat a l'exemple introductori, aquesta propietat també es formula dient una distribució binomial amb gran, petita, i petita respecte a , es pot aproximar per una distribució de Poisson de paràmetre .

Aquesta propietat és la formulació en termes de convergència en distribució de l'aproximació deguda a Poisson (1873).[5]

Cas multidimensional[modifica]

La convergència en llei de vectors aleatoris de dimensió es formula exactament igual com el cas de les variables aleatòries, ja sigui amb la definició (1) utilitzant funcions de distribució multidimensionals, o amb la (2) amb funcions afitades i contínues. L'equivalència amb la convergència de les corresponents funcions característiques també és certa. A la pràctica, però, el que més s'utilitza és el següent resultat degut a Cramer i Wold i que s'anomena <<Cramer-Wold device>>,[6] que permet reduir el cas multidimensional a l'unidimensional.

Teorema. Sigui una successió de vectors aleatoris dimensionals i sigui un altre vector aleatori de dimensió . Aleshores

si i només si tota combinació lineal de les components de convergeix en distribució a la mateixa combinació lineal de les components de .

Convergència en probabilitat[modifica]

Sigui una successió de variables aleatòries i una altra variable aleatòria definides en un espai de probabilitat . Es diu que la successió convergeix en probabilitat a si per qualsevol ,

En aquest cas, s'escriu,
o
Observacions.

  1. La condició (4) és equivalent a . Tant en aquesta condició com a (4) es poden canviar les desigualtats per desigualtats estrictes, ja que la condició ha de ser veritat per a qualsevol .
  2. En paraules, aquesta convergència diu que la probabilitat que les variables i siguin gaire diferents (diferència més gran que ) es tant petita com es vulgui quan .

Exemple. Suposem que les variables venen donades per

Vegem que : en efecte, donat qualsevol , si ,

Propietats de la convergència en probabilitat[modifica]

1. Unicitat de límit. El límit d'una successió convergent en probabilitat és únic (q.s.):

2. Propietat de Cauchy. Si aleshores la successió és de Cauchy en probabilitat, és a dir, per a qualsevol ,
Recíprocament, si una successió és de Cauchy en probabilitat, aleshores convergeix en probabilitat.


3. Composició amb una funció contínua.

4. Operacions amb successions convergents en probabilitat.
El mateix és cert per a successions i contínua.


D'aquí es dedueix:




5. Relacions amb la convergència en llei

(a) .
(b) , on és una constant.

La propietat (a) també es formula dient que la convergència en probabilitat és més forta que la convergència en distribució, o que la convergència en distribució és més feble que la convergència en probabiliat.

6. Teorema de convergència dominada (vegeu a l'apartat de convergència en mitjana una altra versió d'aquest teorema). Suposem que i sigui una variable aleatòria positiva amb tal que per a tot tenim (es diu que la successió està dominada per ). Aleshores totes les variables i tenen esperança finita i

Metrització de la convergència en probabilitat[modifica]

Recordem que es diu que dues variables aleatòries i són iguals quasi segurament (o amb probabilitat 1) si existeix un esdeveniment de probabilitat zero, , tal que per a qualsevol

S'escriu
Designem per el conjunt de totes les variables aleatòries, que és un espai vectorial. Definim la relació
Es demostra que és una relació d'equivalència i designem el conjunt quocient per . En general s'utilitza la mateixa notació per a una variable aleatòria i per a la seva classe d'equivalència, i tàcitament es tracten les classes d'equivalència com si fossin variables aleatòries; això es pot fer perquè moltes propietats només depenen de la classe d'equivalència: per exemple, si un element d'una classe té esperança finita, aleshores tots els elements de la classe tenen esperança finita, i l'esperança és la mateixa per a tots. A definim
Es comprova que és una distància:

Finalment, es demostra que

Es diu que la convergència en probabilitat és metritzable. Aquesta és una propietat important, ja que les convergències en espais mètrics tenen moltes propietats que es poden aplicar directament a la convergència en probabiitat. Atès que hem vist que les successions de Cauchy en probabilitat són convergents en probabilitat, tenim que amb la distància és un espai mètric complet.

Cas multidimensional[modifica]

Sigui una successió de vectors aleatoris dimensionals i sigui un altre vector aleatori de dimensió . Es diu que la successió convegeix en probabilitat a si per qualsevol ,

on és la norma habitual de  : si , .

Tenim la següent propietat: siguin , ,..., i . Aleshores

Convergència quasi segura[modifica]

Sigui una successió de variables aleatòries i una altra variable aleatòria definides en un espai de probabilitat . Es diu que la successió convergeix quasi segurament a si sexisteix un esdeveniment de probabilitat zero, , tal que per a qualsevol ,

S'escriu
Malgrat l'aparent simplicitat de la definició, en general és difícil provar la convergència q.s., ja que normalment es coneixen les probabilitats associades amb les variables, però no el seu valor per a cada . El següent criteri és de molta utilitat. Noteu que el criteri diu que si una successió convergeix en probabilitat de manera ràpida aleshores hi ha convergència q.s.

Criteri de convergència q.s.[modifica]

Si per qualsevol tenim

aleshores

Exemple 1. (Aquest exemple és trivial però ens ajudarà a veure la dificultat que comentavem abans.) Sigui una variable aleatòria i definim

Aleshores és evident que
Exemple 2. Sigui una successió de variables aleatòries independents, totes amb la mateixa distribució (i.i.d.), amb esperança finita. Definim
Anem a veure que
Aquest cas, però, és completament diferent que l'exemple 1, ja que ara el valor de pot canviar amb . Malgrat que la convergència a 0 sembla força intuitiva, la demostració ja no és directa i utilitzarem el criteri de convergència q.s. Per qualsevol tenim
ja que totes les variables tenen la mateixa distribució. Llavors,
on hem utilitzat que per una varible aleatòria positiva (vegeu),[7]

Propietats de la convergència q.s.[modifica]

1. Unicitat del límit. Evidentment, el límit d'una successió convergent q.s. és únic q.s.

2. Operacions amb successions que convergeixen q.s. La convergència q.s. hereta moltes de les propietats de les successions de nombres reals. Per exemple,


3. Composició amb funcions contínues. També tenim

4. Relacions entre la convergència q.s. i la convergència en probabilitat.

(a) La convergència q.s. iimplica la convergència en probabilitat:

Es diu que la convergència q.s. és més forta que la convergència en probabilitat, o que la convergència en probabilitat és més feble que la convergència q.s. Com a conseqüència de les propetats de la convergència en probabilitat, es té que la convergència q.s. també és més forta que la convergència en distribució.

(b) Si , aleshores existeix una successió parcial tal que

5. Teorema de convergència dominada (vegeu a l'apartat de convergència en mitjana una altra versió d'aquest teorema). El teorema de convergència dominada també és veritat si tenim convergència q.s. Suposem que i sigui una variable aleatòria positiva amb tal que per a tot tenim . Aleshores totes les variables i tenen esperança finita i

6. Teorema de representació de Skorohod. Suposem que . Aleshores existeix un espai de probabilitat , una succesó de variables aleatòries i una variable aleatòria , definides en aquest espai, tals que:

  1. Per a , i tenen la mateixa distribució.
  2. i tenen la mateixa distribució.

Convergència en mitjana d'ordre p[modifica]

Considerem un nombre real i sigui una successió de variables aleatòries i una altra variable aleatòria definides en un espai de probabilitat , totes les variables amb moment d'ordre , és a dir, i . Direm que la successió convergeix a en mitjana d'ordre o en si

En aquest cas s'escriu
o bé
Quan s'anomena convegència en mitjana i convergència en mitjana quadràtica.

Propietats de la convergència en mitjana d'ordre [modifica]

1. Unicitat del límit. El límit d'una successió convergent en mitjana d'ordre és únic q.s.

2. Si , i , llavors .

3. Convergència dels moments. Si , llavors

En particular, aplicant les propietats 2 i 3, si , tenim que

4. Operacions amb successions.

(a)
(b)
(c) Més generalment,[8] si i , aleshores

(d) Si les variables i són independents de les variables i , aleshores

5. Propietat de Cauchy. Si , aleshores la successió és de Cauchy en mitjana d'ordre :
Recíprocament, tota successió de Cauchy en mitjana d'ordre convergeix en mitjana d'ordre .


6. La convergència en mitjana d'ordre implica la convergència en probabilitat:

7. Teorema de convergència dominada. Suposem que o i sigui una variable aleatòria positiva amb tal que per a tot tenim , aleshores .

Espais [modifica]

Els espais corresponents a un espai de probabilitat són un cas particular dels espais associats a un espai de mesura general, i aquí ens limitarem a comentar les propietats relacionades amb la convergència de variables aleatòries. Designarem per el conjunt de les variables aleatòries amb moment d'ordre . Es tracta d'un espai vectorial. A l'igual com hem fet en l'apartat de la convergència en probabilitat, considerem la relació d'equivalència

i designem per el conjunt quocient.

Quan , definim
que és una distància a .


Quan tenim que
és una norma en i

defineix una distància en aquest espai:

En ambdós casos tenim que
La propietat de Cauchy que hem esmentant abans implica que els espais mètrics són complets. A més, quan és un espai de Banach.


El cas mereix atenció especial, ja que es pot definir un producte escalar:
Aleshores és un espai de Hilbert.

Quadre de les implicacions entre els diversos tipus de convergència[modifica]

Resum de les relacions entre els diversos tipus de convergències de variables aleatòries
Resum de les relacions entre els diversos tipus de convergències de variables aleatòries

Referències[modifica]

  1. Serfling, Robert J.. Approximation theorems of mathematical statistics. Nova York: Wiley, 1980. ISBN 0-471-02403-1. 
  2. Hoffmann-Jørgensen, J. Probability with a view toward statistics. New York, NY: Chapman & Hall, ©1994-, p. 374. ISBN 0-412-05221-0. 
  3. Serfling, Robert J. Approximation theorems of mathematical statistics. Nova York: Wiley, 2002, p. 17. ISBN 0-471-21927-4. 
  4. Billingsley, Patrick.. Probability and measure. 2a edició. Nova York: Wiley, 1986, p. 360. ISBN 0-471-80478-9. 
  5. Johnson, N. L., Kotz, S, Kemp, A. W.. Univariate discrete distributions.. 2nd ed.. Nova York: Wiley, 1992, p. 151. ISBN 0-471-54897-9. 
  6. Billingsley, Patrick.. Convergence of probability measures.. New York,: Wiley, [1968], p. 48. ISBN 0-471-07242-7. 
  7. Chung,, Kai Lai. A course in probability theory. 3a edició. San Diego: Academic Press, 2001, p. 45. ISBN 978-0-08-052298-2. 
  8. Chung,, Kai Lai. A course in probability theory. 3a edició. San Diego: Academic Press, 2001, p. 74. ISBN 978-0-08-052298-2.