Distribució multinomialParàmetres | nombre de repeticions, , amb , probabilitats dels diferents resultats |
---|
Suport | , amb  |
---|
Mitjana |  |
---|
Variància | 
 |
---|
Entropia |  |
---|
FGM |  |
---|
FC |  |
---|
FGP |  |
---|
En probabilitat i estadística la distribució multinomial és una extensió de la distribució binomial quan en un experiment aleatori hi ha més de dos resultats possibles. Concretament, fem
repeticions d'un experiment que té
resultats diferents possibles i comptem el nombre de vegades que es produeix cadascun dels resultats possibles. Entre les nombroses aplicacions d'aquesta distribució en Estadística destaca el test de Pearson de la
.
Considerem un experiment aleatori que pot tenir
resultats diferents, que designarem per
, mútuament excloents, amb probabilitats respectives
tals que
. Fem
repeticions independents i denotem per
el nombre de vegades que obtenim el resultat
, per
el nombre de vegades que obtenim el resultat
, i així successivament. Aleshores la probabilitat d'obtenir
vegades el resultat
,
vegades el resultat
, etc., amb
, és

Cal recordar que a l'expressió de l'esquerra, les
comes indiquen interseccions
, així,

Es diu que el vecto
r 
segueix una
distribució multinomial de paràmetres

, i s'escriu

. Cal notar que cada component

té una
distribució binomial de paràmetres

i

,

. De fet, una distribució multinomial és una extensió de la distribució binomial quan hi ha més de dos resultats possibles.
Exemple. Tenim una urna amb 4 boles blanques, 3 vermelles i 3 grogues. Traiem
boles amb reemplaçament, és a dir, traiem una bola, anotem el color, la retornem a l'urna, en traiem una altra, la retornem, i així successivament fins que hem tret quatre boles. Designem per:
: nombre de boles blanques que traiem.
: nombre de boles vermelles que traiem.
: el nombre de boles grogues que traiem.
Tenim que
,
i
. Llavors, la probabilitat de treure 1 bola blanca, 1 vermella i 2 grogues és

Coeficients multinomials. Recordem que

s'anomena
coeficient multinomial.
[3] Aquest coeficient intervé en generalització de la fórmula del binomi de Newton quan hi ha més de dos sumands:

on la suma es fa sobre totes les

-
ples 
tals que

. La fórmula (*) intervé a l'estudi de moltes propietats d'aquesta distribució.
Comentari sobre la nomenclatura. Atès que
i que els paràmetres són redundants, ja que
, alguns autors, per exemple Wilks,[4] proposen una notació alternativa: diuen que un vector
segueix una distribució multinomial de paràmetres
, on
, si la funció de probabilitat és

on

. Seber,
[5] quan

, diu que és la forma singular de la distribució multinomial , mentre que si

és la formulació no singular. La notació que utilitzem en aquest article és la més habitual, però és recomanable comprovar quina definició de distribució multinomial s'està utilitzant.
Esperança, variància i covariància[modifica]
L'esperança de cada component és
![{\displaystyle E[X_{j}]=np_{j},\ j=1,\dots ,k.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d18b18ebccaf980e1125ab6fe36a0e068226ed30)
La variància és

Ambdues propietats es dedueixen del fet que

té una distribució binomial

.
Per a
, la covariància és (vegeu la demostració després de la funció característica)

D'aquí resulta que el coeficient de correlació entre

i

és

que és independent de

.
La matriu de variàncies-covariàncies és
, on

que té rang

.
Escriptura compacta de la matriu
La matriu
es pot escriure de la següent forma:

on

(en aquest article escriurem tots els vectors en fila),

és una matriu diagonal amb els elements

, i per una matriu (o vector)

, denotarem per

la seva
transposada.
Càlcul del rang de la matriu

El determinant d'aquesta matriu és zero
[6] degut fet que hi ha una relació lineal entre les variables

, concretament, que

. Per calcular el rang de la matriu utilitzarem la següent propietat: Siguin

. Aleshores

Aquesta propietat pot obtenir-se com a conseqüència de resultats generals sobre matrius amb estructura (o patró).
[7] Una demostració directe és la següent: traient factor comú

a la primera fila,

a la segona , etc., tenim que

i per inducció es demostra que

Ara s'aplica aquest resultat a la matriu

i s'obté

, tal com ja sabíem. A l'aplicar-la al seu menor

tenim

.
Funció característica i funció generatriu de moments[modifica]
La funció característica del vector
és
![{\displaystyle \varphi (t_{1},\dots ,t_{k})=E[e^{i(t_{1}X_{1}+\cdots +t_{k}X_{k})}]={\big (}p_{1}e^{it_{1}}+\cdots +p_{k}e^{it_{k}}{\big )}^{n},\ t_{1},\dots ,t_{k}\in \mathbb {R} .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b59409f6823aaea0d3293dd79474eae7163c31e2)
La funció generatriu de moments és
![{\displaystyle L(t_{1},\dots ,t_{k})==E[e^{t_{1}X_{1}+\cdots +t_{k}X_{k}}]={\big (}p_{1}e^{t_{1}}+\cdots +p_{k}e^{t_{k}}{\big )}^{n},\ t_{1},\dots ,t_{k}\in \mathbb {R} .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/330adbf23ef0a2578916612d26b45641bae97a30)
La funció generatriu de probabilitats és
![{\displaystyle G(z_{1},\dots ,z_{k})=E{\big [}z_{1}e^{X_{1}}\cdots z_{k}^{X_{k}}{\big ]}={\big (}p_{1}z_{1}+\cdots +p_{k}z_{k}),\ z_{1},\dots ,z_{k}\in \mathbb {C} .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0143a327bf8aff3b305e19432f02580b6d3a59bb)
Càlcul de la funció característica
Per a

,

on a l'última igualtat hem aplicat la fórmula (*).
Càlcul de la covariància entre dues components
Per buscar

, calculem
![{\displaystyle E[X_{1}X_{2}]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9e985f5beb951bd7a6c25ad2cb329d45fdc8daf3)
, la qual cosa es pot fer a partir de la funció característica:
[8] atès que totes les components del vector

són positives i estan afitades per

, existeixen els moments de tots els ordres i per

,

Aleshores,

d'on

D'aquí,
![{\displaystyle {\text{Cov}}(X_{1},X_{2})=E[X_{1}X_{2}]-E[X_{1}]\,E[X_{2}]=n(n-1)p_{1}p_{2}-n^{2}p_{1}p_{2}=-n\,p_{1}p_{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9bb9fc80c36bf6e6620ef4145213ccd9506e057e)
.
Caràcter reproductiu[modifica]
Siguin
i
independents. Aleshores
. Es diu que la distribució multinomial és reproductiva respecte de
.[4] També s'escriu

on

designa la convolució de probabilitats.
Prova
Aquesta propietat es deriva del fet que la funció característica de la suma de dos vectors aleatoris independents és igual al producte de les funcions característiques.
[8]
Comportament asimptòtic[modifica]
La distribució multinomial és asimptòticament normal[modifica]
Com a conseqüència del teorema central del límit multidimensional, si considerem una successió
,
, aleshores

on

,

és la matriu que hem introduït abans i

és una distribució normal multidimensional centrada amb matriu de variàncies covariàncies

. Normalment, aquesta propietat s'escriu en components suprimint el subíndex

de les variables

:

Prova
Considerem els vectors aleatoris

-dimensionals

, amb distribució

Aquests vectors són independents, ja que es refereixen a repeticions diferents, i tots tenen distribució

. El vector d'esperances és
![{\displaystyle E[{\boldsymbol {Y}}]={\boldsymbol {p}}=(p_{1},\dots ,p_{k})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a21e56410ff76b70a4fc0f0b657bafc7b3a75126)
i la matriu de variàncies-covariàncies

. Pel teorema central del límit multidimensional,

Per la propietat reproductiva que hem vist abans,

d'on resulta la propietat demanada.
La distribució χ² entra en escena[modifica]
Tenim la convergència:

on

és una distribució
-quadrat amb

graus de llibertat. Aquest resultat és molt important ja que en ell reposen
el test de la
de Pearson i va ser demostrar per Pearson l'any 1900.
[9][10]
Prova
Sigui

i designem per

la matriu diagonal

De (**) i del fet que la funció

és contínua,
[11] es dedueix que

on, per una matriu (o vector)

, denotem per

la seva
transposada. Notem que

i, d'altra banda, que

és una suma de normals estàndards

al quadrat, però que no són independents tal com mostra la matriu

. Però hi ha indicis per conjecturar que

tindrà una llei

. Aquesta propietat pot deduir-se de resultats generals sobre formes quadràtiques de variables normals,
[12][13] però és interessant fer-ne una demostració directa per tal de veure les sorprenents cancel·lacions que tenen lloc.. Amb aquest objectiu retornem a

. Atès que

, existeix una relació lineal entre les variables

.
[6] La relació és

ja que de la convergència (**) es dedueix
[11] que

Però

Escrivim

, on

és la matriu que hem introduït anteriorment, i considerem la matriu amb

files i

columnes
![{\displaystyle A=\color {blue}\underbrace {\!\!\!\!\!\color {black}\left({\begin{matrix}1&0&\cdots &0\\0&1&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &1\\-1&-1&\cdots &-1\end{matrix}}\right)\!\!\!\!\!} _{\displaystyle {k-1\ {\text{columnes}}}}\left.{\begin{matrix}\\[5pt]\\\\\\\\\end{matrix}}\right\}k\ {\text{files}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1c95d891b3373a0102b97ddb0d82a5f33905cc4a)
Tenim que

Aleshores,

Però

on l'última igualtat es comprova multiplicant la matriu del mig per

.
[14][15] D'altra banda, la matriu

és definida positiva,
[16] i llavors té una matriu arrel quadrada
[17] que designarem per

, que també és definida positiva; la notació és consistent ja que

. Llavors,

Però per les propietats de les lleis normals multidimensionals,

, on

és la matriu identitat de dimensió

. Si escrivim

finalment tindrem,

Relació amb la distribució de Poisson[modifica]
Siguin
variables independents, amb distribucions de Poisson
. Aleshores la distribució de
condicionada a
és una distribució multinomial
on
.
Prova de la
de Pearson
- ↑ Olver, F.W.J; Lozier, D.W.; Boisvert, R. F.; Clark, C.W.. NIST handbook of mathematical functions. Cambridge: Cambridge University Press, 2010, p. Fórmula 26.4.9. ISBN 978-0-521-19225-5.
- ↑ 4,0 4,1 Wilks, S. S.. Mathematical statistics. Nova York: Wiley, 1962, p. 139. ISBN 0-471-94644-3.
- ↑ Seber, G. A. F.. Statistical models for proportions and probabilities, 2013, pp. 28 i 31. ISBN 978-3-642-39041-8.
- ↑ 6,0 6,1 Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 428, item 20.3. ISBN 978-0-470-22678-0.
- ↑ Franklin A., Graybill. Matrices with applications in statistics, 1983, p. 203. ISBN 0-534-98038-4.
- ↑ 8,0 8,1 Sato, Ken-iti. Lévy processes and infinitely divisible distributions. Cambridge, U.K.: Cambridge University Press, 1999, p. 9. ISBN 0-521-55302-4.
- ↑ Pearson, Karl «On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling». Philosophical Magazine, 50, 302, 1900, pàg. 157–175. DOI: 10.1080/14786440009463897.
- ↑ Vegeu l'interessant treball de W. G. Cochran on explica de forma molt clara l'article de Pearson: Cochran, William G. «The $\chi^2$ Test of Goodness of Fit». The Annals of Mathematical Statistics, 23, 3, 1952-09, pàg. 315–345. DOI: 10.1214/aoms/1177729380. ISSN: 0003-4851.
- ↑ 11,0 11,1 Serfling, Robert J. Approximation theorems of mathematical statistics. Nova York: Wiley, 2002, p. 25. ISBN 0-471-21927-4.
- ↑ Serfling, Robert J. Approximation theorems of mathematical statistics. Nova York: Wiley, 2002, p. 130. ISBN 0-471-21927-4.
- ↑ Seber, G. A. F.. Statistical models for proportions and probabilities, 2013, p. 30-31. ISBN 978-3-642-39041-8.
- ↑ És un resultat general sobre matrius amb estructura, vegeu: Franklin A., Graybill. Matrices with applications in statistics, 1983, p. 187. ISBN 0-534-98038-4.
- ↑ tots aquests càlculs es poden simplificar escrivint de manera compacta totes les matrius, tal com hem fet abans amb la matriu
a l'apartat de Propietats
- ↑ Per definició, una matriu definida positiva és simètrica
- ↑ Totes les propietats de les matrius definides positives que utilitzem es troben a Seber, G. A. F.. A matrix handbook for statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 220-221. ISBN 978-0-470-22678-0.
Johnson, N. L.; Kotz, S.; Balakrihsnan, N. Discrete Multivariate Distributions. Nova York: Wiley, 1997. ISBN 0-471-12844-1.
Forbes, C.; Evans, M.; Hastings, N.; Peacock, B. Statistical distributions.. 4th ed.. Oxford: Wiley-Blackwell, 2010, pp.135-136. ISBN 978-0-470-62724-2.