Mitjana

De Viquipèdia
Dreceres ràpides: navegació, cerca
Aquest article tracta sobre el concepte estadístic. Vegeu «mitjana (matemàtiques)» pel concepte matemàtic i «mitjana (desambiguació)» per altres significats.
No s'ha de confondre amb mitja.

En estadística, el concepte de mitjana té dos significats estretament relacionats:

Hi ha altres mesures estadístiques que no s'han de confondre amb mitjanes, entre elles la mediana i la moda. Altres anàlisis estadístiques simples fan servir mesures de dispersió, com ara l'amplitud, l'amplitud interquartílica o la desviació tipus.

Per una variable aleatòria de valor real X, la mitjana és l'esperança de X. Cal notar que no totes les distribucions de probabilitat tenen una mitjana definida (o variància), com per exemple la distribució de Cauchy.

Per a un conjunt de dades, la mitjana és la suma de tots els valors dividida pel nombre de valors del conjunt. La mitjana d'un conjunt de dades x1, x2, ..., xn es denota normalment com \bar{x}. Aquesta mitjana és un tipus de mitjana aritmètica. Si el conjunt de dades estigués basat en una sèrie d'observacions obtinguda pel mostreig d'una població estadística, llavors aquesta mitjana s'anomena mitjana mostral (\bar{x}) per distingir-la de la mitjana poblacional \mu o \mux). La mitjana se sol donar juntament amb la desviació tipus, ja que la primera descriu la localització central de les dades i la segona en descriu la dispersió. Una mesura alternativa de la dispersió és la desviació mitjana, que equival a la desviació absoluta mitjana de la mitjana: és menys sensible als valors extrems, però matemàticament no és tan amigable per tractar-la.

Si es pren una sèrie d'observacions com a mostra d'una població més gran (per exemple, agafant les alçades d'una mostra d'adults de la població mundial) o bé d'una distribució de probabilitat, llavors la població major es pot utilitzar per construir una "mitjana poblacional" que alhora és el valor esperat per la mostra extreta d'aquesta població. Per una població finita això seria simplement la mitjana aritmètica de la propietat en qüestió per a cada membre de la població; per una distribució de probabilitat, d'altra banda, seria la suma (o integral) sobre cada valor possible ponderat per la probabilitat d'aquest valor. És convenció universal representar la mitjana poblacional per \mu.[1] En cas d'una distribució de probabilitat discreta, la mitjana d'una variable aleatòria discreta x s'obté agafant el producte de cada valor possible de x i la seva probabilitat P(x), i afegint tots aquests valors junts, donant \mu = \sum x P(x).[2]

La mitjana mostral pot diferir de la mitjana poblacional —especialment per mostres reduïdes—, però la llei dels grans nombres dicta que, com més gran és la mostra, més probable és que la mitjana mostral serà igual a la mitjana poblacional.[3]

Les mitjanes també s'usen en camps diferents de l'estadística, com en geometria i anàlisi, per la qual cosa se n'han desenvolupat molts tipus, els quals es llisten a continuació.

Exemples de mitjanes[modifica | modifica el codi]

Mitjana aritmètica[modifica | modifica el codi]

Article principal: Mitjana aritmètica

La mitjana aritmètica és la mitjana "estàndard", i sovint se l'anomena simplement mitjana. Es calcula de la manera següent:

 \bar{x} = \frac{1}{n}\cdot \sum_{i=1}^n{x_i}

No s'ha de confondre amb la mediana. La mitjana aritmètica d'un conjunt de dades no ha de ser per força el mateix valor que el valor del mig (la mediana) ni el que apareix més cops (el mode). Les distribucions asimètriques es descriuen millor amb la mitjana que no pas amb els altres estadístics (per exemple, la distribució exponencial o la distribució de Poisson).

Per exemple, la mitjana aritmètica dels sis valors 5, 10, 13, 7, 25 i 31 és:

\frac{5+10+13+7+25+31}{6} = \frac{91}{6} \approx 15

Mitjana geomètrica[modifica | modifica el codi]

Article principal: Mitjana geomètrica

La mitjana geomètrica és una mitjana útil per conjunts de nombres positius que són interpretats segons el seu producte i no pas segons la seva suma (com és el cas de la mitjana aritmètica). Per exemple, pot servir per taxes de creixement. El càlcul és el següent:

 \bar{x} = \left ( \prod_{i=1}^n{x_i} \right ) ^\tfrac1n

Per exemple, la mitjana geomètrica dels sis valors 34, 27, 45, 55, 22 i 34 és

(34 \cdot 27 \cdot 45 \cdot 55 \cdot 22 \cdot 34)^{1/6} = 1,699,493,400^{1/6} \approx 34.545

Mitjana harmònica[modifica | modifica el codi]

Article principal: Mitjana harmònica

La mitjana harmònica és una mitjana útil per conjunts de nombres definits en relació a alguna unitat, com per exemple la velocitat (distància per unitat de temps). El seu càlcul és el següent:

 \bar{x} = n \cdot \left ( \sum_{i=1}^n \frac{1}{x_i} \right ) ^{-1}

Per exemple, la mitjana harmònica dels sis valors 34, 27, 45, 55, 22 i 34 és

\frac{6}{\frac{1}{34}+\frac{1}{27}+\frac{1}{45} + \frac{1}{55} + \frac{1}{22}+\frac{1}{34}} = \frac{60588}{1835} \approx 33.0179836

Relació entre les mitjanes aritmètica, geomètrica i harmònica[modifica | modifica el codi]

Les mitjanes aritmètica (MA), geomètrica (MG) i harmònica (MH) satisfan aquestes desigualtats:

 MA \ge MG \ge MH \,

La igualtat es produeix només quan tots els elements de la mostra donada són iguals.

Mitjanes generalitzades[modifica | modifica el codi]

Article principal: Mitjana generalitzada

La mitjana generalitzada, també coneguda com a mitjana potencial o mitjana de Hölder, és una abstracció de les mitjanes aritmètica, quadràtica, geomètrica i harmònica. Es defineix sobre un conjunt de n nombres positius xi segons:

 \bar{x}(m) = \left ( \frac{1}{n}\cdot\sum_{i=1}^n{x_i^m} \right ) ^\tfrac1m

Escollint el valor adequat pel paràmetre m s'obtenen totes les mitjanes:

m\rightarrow\infty màxim
m=2 mitjana quadràtica
m=1 mitjana aritmètica
m\rightarrow0 mitjana geomètrica
m=-1 mitjana harmònica
m\rightarrow-\infty mínim

Mitjana-ƒ generalitzada[modifica | modifica el codi]

Article principal: Mitjana-f generalitzada

Això es pot generalitzar encara més fins a la mitjana-f generalitzada:

 \bar{x} = f^{-1}\left({\frac{1}{n}\cdot\sum_{i=1}^n{f(x_i)}}\right)

I, de nou, escollint una ƒ invertible adequada donarà:

f(x) = x mitjana aritmètica
f(x) = \frac{1}{x} mitjana harmònica
f(x) = x^m mitjana potencial
f(x) = \ln x mitjana geomètrica

Mitjana aritmètica ponderada[modifica | modifica el codi]

La mitjana aritmètica ponderada s'usa si es volen combinar els valors mitjans de mostres procedents de la mateixa població amb diferents mides mostrals:

 \bar{x} = \frac{\sum_{i=1}^n{w_i \cdot x_i}}{\sum_{i=1}^n {w_i}}

Les ponderacions w_i representen els límits de la mostra parcial.

Mitjana truncada[modifica | modifica el codi]

Article principal: Mitjana truncada

De vegades un conjunt de nombres pot contenir valors molt extrems, és a dir, molt més elevats o inferiors que els altres. Normalment se sol tractar de dades errònies causades per l'error experimental. La mitjana truncada, doncs, consisteix a descartar certes parts de les dades (les parts superior i inferior, normalment la mateixa quantitat als dos extrems) i després en fer la mitjana aritmètica de les dades restants. El nombre de valors extrets s'indica pel percentatge respecte al nombre total de valors.

Mitjana interquartílica[modifica | modifica el codi]

Article principal: Mitjana interquartílica

La mitjana interquartílica és un exemple específic de mitjana truncada: és simplement la mitjana aritmètica feta després de treure la quarta part de valors per sota i per sobre.

 \bar{x} = {2 \over n} \sum_{i=(n/4)+1}^{3n/4}{x_i}

Mitjana d'una funció[modifica | modifica el codi]

En càlcul, i especialment en càlcul amb diverses variables, la mitjana d'una funció es defineix de manera general com el valor mitjà de la funció sobre el seu domini. Si només es té una variable, la mitjana d'una funció f(x) sobre un interval (a,b) es defineix per:

\bar{f}=\frac{1}{b-a}\int_a^bf(x)\,dx

Cal recordar que una propietat del valor mitjà \bar{y} de molts nombres finits y_1, y_2, \dots, y_n és que n\bar{y} = y_1 + y_2 + \cdots + y_n. En altres paraules, \bar{y} és el valor constant que, quan s'afegeix a ell mateix n vegades, és igual al resultat d'afegir els n termes de y_i. Anàlogament, una propietat del valor mitjà \bar{f} d'una funció sobre l'interval [a,b] és que \int_a^b\bar{f}\,dx = \int_a^bf(x)\,dx. En altres paraules, \bar{y} és el valor constant que, quan sintegra sobre [a,b], és igual al resultat d'integrar f(x) sobre [a,b]. Però segons el segon teorema fonamental del càlcul, la integral d'una constant \bar{f} és tan sols:

\int_a^b\bar{f}\,dx = \bar{f}x\bigr|_a^b = \bar{f}b - \bar{f}a = (b - a)\bar{f}

Vegeu també el primer teorema del valor mitjà per la integració, el qual garanteix que si f és contínua llavors existeix un punt c \in (a, b) tal que

\int_a^bf(x)\,dx = f(c)(b - a)

El punt f(c) s'anomena el valor mitjà de f(x) sobre [a,b]; s'escriu, doncs, \bar{f} = f(c), i es reordena l'equació precedent per aconseguir la definició de sobre.

Si es tenen múltiples variables, la mitjana en un veïnat d'un subespai relativament compacte U en un espai euclidià es defineix per:

\bar{f}=\frac{1}{\hbox{Vol}(U)}\int_U f

Això generalitza la mitjana aritmètica. D'altra banda, també és possible generalitzar la mitjana geomètrica per a funcions definint la mitjana geomètrica de f per

\exp\left(\frac{1}{\hbox{Vol}(U)}\int_U \log f\right)

De manera encara més general, en teoria de mesura i teoria de probabilitat els dos tipus de mitjana tenen gran importància. En aquest context, la desigualtat de Jensen estima la relació entre aquestes dues nocions diferents de la mitjana d'una funció. Finalment, cal notar que també existeixen la mitjana harmònica i la mitjana quadràtica (o valor eficaç) d'una funció.

Mitjana d'una distribució de probabilitat[modifica | modifica el codi]

Vegeu esperança matemàtica.

Mitjana d'angles[modifica | modifica el codi]

La majoria de les mitjanes més utilitzades no serveixen per quantitats circulars com angles, temps i fraccions de nombres reals. Per aquestes quantitats es necessita la mitjana de quantitats circulars.

Mitjana de Fréchet[modifica | modifica el codi]

Article principal: Mitjana de Fréchet

La mitjana de Fréchet dóna una manera per determinar el centre d'una distribució de masses en una superfície o, més generalment, en una varietat de Riemann. De manera diferent a altres mitjanes, la de Fréchet es defineix en un espai els elements del qual no han de poder necessàriament ser afegits els uns als altres o ser multiplicats per escalars. També es coneix aquesta mitjana per mitjana de Karcher.

Altres mitjanes[modifica | modifica el codi]

Propietats[modifica | modifica el codi]

Tots els tipus de mitjanes comparteixen algunes propietats. Algunes d'aquestes es llisten a continuació. Some of these properties are collected here.

Mitjana ponderada[modifica | modifica el codi]

Una mitjana ponderada M és una funció que enllaça tuples de nombres positius amb nombres positius:

M : (0,\infty)^n \to (0,\infty)

De tal manera que es mantenen les següents propietats:

Segueix:

  • Limitació: min xMx ≤ max x
  • Continuïtat:  \lim_{x\to y} M x = M y
  • Hi ha mitjanes que no són diferenciables.
  • Totes les mitjanes llistades més amunt, amb l'excepció de la majoria de les mitjanes-f generalitzades, satisfan les següents propietats:
    • Si f és bijectiva, llavors la mitjana-f generalitzada satisfà la propietat de punt fix.
    • Si f és estrictament monòtona, llavors la mitjana-f generalitzada satisfà també la propietat de monotonia.
    • En general una mitjana-f generalitzada no té homogeneïtat.

Les propietats de sobre impliquen tècniques per a construir mitjanes més complexes:

Si C, M1, ..., Mm són mitjanes ponderades i p és un nombre real positiu, llavors A i B definides per

 A x = C(M_1 x, \dots, M_m x) ,
 B x = \sqrt[p]{C(x_1^p, \dots, x_n^p)} ,

també són mitjanes ponderades.

Mitjana sense ponderar[modifica | modifica el codi]

Tal com es pot intuir, una mitjana sense ponderar equival a una mitjana ponderada amb el mateix pes per cada valor; una altra manera de dir-ho és que una ponderació homogènia permet canviar els paràmetres de ponderació sense que el resultat es vegi alterat.

Es defineix M, doncs, com una mitjana sense ponderar si és una mitjana ponderada que per cada permutació π dels pesos de ponderació el resultat és el mateix.

  • Simetria: Mx = Mx) per totes les n-tuples π i permutacions π sobre n-tuples.

De manera anàloga a les mitjanes ponderades, si C és una mitjana ponderada, M1, ..., Mm són mitjanes sense ponderar, p és un nombre real positiu, llavors A i B definides per

 A x = C(M_1 x, \dots, M_m x) ,
 B x = \sqrt[p]{M_1(x_1^p, \dots, x_n^p)} ,

també són mitjanes sense ponderar.

Mitjanes poblacionals i mostrals[modifica | modifica el codi]

La mitjana d'una població té una esperança de μ, coneguda com la mitjana poblacional. La mitjana mostral és un bon estimador estadístic de la mitjana poblacional, ja que el seu valor esperat és el mateix que la mitjana poblacional. La mitjana mostral d'una població és una variable aleatòria no constant i, conseqüentment, té la seva pròpia distribució. Per una mostra aleatòria de n observacions d'una població distribuïda normalment, la distribució de la mitjana mostral és:

\bar{x} \thicksim N\left\{\mu, \frac{\sigma^2}{n}\right\}

Sovint, com que la variància poblacional és un paràmetre desconegut, s'estima per la suma de quadrats mitjana, que canvia la distribució de la mitjana mostra d'una distribució normal a una distribució t de Student amb n − 1 graus de llibertat.

Vegeu també[modifica | modifica el codi]

Referències[modifica | modifica el codi]

  1. Underhill, L.G.; Bradfield d. (1998) Introstat, Juta and Company Ltd. ISBN 070213838X p. 181
  2. Elementary Statistics, Robert R. Johnson i Patricia J. Kuby, p. 279
  3. Schaum's Outline of Theory and Problems of Probability, Seymour Lipschutz i Marc Lipson, p. 141

Enllaços externs[modifica | modifica el codi]