Contrast d'hipòtesi

De Viquipèdia
Dreceres ràpides: navegació, cerca

Un contrast d'hipòtesi,[1] test d'hipòtesi o prova de significació és una metodologia d'inferència estadística per jutjar si una propietat que se suposa certa per a una població estadística és compatible amb l'observat en una mostra d'aquesta població. Va ser iniciada per Ronald Fisher i fonamentada posteriorment per Jerzy Neyman i Karl Pearson. Mitjançant aquesta teoria, s'aborda el problema estadístic considerant una hipòtesi determinada  H_0 \, i una hipòtesi alternativa  H_1 \, , i s'intenta dirimir quina de les dues és la hipòtesi veritable, després d'aplicar el problema estadístic a un cert nombre de experiments. Està fortament associada als errors de tipus I i de tipus II en estadística, que defineixen respectivament, la possibilitat de prendre un succés vertader com fals, o un fals com a veritable. Hi ha diversos mètodes per a desenvolupar aquest test, minimitzant els errors de tipus I i II, i trobant per tant amb una determinada potència, la hipòtesi amb més probabilitat de ser correcta. Els tipus més importants són els tests centrats, d'hipòtesis i alternativa simple, aleatoritzats... Dins dels tests no paramètrics, el més estès és probablement el test U de Mann-Whitney.

Per exemple, si se sospita que una moneda ha estat trucada perquè es produeixin més cares que creus al llançar a l'aire, es poden realitzar 30 llançaments, prenent nota del nombre de cares obtingudes. Si s'obté un valor massa alt, per exemple 25 o més, hom podria considerar que el resultat és poc compatible amb la hipòtesi que la moneda no està trucada, i conclouria que les observacions contradiuen aquesta hipòtesi. L'aplicació de càlculs probabilístics permet determinar a partir de quin valor s'ha de rebutjar la hipòtesi garantint que la probabilitat de cometre un error és un valor conegut a priori. Les hipòtesis es poden classificar en dos grups, segons:

  1. Introduïu un valor concret o un interval per als paràmetres del model.
  2. Determinen el tipus de distribució de probabilitat que ha generat les dades.

Un exemple del primer grup és la hipòtesi que la mitjana d'una variable és 10, i del segon que la distribució de probabilitat és la distribució normal.

Encara que la metodologia per a realitzar el contrast d'hipòtesi és anàloga en ambdós casos, distingir dos tipus d'hipòtesi és important, ja que molts problemes de contrast d'hipòtesi respecte a un paràmetre són, en realitat, problemes d'estimació, que tenen una resposta complementària donant un interval de confiança (o conjunt d'intervals de confiança) per a aquest paràmetre. No obstant això, les hipòtesis respecte a la forma de la distribució se solen utilitzar per validar un model estadístic per a un fenomen aleatori que s'està estudiant.

Plantejament clàssic del contrast d'hipòtesi[modifica | modifica el codi]

S'anomena hipòtesi nul·la  H_0 \, a la hipòtesi que es vol contrastar. El nom de "nul·la" indica que  H_0 \, representa la hipòtesi que mantindrem llevat que les dades indiquin la seva falsedat, i es pot entendre, per tant, en el sentit de "neutra". La hipòtesi  H_0 \, mai es considera provada, encara que pot ser rebutjada per les dades. Per exemple, la hipòtesi que dues poblacions tenen la mateixa mitjana pot ser rebutjada fàcilment quan dues difereixen molt, analitzant mostres prou grans d'ambdues poblacions, però no pot ser "demostrada" mitjançant mostreig, ja que sempre hi ha la possibilitat que les mitjanes difereixin en una quantitat  \delta prou petita perquè no pugui ser detectada, encara que la mostra sigui molt gran.

A partir d'una mostra de la població en estudi, s'extreu un estadístic (és a dir, un valor que és funció de la mostra) la distribució de probabilitat estigui relacionada amb la hipòtesi en estudi i sigui coneguda. Es pren llavors el conjunt de valors que és més improbable sota la hipòtesi com a regió de rebuig, és a dir, el conjunt de valors per al qual considerarem que, si el valor de l'estadístic obtingut entra dins d'ell, rebutjarem la hipòtesi.

La probabilitat que s'obtingui un valor del estadístic que entri a la regió de rebuig tot i ser certa la hipòtesi pot calcular. D'aquesta manera, es pot escollir aquesta regió de manera que la probabilitat de cometre aquest error sigui prou petita.

Seguint amb l'anterior exemple de la moneda trucada, la mostra de la població és el conjunt dels trenta llançaments a realitzar, l'estadístic escollit és el nombre total de cares obtingudes, i la regió de rebuig està constituïda pels números totals de cares iguals o superiors a 25. La probabilitat de cometre l'error d'admetre que la moneda està trucada tot i que no ho està és igual a la probabilitat binomial de tenir 25 "èxits" o més en una sèrie de 30 assajos de Bernoulli amb probabilitat d'"èxit" 0,5 a cada un, llavors: 0,0002, ja que la possibilitat, encara que poc probable, que la mostra ens doni més de 25 cares sense haver estat la moneda trucada.

Enfoc dels contrasts d'hipòtesis[modifica | modifica el codi]

L'enfocament actual considera sempre una hipòtesi alternativa a la hipòtesi nul·la. De manera explícita o implícita, la hipòtesi nul·la, a la qual es denota habitualment per  H_0 \, , s'enfronta a una altra hipòtesi que denominarem hipòtesi alternativa i que es denota  H_1 \, o  H_a \, . En els casos en què no s'especifica  H_1 \, de manera explícita, podem considerar que ha quedat definida implícitament com " H_0 \, és falsa".

Si per exemple es vol comprovar la hipòtesi que dues distribucions tenen la mateixa mitjana, s'està considerant implícitament com a hipòtesi alternativa "ambdues poblacions tenen diferent mitjana". Podem, però considerar casos en què  H_1 \, no és la simple negació de  H_0 \, . Suposant per exemple que se sospita que en un joc d'atzar amb un dau, aquest està trucat per obtenir 6. La hipòtesi nul·la podria ser "el dau no està trucat" que s'intenta contrastar, a partir d'una mostra de llançaments realitzats, contra la hipòtesi alternativa "el dau ha estat trucat a favor del 6". Es podrien fer altres hipòtesis, però, als efectes de l'estudi que es pretén realitzar, no es consideren rellevants.

Un test d'hipòtesi s'entén, en l'enfocament modern, com una funció de la mostra, actualment basada en un estadístic. Suposant que es té una mostra  X = \left (x_1, x_2, ... x_n \right)^t d'una població en estudi i que s'han formulat hipòtesis sobre un paràmetre  \theta relacionat amb la distribució estadística de la població. Suposem que es disposa d'un estadístic  T (X) la distribució pel que fa a  \theta ,  F_ \theta (t) \, es coneix. Suposem, també, que les hipòtesis nul·les i alternativers tenen la següent formulació:



\left \{
\begin{matrix}
H_0: \; \theta \in \Theta _0 \\
H_1: \; \theta \in \Theta _1
\end{matrix}
\right.

Un contrast, prova o test per a aquestes hipòtesis seria una funció de la mostra de la manera següent:


\phi (X)= \left \{ \begin{matrix}
1 \; \mbox{si } T(X) \in \Omega \\
0 \; \mbox{si } T(X) \notin \Omega \\
\end{matrix}
\right.

On  \phi (X) = 1 \, vol dir que hem de rebutjar la hipòtesi nul·la,  H_0 \, (acceptar  H_1 \, ) i < math> \phi (X) = 0 \, </math>, que hem d'acceptar  H_0 \, (o que no hi ha evidència estadística contra  H_0 \, ). A  \Omega s'anomena regió de rebuig. En essència, per construir el test desitjat, només cal escollir el estadístic del contrast  T (X) i la regió de rebuig  \Omega .

Es tria  \Omega de tal manera que la probabilitat que T (X) caigui en el seu interior sigui baixa quan es dóna  H_0 \, .

Errors en el contrast[modifica | modifica el codi]

Un cop realitzat el contrast d'hipòtesi, s'haurà optat per una de les dues hipòtesis,  H_0 \, o  H_1 \, , i la decisió escollida coincidirà o no amb la qual en realitat és certa. Es poden donar els quatre casos que s'exposen en el quadre:

 H_0 \, és certa  H_1 \, és certa
Es va escollir  H_0 \, No hi ha error Error de tipus II
Es va escollir  H_1 \, Error de tipus I No hi ha error

Si la probabilitat de cometre un error de tipus I està unívocament determinada, el seu valor se sol denotar per la lletra grega α, i en les mateixes condicions, es denota per β la probabilitat de cometre l'error de tipus II, és a dir:



\begin{matrix}
P(\mbox{escollir } H_1 | H_0 \mbox{ és certa} ) = \alpha \\
P(\mbox{escollir } H_0 | H_1 \mbox{ és certa} ) = \beta \end{matrix}

En aquest cas, s'anomena Potència del contrast al valor 1-β, és a dir, a la probabilitat d'escollir  H_1 \, quan aquesta és certa


 P (\mbox{escollir}H_1|H_1 \mbox{és certa}) = 1 - \beta \, .

Quan és necessari dissenyar un contrast d'hipòtesi, seria desitjable fer-ho de tal manera que les probabilitats d'ambdós tipus d'error fossin tan petites com fos possible. No obstant això, amb una mostra de mida prefixat, disminuir la probabilitat de l'error de tipus I, α, condueix a incrementar la probabilitat de l'error de tipus II, β.

Normalment, es dissenyen els contrastos de tal manera que la probabilitat α sigui el 5% (0,05), encara que de vegades es fan servir el 10% (0,1) o 1% (0,01) per a adoptar condicions més relaxades o més estrictes. El recurs per augmentar la potència del contrast, és a dir, disminuir β, probabilitat d'error de tipus II, és augmentar el grandària mostral, el que en la pràctica comporta un increment dels costos de l'estudi que es vol realitzar.

Contrast més potent[modifica | modifica el codi]

El concepte de potència ens permet valorar quina entre dos contrastos amb la mateixa probabilitat d'error de tipus I, α, és preferible. Si es tracta de contrastar dues hipòtesis senzilles sobre un paràmetre desconegut, θ, del tipus:



\left \{
 \begin{matrix}
 H_0: \theta = \theta_0 \\
 H_1: \theta = \theta_1
 \end{matrix}
\right.

Es tracta d'escollir entre tots els contrastos possibles amb α prefixat aquell que té més potència, és a dir, menor probabilitat β d'incórrer en l'error de tipus II.

En aquest cas el Lema de Neyman-Pearson garanteix l'existència d'un contrast de màxima potència i determina com construir-lo.

Contrast uniformement més potent[modifica | modifica el codi]

En el cas que les hipòtesis siguin compostes, és a dir, que no es limitin a especificar un únic possible valor del paràmetre, sinó que siguin del tipus:



\left \{
 \begin{matrix}
 H_0: \theta \in \Theta_0 \\
 H_1: \theta \in \Theta_1
 \end{matrix}
\right.

on  \Theta_0 \, i  \Theta_1 \, són conjunts de diversos possibles valors, les probabilitats α i β ja no estan unívocament determindas, sinó que prendran diferents valors segons els diferents valors possibles de θ. En aquest cas es diu que un contrast  \phi (X) \, té mida α si



 \Alpha = \max_{\theta \in \Theta_0}p_{\theta}(\phi (X) = 0)

és a dir, si la màxima probabilitat de cometre un error de tipus I quan la hipòtesi nul és certa és α. En aquestes circumstàncies, es pot considerar β com una funció de θ, ja que per a cada possible valor de θ a la hipòtesi alternativa es tindria una probabilitat diferent de cometre un error de tipus II. Es defineix llavors



 \Beta (\theta) = p_ \theta (\phi (X) = 1) \quad \forall \theta \in \Theta_1

i, la funció de potència del contrast és llavors



 \operatorname{Pot} (\theta) = 1 - \beta (\theta) \quad \forall \theta \in \Theta_1

és a dir, la probabilitat de discriminar que la hipòtesi alternativa és certa per a cada valor possible de θ dins dels valors possibles d'aquesta mateixa hipòtesi.

Es diu que un contrast és uniformement més potent de mida α quan, per tot valor  \theta \in \Theta_1 \,  \operatorname{Pot}(\theta) és major o igual que el de qualsevol altre contrast de la mateixa mida. En resum, es tracta d'un contrast que garanteix la màxima potència per a tots els valors de θ en la hipòtesi alternativa.

És clar que el cas del contrast uniformement més potent per hipòtesis compostes exigeix el compliment de condicions més exigents que en el cas del contrast més potent per hipòtesis simples. Per això, no existeix un equivalent al Lema de Neyman-Pearson per al cas general.

No obstant això, sí que hi ha moltes condicions en què es compleix determinades propietats de les distribucions de probabilitat implicades i per a certs tipus d'hipòtesis, es pot estendre el Lema per obtenir el contrast uniformement més potent de la mida que es desitgi.

Aplicacions[modifica | modifica el codi]

Els contrastos d'hipòtesis, com la inferència estadística en general, són eines d'ampli ús en la ciència en general. En particular, la moderna filosofia de la ciència desenvolupa el concepte de falsabilitat de les teories científiques basant-se en els conceptes de la inferència estadística en general i dels contrastos d'hipòtesis. En aquest context, quan es vol optar entre dues possibles teories científiques per a un mateix fenomen (dues hipòtesis) s'ha de realitzar un contrast estadístic a partir de les dades disponibles sobre el fenomen que permetin optar per una o una altra.

Les tècniques de contrast d'hipòtesi són també d'àmplia aplicació en molts altres casos, com assaigs clínics de nous medicaments, control de qualitat, enquestes, etcètera.

Vegeu també[modifica | modifica el codi]

Notes[modifica | modifica el codi]

  1. «Contrast d'hipòtesi». Cercaterm del TERMCAT. Institut d'Estudis Catalans, Generalitat de Catalunya i Consorci per a la Normalització Lingüística.

Enllaços externs[modifica | modifica el codi]