Prova U de Mann-Whitney
El Mann-Whitney La prova de Mann-Whitney-Wilcoxon (també anomenada prova de suma de rangs de Wilcoxon o prova de Wilcoxon-Mann-Whitney) és una prova estadística no paramètrica de la hipòtesi nul·la que els valors X i Y seleccionats aleatòriament de dues poblacions tenen la mateixa distribució.[1]
Les proves no paramètriques que s'utilitzen en dues mostres dependents són la prova del signe i la prova de Wilcoxon de rang amb signe.[2]
Supòsits i enunciat formal d'hipòtesis
[modifica]Tot i que Henry Mann i Donald Ransom Whitney[3] van desenvolupar la prova U de Mann-Whitney sota la suposició de respostes contínues amb la hipòtesi alternativa que una distribució és estocàsticament més gran que l'altra, hi ha moltes altres maneres de formular les hipòtesis nul·la i alternativa de manera que la prova U de Mann-Whitney doni una prova vàlida.[4]
Una formulació molt general és suposar que:
- Totes les observacions d'ambdós grups són independents entre si,
- Les respostes són com a mínim ordinals (és a dir, com a mínim es pot dir, de dues observacions qualssevol, quina és la més gran),
- Sota la hipòtesi nul·la H₂, les distribucions d'ambdues poblacions són idèntiques.[5]
- La hipòtesi alternativa H1 és que les distribucions no són idèntiques.
Sota la formulació general, la prova només és coherent quan es produeix el següent sota H1:
La probabilitat que una observació de la població X superi una observació de la població Y és diferent (més gran o més petita) que la probabilitat que una observació de Y superi una observació de X; és a dir, P(X > Y) ≠ P(Y > X) o P(X > Y) + 0.5 · P(X = Y) ≠ 0.5.
Sota suposicions més estrictes que la formulació general anterior, per exemple, si se suposa que les respostes són contínues i l'alternativa es restringeix a un canvi d'ubicació, és a dir, F1(x) = F2(x + δ), podem interpretar una prova U de Mann-Whitney significativa com una mostra d'una diferència en les medianes. Sota aquesta suposició de canvi d'ubicació, també podem interpretar la prova U de Mann-Whitney com una avaluació de si l'estimació de Hodges-Lehmann de la diferència en la tendència central entre les dues poblacions difereix de zero. L'estimació de Hodges-Lehmann per a aquest problema de dues mostres és la mediana de totes les possibles diferències entre una observació a la primera mostra i una observació a la segona mostra.
Altrament, si tant les dispersions com les formes de la distribució d'ambdues mostres difereixen, la prova U de Mann-Whitney falla en una prova de medianes. És possible mostrar exemples on les medianes són numèricament iguals mentre que la prova rebutja la hipòtesi nul·la amb un valor p petit.[6][7][8]
La prova U de Mann-Whitney / la prova de suma de rangs de Wilcoxon no és el mateix que la prova de rangs amb signe de Wilcoxon, tot i que ambdues no són paramètriques i impliquen la suma de rangs. La prova U de Mann-Whitney s'aplica a mostres independents. La prova de rangs amb signe de Wilcoxon s'aplica a mostres coincidents o dependents.
Estadística U
[modifica]Siguin el grup 1, una mostra iid de , i sigui el grup 2, una mostra iid de , i siguin ambdues mostres independents l'una de l'altra. L'estadística U de Mann-Whitney corresponent es defineix com el més petit de:
being the sums of the ranks in groups 1 and 2, after ranking all samples from both groups such that the smallest value obtains rank 1 and the largest rank .[9]
Càlculs
[modifica]La prova implica el càlcul d'una estadística, normalment anomenada U, la distribució de la qual sota la hipòtesi nul·la és coneguda:
- En el cas de mostres petites, la distribució es tabula
- Per a mides de mostra superiors a ~20, l'aproximació utilitzant la distribució normal és força bona.
Alternativament, la distribució nul·la es pot aproximar mitjançant proves de permutació i simulacions de Monte Carlo.
Alguns llibres tabulen estadístiques equivalents a U, com ara la suma de rangs en una de les mostres, en lloc de la mateixa U.
La prova U de Mann-Whitney s'inclou a la majoria de paquets estadístics.
També es calcula fàcilment a mà, especialment per a mostres petites.
Referències
[modifica]- ↑ «Mann-Whitney U Test: Assumptions and Example» (en anglès). [Consulta: 12 novembre 2025].
- ↑ «Mann-Whitney U test» (en anglès). [Consulta: 12 novembre 2025].
- ↑ Mann, Henry B.; Whitney, Donald R. Annals of Mathematical Statistics, 18, 1, 1947, p. 50–60. DOI: 10.1214/aoms/1177730491 [Consulta: free].
- ↑ Fay, Michael P.; Proschan, Michael A. Statistics Surveys, 4, 2010, p. 1–39. DOI: 10.1214/09-SS051. PMC: 2857732. PMID: 20414472.
- ↑ , See Table 2.1 of Pratt (1964) "Robustness of Some Procedures for the Two-Sample Location Problem." Journal of the American Statistical Association. 59 (307): 655–680. If the two distributions are normal with the same mean but different variances, then Pr[X > Y] = Pr[Y < X] but the size of the Mann–Whitney test can be larger than the nominal level. So we cannot define the null hypothesis as Pr[X > Y] = Pr[Y < X] and get a valid test.
- ↑ Divine, George W.; Norton, H. James; Barón, Anna E.; Juarez-Colunga, Elizabeth The American Statistician, 72, 3, 2018, p. 278–286. DOI: 10.1080/00031305.2017.1305291 [Consulta: free].
- ↑ Conroy, Ronán Stata Journal, 12, 2, 2012, p. 182–190. DOI: 10.1177/1536867X1201200202 [Consulta: 24 maig 2021].
- ↑ Hart, Anna BMJ, 323, 7309, 2001, p. 391–393. DOI: 10.1136/bmj.323.7309.391. PMC: 1120984. PMID: 11509435 [Consulta: free].
- ↑ Boston University (SPH), 2017