Quartet d'Anscombe

De la Viquipèdia, l'enciclopèdia lliure

El quartet d'Anscombe comprèn quatre conjunts de dades que tenen les mateixes propietats estadístiques (mitjana, variància, etc.), però que són evidentment diferents quan s'inspeccionen visualment les seves gràfiques.

Cada conjunt està compost per 11 punts en el pla (x,y) i van ser creats per l'estadístic F. J. Anscombe. El quartet és una demostració de la importància de realitzar una inspecció visual de les dades abans d'analitzar-les.[1]

Pels quatre conjunts de dades es compleix:

Propietat Valor
Mitjana de cadascuna de les variables x 9.0
Variància de cadascuna de les variables x 11.0
Mitjana de cadascuna de les variables y 7.5
Variància de cadascuna de les variables y 4.12
Correlació entre cadascuna de les variables x i y 0.816
Recta de regressió

El primer gràfic (a dalt a l'esquerra) mostra el que sembla una relació lineal típica, corresponent a dues variables correlacionades, cumplint amb la suposició de normalitat. El segon gràfic (a dalt a la dreta) no està distribuït normalment, tot i que s'observa una relació entre les dades, no lineal, sent en aquest cas el coeficient de correlació de Pearson irrellevant. A la tercera gràfica (a baix a l'esquerra) la distribució és lineal excepte per la presencia d'un punt que fa canviar la recta de regressió i disminuir el coeficient de correlació del valor 1 a 0.816. Finalment, la quarta gràfica (a baix a la dreta) és un altre exemple de com un valor atípic és suficient per a obtenir una correlació elevada entre dues variables fins i tot quan la relació no és lineal.

Quartet d'Anscombe
I II III IV
x y x y x y x y
10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58
8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76
13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71
9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84
11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47
14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04
6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25
4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50
12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56
7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91
5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89

Edward Tufte va usar el quartet en la primera pàgina del primer capítol del seu llibre The Visual Display of Quantitative Information, per a emfatitzar la importància de mirar les dades abans d'analitzar-les.[2]

Referències[modifica]

  1. Anscombe, F. J. «Graphs in Statistical Analysis». American Statistician, 27, 1, 1973, pàg. 17–21. DOI: 10.1080/00031305.1973.10478966. JSTOR: 2682899.
  2. Tufte, Edward R. The Visual Display of Quantitative Information. 2nd. Cheshire, CT: Graphics Press, 2001. ISBN 0-9613921-4-2.