Diagrama de caixa

De Viquipèdia
Dreceres ràpides: navegació, cerca
Diagrama de caixa (Box-Plot).

Un diagrama de caixa[1] (en anglès, Box plot) és un gràfic, basat en quartils, mitjançant el qual es visualitza un conjunt de dades. Està compost per un rectangle, la "caixa", i dos braços, els "bigotis".

És un gràfic que subministra informació sobre els valors mínim i màxim, els quartils Q1, Q2 o mediana i Q3, i sobre l'existència d'observacions atípiques i la simetria de la distribució. Primer cal trobar la mitjana per després trobar els 2 quartils restants

Taula de continguts

Com expressar-ho gràficament [modifica]

                            +-----+-+    
  *           o     |-------|     | |---|
                            +-----+-+    
                                         
+---+---+---+---+---+---+---+---+---+---+---+---+
0                   5                   10      12
  • Ordenar les dades i obtenir el valor mínim, el màxim, els quartils Q1, Q2 i Q3 i el rang Inter-quartílic (RIC)
En l'exemple:
* Valor 7: és el Q1 (25% de les dades)
* Valor 8.5: és el Q2 o mitjana (el 50% de les dades)
* Valor 9: és el Q3 (75% de les dades)
* Rang interquartílic RIC (Q3-Q1) = 2
  • Per dibuixar els bigotis, les línies que s'estenen des de la caixa, cal calcular els límits superior i inferior, Li i Ls, que identifiquin les observacions atípiques.
Per aquesta raó, es calcula quan es consideren les observacions atípiques. Són aquelles inferiors a Q1-1.5 * RIC o superiors a Q3+1.5 * RIC.
En l'exemple:
* Inferior: 7-1.5 * 2 = 4
* Superior: 9+1.5 * 2 = 12
Ara es busquen els últims valors que no són atípics, que seran els extrems dels bigotis.
* En l'exemple: 5 i 10
  • Marca com a atípics totes les dades que estan fora de l'interval (Li, Ls).
En l'exemple: 0.5 i 3.5
  • A més, es poden considerar valors extremadament atípics aquells que excedeixen Q1-3 * RIC o Q3+3 * RIC.
De manera que, en l'exemple:
* Inferior: 7-3 * 2 = 1
* Superior: 9+3 * 2 = 15

Utilitat [modifica]

  • Proporcionen una visió general de la simetria de la distribució de les dades, si la mediana no és al centre del rectangle, la distribució no és simètrica.
  • Són útils per veure la presència d'observacions atípiques també anomenats outliers.

Enllaços externs [modifica]

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Diagrama de caixa Modifica l'enllaç a Wikidata

Nota [modifica]

  1. «Box plot». Cercaterm del TERMCAT. Institut d'Estudis Catalans, Generalitat de Catalunya i Consorci per a la Normalització Lingüística. [Consulta: 27 de desembre de 2012].