Distància de Mahalanobis

De Viquipèdia
Dreceres ràpides: navegació, cerca

En estadística, la distància de Mahalanobis és una mesura de distància introduïda per P. C. Mahalanobis el 1936. Es basa en la correlació entre variables que tenen diferents patrons que poden ser identificats i analitzats. És útil per a determinar la similitud d'un conjunt de mostra a un altre ja conegut. Difereix de la distància euclidiana en tenir en compte les correlacions del conjunt de dades.

Formalment, la distància de Mahalanobis d'un grup de valors amb mitjana aritmètica i matriu de covariància per a un vector multivariable es defineix com:

També pot definir-se com una mesura de dissimilitud entre dos vectors aleatoris and de la mateixa distribució amb una matriu de covariància  :

Si la matriu de covariància és la matriu identitat, llavors és igual que la distància euclidiana. Si és diagonal, llavors s'anomena distància euclidiana normalitzada:

on és la desviació estàndard de al conjunt de mostra.