Índex de Jaccard

De Viquipèdia
Dreceres ràpides: navegació, cerca

L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització).

Definició[modifica | modifica el codi]

Sigui un conjunt de objectes , i dues particions i del conjunt d'objectes.

Aleshores, si definim

r': correspon al nombre de parells (a,b) on a i b es troben en un mateix grup tant a la partició com a la partició .

s: correspon al nombre de parells (a,b) on a i b es troben en un mateix grup de però no de .

t: correspon al nombre de parells (a,b) on a i b es troben en grups diferents de però en canvi es troben en el mateix grup de .

l'índex de Jaccard correspon al quocient: