Índex de Jaccard

De Viquipèdia
Dreceres ràpides: navegació, cerca

L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització).

Definició[modifica | modifica el codi]

Sigui un conjunt de n objectes O=\{o_1, \ldots, o_n\}, i dues particions \Pi = \{\pi_1, \ldots, \pi_r\} i \Pi'= \{\pi'_1, \ldots, \pi'_r\} del conjunt d'objectes.

Aleshores, si definim

r': correspon al nombre de parells (a,b) on a i b es troben en un mateix grup tant a la partició \Pi com a la partició \Pi'.

s: correspon al nombre de parells (a,b) on a i b es troben en un mateix grup de \Pi però no de \Pi'.

t: correspon al nombre de parells (a,b) on a i b es troben en grups diferents de \Pi però en canvi es troben en el mateix grup de \Pi'.

l'índex de Jaccard correspon al quocient:

 \frac{r}{r + s + t}