Índex de Jaccard

De la Viquipèdia, l'enciclopèdia lliure

L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització).

Definició[modifica]

Sigui un conjunt de objectes , i dues particions i del conjunt d'objectes.

Aleshores, si definim

r': correspon al nombre de parells (a,b) on a i b es troben en un mateix grup tant a la partició com a la partició .

s: correspon al nombre de parells (a,b) on a i b es troben en un mateix grup de però no de .

t: correspon al nombre de parells (a,b) on a i b es troben en grups diferents de però en canvi es troben en el mateix grup de .

l'índex de Jaccard correspon al quocient:

Vegeu també[modifica]