Vés al contingut

Descriptor de color dominant

De la Viquipèdia, l'enciclopèdia lliure

El Descriptor de Color Dominant (DCD) té com a objectiu descriure la distribució espacial dels colors representatius d'una imatge o d'una regió d'aquesta, per tal d'obtenir una alta velocitat de cerca i recuperació. A diferència dels descriptors basats en histogrames de color tradicionals, en aquest descriptor els colors representatius es calculen a partir de cada imatge, en lloc de ser fixats en l'espai de color, la qual cosa permet que la representació de color sigui precisa i compacta. Els colors d'una regió donada s'agrupen en un nombre de colors representatius. El descriptor consta dels colors representatius, els seus percentatges en una regió, coherència espacial del color, i la variació de color.

Definició[modifica]

El descriptor de color dominant es defineix com: , per i = 1,2,…,N

N és el nombre de colors dominants. Cada valor de color dominant és un vector de valors dels components corresponents d'espai de color (per exemple, un vector 3-D en l'espai model de color RGB).

El percentatge (normalitzat a un valor entre 0 i 1), és la fracció de píxels en la imatge o la imatge regió corresponent al color , on: .

La variància de color opcional descriu la variació dels valors de color dels píxels en un clúster del voltant del color representatiu corresponent. El (coherència espacial) és un únic nombre que representa l'homogeneïtat espacial general dels colors dominants en la imatge.

El nombre de colors dominants N pot variar d'imatge a imatge i es va trobar un màxim de vuit colors dominants a ser suficient per representar una imatge o una regió de la imatge. L'espai de color de quantificació depèn de les especificacions de color definit per a tota la base de dades i no necessita ser especificada amb cada descriptor.

Sintaxi binària[modifica]

La sintaxi binària del descriptor de color dominant especifica 3 bits per representar el nombre de colors dominants i 5 bits per a cadascun dels valors percentuals (de quantificació uniforme de [0,1]). Les variacions de color opcionals han estat codificats a 3 bits per color amb quantizació no uniforme. La següent taula resumeix, per exemple, la sintaxi binària del DCD:

Camps Nombre de bits Significat
Nombre de colors 3 Especificació del nombre de colors dominants
Coherència espacial 5 Valor de coherència espacial
Percentatge 5 Percentatge normalitzat associat a cada color dominant
Variànica de color 1 Variació de color de cada color dominant
Índex 1-12 Valors de color dominant

Extracció[modifica]

Utilització de l'algorisme de Lloyd per agrupar els colors en clústers (es recomana treballar en espais de color uniformes tals com CIE LUV). La distorsió del clúster i-èsim es defineix com:




On és el baricentre del clúster , és vector color del píxel , i és la coherència espacial del píxel . La representació del color dominant pot ser complementada mitjançant coherència espacial, que permet distingir si el color dominant es distribueix en la imatge com un color sòlid o com un conjunt de píxels inconnexos. La coherència espacial es calcula estudiant els veïnatges de cada un dels píxels que tinguin un color dominant, prèviament extret. Pel procés d'extracció es segueix el següent esquema:


1. Representació de tots els colors en un únic clúster i càlcul del seu baricentre (que serà el color representatiu del clúster).


2. Divisió del clúster original i càlcul dels baricentres, respectivament. El criteri a l'hora de dividir el clúster és segons la seva distorsió, els clústers amb més distorsió són els primers a dividir.


3. Es repeteix el pas 2 fins a obtenir el nombre de colors representatius desitjats o fins a obtenir un conjunt de clústers que compleixen una distorsió mínima.

Similitud coincident[modifica]

Cada regió o objecte en la base de dades està representada utilitzant el DCD. Normalment, entre 3 i 4 colors proporcionen una bona caracterització de la regió de colors. Donada una imatge de cerca, es busca en la base de dades una distribució de color semblant a la de la imatge d'entrada. Si el nombre de colors representatius és petit, podem buscar els colors per separat a la base de dades i llavors combinar els resultats. Aquesta cerca individual, es pot fer de manera eficient en l'espai de color 3-D.

Considerem dos DCD: i . Ignorant el paràmetre de la variància i de l'espai coherent, la diferència entre dos descriptors es pot calcular així:

On els subíndexs 1 i 2 en totes les variables representen els descriptors i respectivament. és el coeficient de similitud entre dos colors i .

On és la distància Euclideana entre dos colors i . és la màxima distància per a dos colors que es consideren similars i =α*. Això significa que dos colors dominants d'una única descripció estan, almenys, a una distància entre si. Una variació d'aquesta distància és utilitzar el camp de la coherència espacial. Per exemple, en els experiments del MPEG-7, es va utilitzar la següent distància: On i són les coherències espacials de la consulta (imatge entrada) i i són pesos fixes que es recomana fixar-los a 0.3 i 0.7 respectivament.

Enllaços externs[modifica]