Mètrica de Wasserstein

De la Viquipèdia, l'enciclopèdia lliure

En matemàtiques, la distància de Wasserstein o mètrica de Kantorovich - Rubinstein és una funció de distància definida entre distribucions de probabilitat en un espai mètric donat . Porta el nom de Leonid Vaseršteĭn.

Intuïtivament, si cada distribució es veu com una unitat de quantitat de terra (sòl) amuntegada , la mètrica és el "cost" mínim de convertir una pila en una altra, que se suposa que és la quantitat de terra que s'ha de moure multiplicada per la distància mitjana que s'ha de moure. Aquest problema va ser formalitzat per primera vegada per Gaspard Monge el 1781. A causa d'aquesta analogia, la mètrica es coneix en informàtica com a distància del motor terrestre.

El nom "distància de Wasserstein" va ser encunyat per RL Dobrushin l'any 1970, després d'aprendre'n en el treball de Leonid Vaseršteĭn sobre processos de Markov que descriuen grans sistemes d'autòmats [1] (rus, 1969). Tanmateix, la mètrica va ser definida per primera vegada per Leonid Kantorovich a The Mathematical Method of Production Planning and Organization [2] (original rus de 1939) en el context de la planificació òptima del transport de mercaderies i materials. Per tant, alguns estudiosos fomenten l'ús dels termes "mètrica de Kantorovich" i "distància de Kantorovich". La majoria de les publicacions en anglès utilitzen l'ortografia alemanya "Wasserstein".

Definició[modifica]

Deixar ser un espai mètric que és un espai de radó. Per , el Wasserstein -distància entre dues mesures de probabilitat i activat amb finit -moments és

Dues distribucions unidimensionals i , representats en els eixos x i y, i una possible distribució conjunta que defineix un pla de transport entre ells. El pla conjunt de distribució/transport no és únic

on és el conjunt de tots els acoblaments de i  ; es defineix per ser i correspon a una norma suprema. Un acoblament és una mesura de probabilitat conjunta sobre els marginals del qual són i en el primer i segon factors, respectivament. Això és,

Intuïció i connexió amb un transport òptim
[modifica]

Una manera d'entendre la definició anterior és considerar el problema del transport òptim. És a dir, per a una distribució de massa en un espai , volem transportar la massa de manera que es transformi en la distribució al mateix espai; transformant el "munt de terra" a la pila . Aquest problema només té sentit si la pila a crear té la mateixa massa que la pila a moure; per tant sense pèrdua de generalitat assumim que i són distribucions de probabilitat que contenen una massa total d'1. Suposem també que hi ha alguna funció de cost

que dóna el cost de transportar una unitat de massa des del punt fins al punt . Un pla de transport per moure's a es pot descriure mitjançant una funció que dóna la quantitat de massa per desplaçar-se a . Us podeu imaginar la tasca com la necessitat de moure un munt de terra de forma al forat del sòl de la forma de manera que, al final, tant la pila de terra com el forat a terra desapareixen completament.

Aplicacions[modifica]

La mètrica de Wasserstein és una manera natural de comparar les distribucions de probabilitat de dues variables X i Y, on una variable es deriva de l'altra per petites pertorbacions no uniformes (aleatòries o deterministes).

En informàtica, per exemple, la mètrica W 1 s'utilitza àmpliament per comparar distribucions discretes, per exemple, els histogrames de color de dues imatges digitals; vegeu la distància del moviment de terra per a més detalls.

En el seu article " Wasserstein GAN ", Arjovsky et al.[3] utilitzen la mètrica Wasserstein-1 com una manera de millorar el marc original de les xarxes generatives d'adversari (GAN), per alleujar el gradient de desaparició i els problemes de col·lapse del mode. El cas especial de les distribucions normals s'utilitza en una distància d'inici de Frechet.

La mètrica de Wasserstein té un vincle formal amb l'anàlisi de Procrustes, amb aplicació a mesures de quiralitat,[4] i a l'anàlisi de forma.[5]

En biologia computacional, la mètrica de Wasserstein es pot utilitzar per comparar entre diagrames de persistència de conjunts de dades de citometria.[6]

La mètrica de Wasserstein també s'ha utilitzat en problemes inversos en geofísica.[7]

La mètrica de Wasserstein s'utilitza en la teoria integrada de la informació per calcular la diferència entre conceptes i estructures conceptuals.[8]

Referències[modifica]

  1. Problemy Peredači Informacii, 5, 3, 1969, pàg. 64–72.
  2. Management Science, 6, 4, 1939, pàg. 366–422. DOI: 10.1287/mnsc.6.4.366. JSTOR: 2627082.
  3. International Conference on Machine Learning 214-223, juliol 2017, pàg. 214–223.
  4. Journal of Mathematical Physics, 43, 8, 2002, pàg. 4147–4157. Bibcode: 2002JMP....43.4147P. DOI: 10.1063/1.1484559.
  5. Journal of Mathematical Chemistry, 35, 3, 2004, pàg. 147–158. DOI: 10.1023/B:JOMC.0000033252.59423.6b.
  6. PLOS Computational Biology, 18, 3, març 2022, pàg. e1009931. arXiv: 2203.06263. Bibcode: 2022PLSCB..18E9931M. DOI: 10.1371/journal.pcbi.1009931. PMC: 9009779. PMID: 35312683.
  7. Frederick, Christina; Yang, Yunan Snapshots of Modern Mathematics from Oberwolfach, 06-05-2022. DOI: 10.14760/SNAP-2022-004-EN.
  8. Oizumi, Masafumi; Albantakis, Larissa; Tononi, Giulio PLOS Computational Biology, 10, 5, 08-05-2014, pàg. e1003588. Bibcode: 2014PLSCB..10E3588O. DOI: 10.1371/journal.pcbi.1003588. PMC: 4014402. PMID: 24811198.