Model de blocs estocàstics

De la Viquipèdia, l'enciclopèdia lliure
Un exemple del cas assortit per al model de blocs estocàstics.

El model de blocs estocàstics és un model generatiu per a gràfics aleatoris. Aquest model tendeix a produir gràfics que contenen comunitats, subconjunts de nodes caracteritzats per estar connectats entre si amb densitats de vores particulars. Per exemple, les vores poden ser més freqüents dins de comunitats que entre comunitats. La seva formulació matemàtica va ser introduïda per primera vegada el 1983 en el camp de les xarxes socials per Holland et al. El model de blocs estocàstics és important en l'estadística, l'aprenentatge automàtic i la ciència de xarxes, on serveix com a punt de referència útil per a la tasca de recuperar l'estructura de la comunitat en dades de gràfics.[1]

El model de blocs estocàstics pren els paràmetres següents: [2]

  • El nombre de vèrtexs;
  • una partició del conjunt de vèrtexs en subconjunts discontinus , anomenades comunitats;
  • un simètric matriu de probabilitats de vora.

El conjunt d'arestes es mostra aleatòriament de la següent manera: dos vèrtexs qualsevol i estan connectats per una aresta amb probabilitat . Un exemple de problema és: donat un gràfic amb vèrtexs, on es mostren les vores tal com es descriu, recupereu els grups .

Gran part de la literatura sobre detecció algorítmica de comunitats aborda tres tasques estadístiques: detecció, recuperació parcial i recuperació exacta.[3]

Detecció: L'objectiu dels algorismes de detecció és simplement determinar, donat un gràfic mostrat, si el gràfic té una estructura de comunitat latent. Més precisament, es podria generar un gràfic, amb alguna probabilitat prèvia coneguda, a partir d'un model de blocs estocàstics conegut i, en cas contrari, a partir d'un model Erdos-Renyi similar. La tasca algorítmica és identificar correctament quin d'aquests dos models subjacents ha generat el gràfic.[4]

Recuperació parcial: En la recuperació parcial, l'objectiu és determinar aproximadament la partició latent en comunitats, en el sentit de trobar una partició que estigui correlacionada amb la partició veritable significativament millor que una suposició aleatòria.

Recuperació exacta: En la recuperació exacta, l'objectiu és recuperar exactament la partició latent en comunitats. Les mides de la comunitat i la matriu de probabilitats poden ser conegudes o desconegudes.

Referències[modifica]

  1. Lee, Clement; Wilkinson, Darren J. «A review of stochastic block models and extensions for graph clustering» (en anglès). Applied Network Science, 4, 1, 2019-12, pàg. 1–50. DOI: 10.1007/s41109-019-0232-2. ISSN: 2364-8228.
  2. «Lecture 6: Stochastic Block Model 1» (en anglès). https://ugtcs.berkeley.edu.+[Consulta: 17 juliol 2023].
  3. Funke, Thorben; Becker, Till «Stochastic block models: A comparison of variants and inference methods» (en anglès). PLOS ONE, 14, 4, 23 d’abr. 2019, pàg. e0215296. DOI: 10.1371/journal.pone.0215296. ISSN: 1932-6203. PMC: PMC6478296. PMID: 31013290.
  4. «Lecture 7 — Stochastic Block Models and Continuous Latent Space Models» (en anglès). https://www.stat.cmu.edu.+[Consulta: 17 març 2023].