Criteri d'informació de desviació

El criteri d'informació de desviació (DIC) és una generalització de modelització jeràrquica del criteri d'informació d'Akaike (AIC). És especialment útil en problemes de selecció de models bayesians on les distribucions posteriors dels models s'han obtingut mitjançant la simulació de la cadena de Markov Monte Carlo (MCMC). DIC és una aproximació asimptòtica a mesura que la mida de la mostra es fa gran, com AIC. Només és vàlid quan la distribució posterior és aproximadament normal multivariant.^[1]

Definició[modifica]

Definiu la desviació com $D(\theta )=-2\log(p(y|\theta ))+C\,$ , on $y$ són les dades, $\theta$ són els paràmetres desconeguts del model i $p(y|\theta )$ és la funció de probabilitat. $C$ és una constant que s'anul·la en tots els càlculs que comparen models diferents, i que per tant no cal conèixer.^[2]

Hi ha dos càlculs d'ús comú per al nombre efectiu de paràmetres del model. El primer, tal com es descriu a Spiegelhalter et al. (2002, p. 587), és $p_{D}={\overline {D(\theta )}}-D({\bar {\theta }})$ , on ${\bar {\theta }}$ és l'expectativa de $\theta$ . El segon, tal com es descriu a Gelman et al. (2004, p. 182), és a dir $p_{D}=p_{V}={\frac {1}{2}}{\overline {\operatorname {var} \left(D(\theta )\right)}}$ . Com més gran sigui el nombre efectiu de paràmetres, més fàcil serà que el model s'ajusti a les dades i, per tant, cal penalitzar la desviació.

El criteri d'informació de desviació es calcula com

$\mathrm {DIC} =p_{D}+{\overline {D(\theta )}},$

o equivalentment com

$\mathrm {DIC} =D({\bar {\theta }})+2p_{D}.$

A partir d'aquesta darrera forma, la connexió amb AIC és més evident.

Motivació[modifica]

La idea és que els models amb DIC més petit s'haurien de preferir als models amb DIC més gran. Els models estan penalitzats tant pel valor de ${\bar {D}}$ , que afavoreix un bon ajust, però també (similar a AIC) pel nombre efectiu de paràmetres $p_{D}$ . Des de ${\bar {D}}$ disminuirà a mesura que augmenta el nombre de paràmetres d'un model, el $p_{D}$ El terme compensa aquest efecte afavorint models amb un nombre menor de paràmetres.^[3]

Un avantatge del DIC sobre altres criteris en el cas de la selecció de models bayesians és que el DIC es calcula fàcilment a partir de les mostres generades per una simulació de Monte Carlo de cadena de Markov. AIC requereix calcular la probabilitat al màxim $\theta$ , que no està disponible a la simulació MCMC. Però per calcular DIC, simplement calculeu ${\bar {D}}$ com la mitjana de $D(\theta )$ sobre les mostres de $\theta$ , i $D({\bar {\theta }})$ com el valor de $D$ avaluat a la mitjana de les mostres de $\theta$ . Aleshores, el DIC se segueix directament d'aquestes aproximacions. Claeskens i Hjort (2008, cap. 3.5) mostren que el DIC és l'equivalent de mostra gran a la versió natural robusta del model de l'AIC.^[4]

Referències[modifica]

↑ «[http://www.mysmu.edu/faculty/yujun/Research/DIC_Theory27.pdf Deviance Information Criterion for Model Selection: Theoretical Justification and Applications]» (en anglès). [Consulta: 11 febrer 2024].
↑ «The Deviance Information Criterion: 12 Years on» (en anglès). [Consulta: 11 febrer 2024].
↑ Wiley StatsRef: Statistics Reference Online (en anglès). 1. Wiley, 2014-09-29. DOI 10.1002/9781118445112.stat07878. ISBN 978-1-118-44511-2.
↑ «DIC» (en anglès britànic). [Consulta: 11 febrer 2024].

[1] «[http://www.mysmu.edu/faculty/yujun/Research/DIC_Theory27.pdf Deviance Information Criterion for Model Selection: Theoretical Justification and Applications]» (en anglès). [Consulta: 11 febrer 2024].

[2] «The Deviance Information Criterion: 12 Years on» (en anglès). [Consulta: 11 febrer 2024].

[3] Wiley StatsRef: Statistics Reference Online (en anglès). 1. Wiley, 2014-09-29. DOI 10.1002/9781118445112.stat07878. ISBN 978-1-118-44511-2.

[4] «DIC» (en anglès britànic). [Consulta: 11 febrer 2024].

[1]

[2]

[3]

[4]