Ponderació de probabilitat inversa

De la Viquipèdia, l'enciclopèdia lliure

La ponderació de probabilitat inversa és una tècnica estadística per calcular estadístiques estandarditzades per a una pseudopoblació diferent d'aquella en què es van recollir les dades. Els dissenys d'estudi amb una població de mostreig dispar i una població d'inferència objectiu (població objectiu) són habituals en aplicació. Pot haver-hi factors prohibitius que impedeixin als investigadors fer mostres directament de la població objectiu, com ara el cost, el temps o les preocupacions ètiques. Una solució a aquest problema és utilitzar una estratègia de disseny alternativa, per exemple, el mostreig estratificat. La ponderació, quan s'aplica correctament, pot millorar potencialment l'eficiència i reduir el biaix dels estimadors no ponderats.[1]

Un estimador ponderat molt primerenc és l'estimador de la mitjana de Horvitz–Thompson.[2] Quan es coneix la probabilitat de mostreig, de la qual s'extreu la població de mostreig de la població objectiu, s'utilitza la inversa d'aquesta probabilitat per ponderar les observacions. Aquest enfocament s'ha generalitzat a molts aspectes de l'estadística sota diversos marcs. En particular, hi ha probabilitats ponderades, equacions d'estimació ponderades i densitats de probabilitat ponderades de les quals es deriven la majoria de les estadístiques. Aquestes aplicacions van codificar la teoria d'altres estadístiques i estimadors, com ara els models estructurals marginals, la ràtio de mortalitat estandarditzat i l'algoritme EM per a dades aproximades o agregades.[3]

La ponderació de probabilitat inversa també s'utilitza per tenir en compte les dades que falten quan els subjectes amb dades que falten no es poden incloure a l'anàlisi primària. Amb una estimació de la probabilitat de mostreig, o la probabilitat que el factor es mesuraria en una altra mesura, es pot utilitzar la ponderació de probabilitat inversa per inflar el pes dels subjectes que estan subrepresentats a causa d'un gran grau de dades que falten.[4]

Estimador ponderat de probabilitat inversa (IPWE)[modifica]

L'estimador de ponderació de probabilitat inversa es pot utilitzar per demostrar la causalitat quan l'investigador no pot dur a terme un experiment controlat però ha observat dades per modelar. Com que se suposa que el tractament no s'assigna aleatòriament, l'objectiu és estimar el resultat contrafactual o potencial si a tots els subjectes de la població se'ls assigna qualsevol tractament.

Suposem que les dades observades són iid dibuixat (independent i distribuït de manera idèntica) de la distribució desconeguda P, on

  • covariables.
  • són els dos tractaments possibles.
  • resposta.
  • No assumim que el tractament s'assigna a l'atzar.

L'objectiu és estimar el resultat potencial, , que s'observaria si se li assignés tractament al subjecte . A continuació, compareu el resultat mitjà si a tots els pacients de la població se'ls assignava algun tractament: . Volem estimar utilitzant dades observades .

Referències[modifica]

  1. «Inverse Probability Weighting» (en anglès), 04-08-2016. [Consulta: 6 octubre 2023].
  2. Horvitz, D. G.; Thompson, D. J. Journal of the American Statistical Association, 47, 260, 1952, pàg. 663–685. DOI: 10.1080/01621459.1952.10483446.
  3. Mansournia, Mohammad Ali; Altman, Douglas G. «Inverse probability weighting» (en anglès). BMJ, 352, 15-01-2016, pàg. i189. DOI: 10.1136/bmj.i189. ISSN: 1756-1833. PMID: 26773001.
  4. «An introduction to inverse probability of treatment weighting in observational research» (en anglès). [Consulta: 6 octubre 2023].