Anàlisi de la supervivència: diferència entre les revisions

De la Viquipèdia, l'enciclopèdia lliure
Contingut suprimit Contingut afegit
m {{reflist|30em}}
m Correció bibliografia
Línia 91: Línia 91:
Si aquesta quantitat als 10 mesos (''F''(''t''=10 mesos)) pren el valor de 0,20, vol dir que els 10 mesos el 20% de la població ja ha mort.
Si aquesta quantitat als 10 mesos (''F''(''t''=10 mesos)) pren el valor de 0,20, vol dir que els 10 mesos el 20% de la població ja ha mort.


En [[epidemiologia]] a aquesta quantitat s'anomena [[Incidència#Probabilitat acumulada (PA) | ''probabilitat acumulada'']] o proporció d'incidència quan l'esdeveniment és la malaltia (<ref name="RothmanGreenland1998">{{citar ref | tipus = llibre | nom1 =Kenneth J | cognom1 =Rothman | nom2 =Sander | cognom2 =Greenland | títol = Modern Epidemiology| edició =2ª ed | lloc =Philadelphia | editorial =Lippincott Williams & Wilkins | data =1998}}</ref> pàg. 37) i estima el risc de desenvolupar la malaltia en els primers 10 mesos de seguiment. Sovint també s'anomena "incidència acumulada" (veure, p. ex., la figura 1 de l'article <ref name="Zhu2012"> {{citar ref | tipus = revista | nom1 =H | cognom1 =Zhu | nom2 =S | cognom2 =Napravnik | nom3 =J | cognom3 =Eron | nom4 =S | cognom4 =Cole | nom5 =Y | cognom5 =Ma | nom6 =D | cognom6 =Wohl | nom7 =Y | cognom7 =Zhang | nom8 =Z | cognom8 =Liu | nom9 =D | cognom9 =Zhao | nom10 =M | cognom10 =Cohen nom11 =F | cognom11 =Zhang | títol =Attrition among Human Immunodeficiency Virus (HIV)- Infected Patients Initiating Antiretroviral Therapy in China, 2003-2010 | publicació =PLoS One | data = 2012 | volum =7 | número =6 | pàgines =e39414 | url =http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0039414 | doi =10.1371/journal.pone.0039414}}</ref>), però aquest terme s'utilitza per una altre quantitat (<ref name="RothmanGreenland1998"></ref> pàg. 37) que és comenta mes [[Anàlisi_de_la_supervivència#Taxa_de_perill_acumulada_.28Incid.C3.A8ncia_acumulada.29|endavant]].
En [[epidemiologia]] a aquesta quantitat s'anomena [[Incidència#Probabilitat acumulada (PA) | ''probabilitat acumulada'']] o proporció d'incidència quan l'esdeveniment és la malaltia (<ref name="RothmanGreenland1998">{{citar ref | tipus = llibre | nom1 =Kenneth J | cognom1 =Rothman | nom2 =Sander | cognom2 =Greenland | títol = Modern Epidemiology| edició =2ª ed | lloc =Philadelphia | editorial =Lippincott Williams & Wilkins | data =1998}}</ref> pàg. 37) i estima el risc de desenvolupar la malaltia en els primers 10 mesos de seguiment. Sovint també s'anomena "incidència acumulada" (veure, p. ex., la figura 1 de l'article <ref name="Zhu2012"> {{citar ref | tipus = revista | nom1 =H | cognom1 =Zhu | nom2 =S | cognom2 =Napravnik | nom3 =J | cognom3 =Eron | nom4 =S | cognom4 =Cole | nom5 =Y | cognom5 =Ma | nom6 =D | cognom6 =Wohl | nom7 =Y | cognom7 =Zhang | nom8 =Z | cognom8 =Liu | nom9 =D | cognom9 =Zhao | nom10 =M | cognom10 =Cohen nom11 =F | cognom11 =Zhang | títol =Attrition among Human Immunodeficiency Virus (HIV)- Infected Patients Initiating Antiretroviral Therapy in China, 2003-2010 | publicació =PLoS One | data = 2012 | volum =7 | número =6 | pàgines =e39414 | doi =10.1371/journal.pone.0039414}}</ref>), però aquest terme s'utilitza per una altre quantitat (<ref name="RothmanGreenland1998"></ref> pàg. 37) que és comenta mes [[Anàlisi_de_la_supervivència#Taxa_de_perill_acumulada_.28Incid.C3.A8ncia_acumulada.29|endavant]].


Aquí s'ha definit ''S''(''t'') = ''Pr''(''T''> ''t''). Altres autors (p. ex., Collet <ref name="Collett1994"></ref> o JP Klein a l'Enciclopèdia de bioestadística <ref name="EncyclopediaofBiostatistics2nded"></ref>) defineixen ''S''(''t'') = ''Pr''(''T'' ≥ ''t''). Aquesta darrera definició permet simplificar algunes fórmules dels casos amb variable de supervivència discreta, però la primera fa que la relació ''S''(''t'') = 1 - ''F''(''t'') es mantingui tant en el cas discret com en el continu.<ref name="EncyclopediaofBiostatistics2nded"></ref>
Aquí s'ha definit ''S''(''t'') = ''Pr''(''T''> ''t''). Altres autors (p. ex., Collet <ref name="Collett1994"></ref> o JP Klein a l'Enciclopèdia de bioestadística <ref name="EncyclopediaofBiostatistics2nded"></ref>) defineixen ''S''(''t'') = ''Pr''(''T'' ≥ ''t''). Aquesta darrera definició permet simplificar algunes fórmules dels casos amb variable de supervivència discreta, però la primera fa que la relació ''S''(''t'') = 1 - ''F''(''t'') es mantingui tant en el cas discret com en el continu.<ref name="EncyclopediaofBiostatistics2nded"></ref>


La funció de supervivència s'utilitza molt en medicina per descriure la probabilitat de sobreviure (veure, p. ex., les figures de l'article <ref name="Celik2012"> {{citar ref | tipus = revista | nom1 =S | cognom1 = Celik | nom2 = M | cognom2 = Celik | nom3 = B | cognom3 = Aydemir | títol = Surgical properties and survival of a pericardial window via left minithoracotomy for benign and malignant pericardial tamponade in cancer patients | publicació = World J Surg Oncol | data = 2012 | volum = 10 | número = 1 | pàgines = 123 | url = http://www.wjso.com/content/10/1/123 | doi = 10.1186/1477-7819-10-123 }}</ref> o la figura 1 de l'article <ref name="Axente2011"> {{citar ref | tipus = revista | nom1 =L | cognom1 =Axente | nom2 =C | cognom2 =Sinescu | nom3 =G | cognom3 =Bazacliu | títol =Heart failure prognostic model | publicació =J Med Life. | data = 2011 | volum =4 | número =2 | pàgines =210-225 | url =http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3129013 }}</ref>) o la probabilitat de no presentar la malaltia (veure, p.ex., la figura 2 de l'article <ref name="Jacobson2002"> {{citar ref | tipus = revista | nom1 =LP | cognom1 =Jacobson | nom2 =R | cognom2 =Li | nom3 =J | cognom3 =Phair | nom4 =JB | cognom4 =Margolick | nom5 =CR | cognom5 =Rinaldo | nom6 =R | cognom6 =Detels | nom7 = Álvaro | cognom7 = Muñoz | títol =Evaluation of the effectiveness of highly active antiretroviral therapy in persons with human immunodeficiency virus using biomarker-based equivalence of disease progression | publicació =Am J Epidemiol | data = 2002 | volum =155 | número =8 | pàgines =760-70 | doi =10.1093/aje/155.8.760}}</ref>) en diferents moments des de l'origen.
La funció de supervivència s'utilitza molt en medicina per descriure la probabilitat de sobreviure (veure, p. ex., les figures de l'article <ref name="Celik2012"> {{citar ref | tipus = revista | nom1 =S | cognom1 = Celik | nom2 = M | cognom2 = Celik | nom3 = B | cognom3 = Aydemir | títol = Surgical properties and survival of a pericardial window via left minithoracotomy for benign and malignant pericardial tamponade in cancer patients | publicació = World J Surg Oncol | data = 2012 | volum = 10 | número = 1 | pàgines = 123 | doi = 10.1186/1477-7819-10-123 }}</ref> o la figura 1 de l'article <ref name="Axente2011"> {{citar ref | tipus = revista | nom1 =L | cognom1 =Axente | nom2 =C | cognom2 =Sinescu | nom3 =G | cognom3 =Bazacliu | títol =Heart failure prognostic model | publicació =J Med Life. | data = 2011 | volum =4 | número =2 | pàgines =210-225 | url =http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3129013 }}</ref>) o la probabilitat de no presentar la malaltia (veure, p.ex., la figura 2 de l'article <ref name="Jacobson2002"> {{citar ref | tipus = revista | nom1 =LP | cognom1 =Jacobson | nom2 =R | cognom2 =Li | nom3 =J | cognom3 =Phair | nom4 =JB | cognom4 =Margolick | nom5 =CR | cognom5 =Rinaldo | nom6 =R | cognom6 =Detels | nom7 = Álvaro | cognom7 = Muñoz | títol =Evaluation of the effectiveness of highly active antiretroviral therapy in persons with human immunodeficiency virus using biomarker-based equivalence of disease progression | publicació =Am J Epidemiol | data = 2002 | volum =155 | número =8 | pàgines =760-70 | doi =10.1093/aje/155.8.760}}</ref>) en diferents moments des de l'origen.


=== La taxa de perill <ref name="Perill"></ref> ===
=== La taxa de perill <ref name="Perill"></ref> ===
Línia 120: Línia 120:
on Δ''t'' és l'instant de temps entre ''t'' i ''t''<sub>1</sub> i ''N''<sub>''t''</sub> és el nombre de persones en risc al moment ''t''. Per tant, la taxa de perill és el nombre de defuncions per unitat de temps i en relació a la població en risc i es pot interpretar com una velocitat que estima la rapidesa a l'instant ''t'' (''velocitat instantània'') en que la població va cap a la defunció.
on Δ''t'' és l'instant de temps entre ''t'' i ''t''<sub>1</sub> i ''N''<sub>''t''</sub> és el nombre de persones en risc al moment ''t''. Per tant, la taxa de perill és el nombre de defuncions per unitat de temps i en relació a la població en risc i es pot interpretar com una velocitat que estima la rapidesa a l'instant ''t'' (''velocitat instantània'') en que la població va cap a la defunció.


La taxa de perill pot prendre valors des de zero i no te límit superior. A diferència de la supervivència que parteix de un i mai augmenta amb el temps, la taxa (al igual que la velocitat d'un vehicle) amb el temps pot augmentar, mantenir-se estable o disminuir (veure, p.ex., la figura 7 de l'article <ref name="Axente2011"></ref> o la 3 de l'article <ref name="Yan2010"> {{citar ref | tipus = revista | nom1 =Tingting | cognom1 =Yan | nom2 =Yin | cognom2 =Wenjin | nom3 =Liheng | cognom3 =Zhou | nom4 =Yiwei | cognom4 =Jiang | nom5 =Zhenzhou | cognom5 =Shen | nom6 =Zhimin | cognom6 =Zhenzhou | nom7 =Zhimin | cognom7 =Shao | nom8 =Jinsong | cognom8 =Lu | títol =Postoperative Fever: The Potential Relationship with Prognosis in Node Negative Breast Cancer Patients
La taxa de perill pot prendre valors des de zero i no te límit superior. A diferència de la supervivència que parteix de un i mai augmenta amb el temps, la taxa (al igual que la velocitat d'un vehicle) amb el temps pot augmentar, mantenir-se estable o disminuir (veure, p.ex., la figura 7 de l'article <ref name="Axente2011"></ref> o la 3 de l'article <ref name="Yan2010"> {{citar ref | tipus = revista | nom1 =Tingting | cognom1 =Yan | nom2 =Yin | cognom2 =Wenjin | nom3 =Liheng | cognom3 =Zhou | nom4 =Yiwei | cognom4 =Jiang | nom5 =Zhenzhou | cognom5 =Shen | nom6 =Zhimin | cognom6 =Zhenzhou | nom7 =Zhimin | cognom7 =Shao | nom8 =Jinsong | cognom8 =Lu | títol =Postoperative Fever: The Potential Relationship with Prognosis in Node Negative Breast Cancer Patients | publicació =PLoS ONE | data =2010 | volum =5 | número =12 | pàgines =e15903 | doi =10.1371/journal.pone.0015903}}</ref>). La seva evolució dependrà del procés que genera les dades. P. ex., si l'esdeveniment és la defunció després d'una intervenció quirúrgica, la taxa és molt elevada les primeres hores i dies després de la intervenció, i disminueix molt al cap de pocs dies.
| publicació =PLoS ONE | data =2010 | volum =5 | número =12 | pàgines =e15903 | url =http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0015903 | doi =10.1371/journal.pone.0015903}}</ref>). La seva evolució dependrà del procés que genera les dades. P. ex., si l'esdeveniment és la defunció després d'una intervenció quirúrgica, la taxa és molt elevada les primeres hores i dies després de la intervenció, i disminueix molt al cap de pocs dies.


[[File:Taxa de perill malalts amb sida.svg|thumb|Figura 2. Evolució temporal de la taxa de perill (instantània) dels malalts amb sida]]
[[File:Taxa de perill malalts amb sida.svg|thumb|Figura 2. Evolució temporal de la taxa de perill (instantània) dels malalts amb sida]]
Línia 127: Línia 126:
A la figura 2 es presenta l'estimació de les taxes de perill (instantànies) dels malalts amb sida de l'exemple presentat anteriorment. Malgrat que la corba és molt irregular (el nombre de defuncions per unitat de temps i per persona en risc varia molt d'un moment a un altre), fins aproximadament el dia 1.300, es pot identificar un patró d'un increment de la taxa amb el temps. És a dir, la velocitat amb que aquesta població va cap a la defunció es va incrementant lleugerament amb el temps fins aproximadament el dia 1.300.
A la figura 2 es presenta l'estimació de les taxes de perill (instantànies) dels malalts amb sida de l'exemple presentat anteriorment. Malgrat que la corba és molt irregular (el nombre de defuncions per unitat de temps i per persona en risc varia molt d'un moment a un altre), fins aproximadament el dia 1.300, es pot identificar un patró d'un increment de la taxa amb el temps. És a dir, la velocitat amb que aquesta població va cap a la defunció es va incrementant lleugerament amb el temps fins aproximadament el dia 1.300.


En el camp de l'epidemiologia, en que l'esdeveniment d'interès sol ser, en lloc de la defunció, una determinada malaltia, la taxa de perill s'anomena [[Incidència#Taxa_d.27incid.C3.A8ncia_.28TI.29 | taxa d'incidència]] o densitat d'incidència i es denota com ''λ''(''t''). Quan l'esdeveniment és la defunció, també s'anomenat força de mortalitat. La taxa d'incidència es sol expressar en termes de la disminució de les persones que estan en risc de presentar l'esdeveniment d'interès, pel fet de que algunes d'elles el presenten i deixen d'estar a risc. Si en un moment determinat hi han ''N''<sub>''t''</sub> persones en risc, la taxa d'incidència és la disminució potencial i instantània d'aquesta població (per l'aparició de nous casos de la malaltia) per unitat de temps i en relació a quantes persones estan en risc.<ref name="Elandt-Johnson1975">{{cite journal |last=Elandt-Johnson |first=Regina |title=Definition of rates: some remarks on their use and misuse |journal=Am J Epidemiol |year=1973 |volume=102 |issue=4 |pages=267-71 |pmid=1180251|ref = Elandt-Johnson1975}}</ref> En termes matemàtics, és la primera derivada de ''N''<sub>''t''</sub> en el moment ''t'' dividit per la quantitat de persones en risc en el mateix moment (''N''<sub>''t''</sub>) (<ref name="KleinbaumDG1982">{{citar ref | tipus = llibre | nom1 =David G | cognom1 =Kleinbaum | nom2 =Lawrence L | cognom2 =Kupper | nom3 =Hal | cognom3 =Morgenstern | títol =Epidemiologic research: principles and quantitative methods | lloc =Belmont, CA | editorial =Lifetime Learning Publications | data =1982}}</ref> pàg. 100):
En el camp de l'epidemiologia, en que l'esdeveniment d'interès sol ser, en lloc de la defunció, una determinada malaltia, la taxa de perill s'anomena [[Incidència#Taxa_d.27incid.C3.A8ncia_.28TI.29 | taxa d'incidència]] o densitat d'incidència i es denota com ''λ''(''t''). Quan l'esdeveniment és la defunció, també s'anomenat força de mortalitat. La taxa d'incidència es sol expressar en termes de la disminució de les persones que estan en risc de presentar l'esdeveniment d'interès, pel fet de que algunes d'elles el presenten i deixen d'estar a risc. Si en un moment determinat hi han ''N''<sub>''t''</sub> persones en risc, la taxa d'incidència és la disminució potencial i instantània d'aquesta població (per l'aparició de nous casos de la malaltia) per unitat de temps i en relació a quantes persones estan en risc.<ref name="Elandt-Johnson1975">{{citar ref | tipus = revista | nom1 =Regina | cognom1 =Elandt-Johnson | títol =Definition of rates: some remarks on their use and misuse | publicació =Am J Epidemiol | data = 1973 | volum =102 | número =4 | pàgines =267-71 | ref =Elandt-Johnson1975 }}</ref> En termes matemàtics, és la primera derivada de ''N''<sub>''t''</sub> en el moment ''t'' dividit per la quantitat de persones en risc en el mateix moment (''N''<sub>''t''</sub>) (<ref name="KleinbaumDG1982">{{citar ref | tipus = llibre | nom1 =David G | cognom1 =Kleinbaum | nom2 =Lawrence L | cognom2 =Kupper | nom3 =Hal | cognom3 =Morgenstern | títol =Epidemiologic research: principles and quantitative methods | lloc =Belmont, CA | editorial =Lifetime Learning Publications | data =1982}}</ref> pàg. 100):


:<math>\lambda(t) = \frac{\frac{-d(N_t)} {dt}} {N_t} = \frac{-d(N_t)} {N_t \times dt}</math>
:<math>\lambda(t) = \frac{\frac{-d(N_t)} {dt}} {N_t} = \frac{-d(N_t)} {N_t \times dt}</math>
Línia 177: Línia 176:
En la figura 3 es mostra la taxa de perill acumulada dels malalts amb sida de l'exemple anterior. Partint de zero, a mesura que transcorre el temps, el "risc" acumulat va augmentant. Per tant la corba evoluciona totalment al contrari que la corba de supervivència (figura 1): al disminuir aquesta, augmenta l'altre.
En la figura 3 es mostra la taxa de perill acumulada dels malalts amb sida de l'exemple anterior. Partint de zero, a mesura que transcorre el temps, el "risc" acumulat va augmentant. Per tant la corba evoluciona totalment al contrari que la corba de supervivència (figura 1): al disminuir aquesta, augmenta l'altre.


En els articles biomèdics, per representar la supervivència de diferents grups (p. ex., tractats i no tractats), sovint s'utilitza la corba que representa la incidència acumulada en funció del temps (veure, p. ex. la figura 1 de l'article <ref name="Loeb2011"> {{citar ref | tipus = revista | nom1 =S | cognom1 =Loeb | nom2 =EJ | cognom2 =Metter | nom3 =HB | cognom3 =Carter | nom4 =PH | cognom4 =Gann | nom5 =WJ | cognom5 =Catalona | títol =What is the true number needed to screen and treat to save a life with prostate-specific antigen testing? | publicació =J Clin Oncol | data = 2011 | volum =29 | número =4 | pàgines =:464-7 | url =http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3058289 | doi =10.1200/JCO.2010.30.6373 | ref = }}</ref> o la figura 2 de l'article <ref name="Axente2011"></ref>). Cal no confondre-la amb la corba que representa la ''probabilitat acumulada'' (1 - ''S''(''t'')) que s'utilitza, p. ex., en la figura 1 de l'article de Zhu i col.<ref name="Zhu2012"></ref> (encara que ells l'anomenen ''incidència acumulada'').
En els articles biomèdics, per representar la supervivència de diferents grups (p. ex., tractats i no tractats), sovint s'utilitza la corba que representa la incidència acumulada en funció del temps (veure, p. ex. la figura 1 de l'article <ref name="Loeb2011"> {{citar ref | tipus = revista | nom1 =S | cognom1 =Loeb | nom2 =EJ | cognom2 =Metter | nom3 =HB | cognom3 =Carter | nom4 =PH | cognom4 =Gann | nom5 =WJ | cognom5 =Catalona | títol =What is the true number needed to screen and treat to save a life with prostate-specific antigen testing? | publicació =J Clin Oncol | data = 2011 | volum =29 | número =4 | pàgines =:464-7 | doi =10.1200/JCO.2010.30.6373 | ref = }}</ref> o la figura 2 de l'article <ref name="Axente2011"></ref>). Cal no confondre-la amb la corba que representa la ''probabilitat acumulada'' (1 - ''S''(''t'')) que s'utilitza, p. ex., en la figura 1 de l'article de Zhu i col.<ref name="Zhu2012"></ref> (encara que ells l'anomenen ''incidència acumulada'').


== Estimació de la supervivència ==
== Estimació de la supervivència ==

Revisió del 11:31, 16 jul 2012

L'anàlisi de la supervivència és una branca de l'estadística que s'utilitza per analitzar dades que representen el temp transcorregut des d'un origen fins el moment que te lloc un esdeveniment com la defunció (temps fins a un esdeveniment) ([1] pàg 1). Aquesta branca de l'estadística rep diferents noms segons el camp d'aplicació. Així, per exemple, en enginyeria se sol anomenar anàlisi de fiabilitat.

L'anàlisi de la supervivència en medicina

En el camp de la medicina, l'origen sovint correspon al moment del diagnòstic d'una malaltia o el moment en que es realitza un tractament (p. ex., una intervenció quirúrgica). L'esdeveniment que marca la fi del temps de seguiment pot ser, p. ex., la defunció en general o a causa de la malaltia estudiada, una recidiva de la malaltia o la guarició.

Per simplificar els raonaments, se suposarà que només es te en compta el primer esdeveniment (en el cas de la defunció, es bastant obvi i si la malaltia és, p. ex., un infart miocardíac, l'esdeveniment d'interès serà només el primer infart que presentin els individus de l'estudi). També se suposarà que de tots els individus estudiats entren a l'estudi a temps zero i se segueixen un determinat temps (és a dir, la població es tancada). Tanmateix, el temps zero per cada individu sol ser un moment diferent en el calendari. Així, p. ex., si es vol estudiar el risc de defunció durant els 30 dies després d'un determinat tipus d'intervenció amb els malalts intervinguts en un hospital durant un any, cada malalt entra a l'estudi en el moment de ser intervingut. Però un és intervingut, p. ex., el 3 de gener, un altre el 5 de gener i així successivament. Malgrat que cada malalt entra a l'estudi en moments diferents, per tots ell el temps zero que marca l'inici del seguiment és el dia de la intervenció.

El temps que està l'individu a l'estudi sense presentar l'esdeveniment d'interès s'anomena temps en risc, ja que és el temps en que pot presentar-lo. A l'individu que desenvolupa l'esdeveniment d'interès s'anomenarà cas (un individu que presenti una anèmia no serà un cas si la malaltia d'interès és, p. ex., la pneumònia bacteriana). Un cop desenvolupat l'esdeveniment, deixa d'estar a risc de presentar-lo.

Típicament aquests mètodes s'utilitzen per analitzar les dades d' estudis de cohort o d'assajos clínics en els que se selecciona una mostra de la població que se sol se dividir en, p. ex., exposats i no exposats a un factor d'interès o tractats i no tractats amb un fàrmac o tractats amb diferents fàrmacs. Es segueixen els participants durant un termini de temps i es registra, per a cada participant, l'aparició de l'esdeveniment d'interès. Es poden diferenciar dos tipus de participants, els que presenten l'esdeveniment (p. ex., la mort o la malaltia) durant l'estudi i els que no el presenten (anomenats censurats). Els censurats es produeixen degut a ([2] pàg. 5-6):

  • Es perden de vista durant l'estudi:
    • L'individu no es torna a veure a l'estudi.
    • Es mora per alguna causa que no està relacionada amb l'estudi.
  • Per alguna raó es retiren de l'estudi:
    • Presenten un efecte secundari que impossibilita continuar el tractament (en el cas d'un assaig clínic).
    • No volen continuar amb el tractament o no volen seguir en l'estudi.
  • Al finalitzar l'estudi o al realitzar l'anàlisi de les dades encara no l'han presentat.

A aquests tipus de dades s'anomenen censurades ja que a l'investigador se li censura la possibilitat d'observar l'esdeveniment d'interès.

En aquest tipus d'estudis la mesura d'interès no és, per exemple, el percentatge d'esdeveniments que tenen lloc en cada grup, sinó el «temps des d'un origen fins a un esdeveniment» i fins a quin punt aquest temps és més o menys llarg. Per tant, les variables bàsiques d'un anàlisi de supervivència són:

  • El temps de seguiment o temps en risc: temps des de l'origen, moment en què l'individu entra a l'estudi, fins a l'esdeveniment o la censura.
  • Estat al final del seguiment: motiu pel qual finalitza el seguiment:
    • Presenta l'esdeveniment.
    • Es censura (p. ex., no ha presentat l'esdeveniment o s'ha perdut).

La principal particularitat dels mètodes d'anàlisi de supervivència es, precisament, que permeten analitzar fàcilment dades amb censures. És a dir, no cal conèixer de tots els individus si presenten o no l'esdeveniment d'interès. Per això, s'han utilitzat per analitzar dades en que la variable d'interès no és estrictament un temps. Per exemple, s'han utilitzat per analitzar la resposta bronquial (en forma d'una disminució del diàmetre dels bronquis o broncoconstricció).[3]És una prova que es realitza per identificar les persones amb tendència a la broncoconstricció quan inhalen determinats agents. Es fa inhalar una dosi de l'agent i, mitjançant una espirometria, s'estima el grau de broncoconstricció. La dosi es va augment per determinar a quina dosi ja apareix aquesta. El problema és que no tothom arriba a aquest punt, ja sigui degut a que, per diverses raons, s'ha tingut que aturar la prova, ja sigui degut a que no hi ha resposta broncoconstrictora. Per tant hi han dades censurades. Els autors tractaren les diferents dosis administrades com el temps, i com a esdeveniment l'aparició de broncoconstricció.

Per obtenir unes estimacions exactes (es a dir, sense [Biaix estadístic | biaixos]), dels paràmetres poblacionals, cal:

  • Definir l'origen de forma adequada. Ha de ser una data objectiva i amb significat biològic. Exemples d'orígens adequats: data de naixement, data del contagi en una malaltia infecciosa, moment de l'inici del tractament. No s'han d'usar dates subjectives com, per exemple, la dels primers símptomes segons els records del malalt (els records es poden modificar en funció dels fets posteriors).
  • L'escala del temps ha d'estar definida de forma adequada.
  • L'esdeveniment que marca la fi del seguiment s'ha de definir de la mateixa forma per a tothom, i s'han de fer servir els mateixos mètodes diagnòstics.
  • Si la finalitat és comparar la supervivència de dos o més grups, els grups a comparar s'han de definir i establir abans d'iniciar el seguiment (encara que sigui de forma retrospectiva) i en base a un esdeveniment que ja hagi tingut lloc en el moment d'assignar a cada individu al grup. La comparació de la supervivència pot ser incorrecte si es divideixen els malalts en grups segons un fet que te lloc posteriorment a l'assignació com, per exemple, la resposta al tractament o una complicació o la utilització o no d'un tractament necessari en funció de l'evolució de la malaltia, ja que la supervivència està relacionada amb la resposta (només poden "respondre" els que sobreviuen).

Exemple de dades

Les dades més simples tenen només dos informacions:

  • El temps en risc o temps de seguiment
  • Raó per la qual el temps en risc finalitza: per presentar l'esdeveniment o per ser censurat.

Sovint hi ha com a minin una variable addicional que defineix el grup (p. ex., exposat o no).

Per exemple, les dades Aids2 de la llibreria MASS del paquet estadístic R contenen els malalts diagnosticats de sida a Austràlia abans del 1 de juliol de 1991 [4]. Es pot calcular la variable temps des del diagnòstic fins a la defunció i una variable numèrica que indiqui si s'ha mort o no. El codi amb R és ([5] pàg 277):

> library(MASS)
> ## Càlcul del temps i variable estat
> Aids2$DIES  = Aids2$death - Aids2$diag
> ##  Fer la variable muda ("factor" o "dummy variable") ESTAT al final del seguiment
> Aids2$ESTAT = as.integer(Aids2$status == "D")
> # Selecció dels homosexuals (el valor de la variable ''T.categ'' és "hs") i les dos variables d'interès
> AIDS2_HS = subset(Aids2, T.categ=="hs", select = c(DIES, ESTAT))
> # Llistar els 5 primers individus (són defuncions):
> AIDS2_HS[1:5,]
  DIES ESTAT
1  176     1
2   67     1
3  432     1
5  275     1
6  373     1

Per cada individu, les dos informacions d'interès són els DIES i l'ESTAT. Els DIES és la variable aleatòria temps de supervivència (denotada per convenció amb al lletra majúscula T) i que per cada individu és el temps transcorregut des de l'entrada (moment del diagnòstic de sida) fins a la defunció. La variable ESTAT és la indicadora de si el individu ha mort o és un censurat. En el llistat es pot comprovar que, p. ex., l'individu primer va estar en risc 176 dies i va deixar-ho d'estar per defunció.

Descripció de les dades

Per resumir la dades de supervivència s'utilitzen tres quantitats bàsiques, la funció de supervivència, la taxa de perill (en anglès, "hazard function"[6]) i la taxa de perill acumulada (o simplement, perill acumulat, en anglès "cumulative hazard").

La funció de supervivència

La funció de supervivència, que es denota per convenció amb la lletra majúscula S, és defineix com la probabilitat, Pr, de que el temps de supervivència T d'un individu sigui més gran que un determinat temps t ([2] pàg. 2):

on t és la variable temps, T és la variable aleatòria que per cada individu és el temps transcorregut des de l'entrada fins la defunció i Pr és la funció probabilitat. Per tant, la funció de supervivència es pot utilitzar per representar la probabilitat de que un individu sobrevisqui des de l'origen fins més enllà d'un cert temps t o, en altres paraules, la probabilitat de que en el moment t encara estigui viu. Si l'esdeveniment estudiat, en lloc de la defunció, és una malaltia, S(t) és la probabilitat d'encara no haver-la presentat al moment t.

Per exemple, si la funció de supervivència als 10 mesos (S(t=10 mesos)) és de 0,80, vol dir que els 10 mesos d'iniciar-se el seguiment, el 80% de la població encara no ha mort i que la probabilitat de que el temps de supervivència, T, sigui més gran de 10 mesos és del 80%.

Figura 1: Estimació de Kaplan-Meier de la supervivència de malalts amb sida homosexuals. La línia vertical vermella correspon a la mediana del temps de supervivència

La funció de supervivència val un al inici del seguiment (al temps = 0 ningú s'ha mort i tothom sobreviu) i va disminuint acostant-se al valor zero a mesura que la gent va morint (o presentat algun altre esdeveniment d'interès). A la figura 1 es presenta l'estimació de la supervivència de les dades dels malalts amb sida de l'exemple presentat anteriorment. La línia vertical vermella correspon a la mediana del temps de supervivència, és a dir, el temps (uns 500 dies) en que el 50% de la població ja ha mort. Amb la corba és pot determinar quin és el percentatge de la població que encara està viva en diferents moment. Per exemple, el 20% dels individus encara estan vius als, aproximadament, 1.000 dies.

Una forma alternativa de presentar la supervivència és amb el seu oposat, 1 - S(t), és a dir la probabilitat de morir-se com a més tard al moment t. És l'anomenada funció de distribució acumulada que es denota per convenció amb la lletra majúscula F:

Si aquesta quantitat als 10 mesos (F(t=10 mesos)) pren el valor de 0,20, vol dir que els 10 mesos el 20% de la població ja ha mort.

En epidemiologia a aquesta quantitat s'anomena probabilitat acumulada o proporció d'incidència quan l'esdeveniment és la malaltia ([7] pàg. 37) i estima el risc de desenvolupar la malaltia en els primers 10 mesos de seguiment. Sovint també s'anomena "incidència acumulada" (veure, p. ex., la figura 1 de l'article [8]), però aquest terme s'utilitza per una altre quantitat ([7] pàg. 37) que és comenta mes endavant.

Aquí s'ha definit S(t) = Pr(T> t). Altres autors (p. ex., Collet [1] o JP Klein a l'Enciclopèdia de bioestadística [9]) defineixen S(t) = Pr(Tt). Aquesta darrera definició permet simplificar algunes fórmules dels casos amb variable de supervivència discreta, però la primera fa que la relació S(t) = 1 - F(t) es mantingui tant en el cas discret com en el continu.[9]

La funció de supervivència s'utilitza molt en medicina per descriure la probabilitat de sobreviure (veure, p. ex., les figures de l'article [10] o la figura 1 de l'article [11]) o la probabilitat de no presentar la malaltia (veure, p.ex., la figura 2 de l'article [12]) en diferents moments des de l'origen.

La taxa de perill [6]

La taxa de perill (en anglès, hazard rate) en el camp de l'anàlisi de la supervivència es denota per h(t) i en el de l'epidemiologia sovint per λ(t). Si la variable aleatòria el temps de supervivència, T, és una variable contínua amb una funció de densitat de probabilitat (és a dir, la funció que descriu la probabilitat relativa de que la variable aleatòria T prengui uns valors determinats) de f(t) i una funció de supervivència S(t), la taxa de perill és ([2] pàg. 2):

La taxa de perill representa la probabilitat de que una persona es mori en un interval de temps molt petit (un interval que comença a temps t i finalitza un instant després, al temps t1, amb t1 fora de l'interval), condicionat a que hagi sobreviscut fins llavores, dividit per la amplitud del interval () i en el límit, quant aquesta amplitud tendeix a zero ([13] pàg. 7):

o expressat amb notació formal:[9]

D'aquí es dedueix que la quantitat és aproximadament la probabilitat de que un individu de la població estudiada, que ha sobreviscut fins el moment t, es mori durant el mateix interval.

El numerador de l'equació anterior (la probabilitat de morir) es pot estimar amb el nombre de defuncions que han tingut lloc en el petit interval de temps entre t i t1 (amb t1 fora de l'interval) dividit per quantitat de persones en risc al temps t. Per tant, l'equació anterior és pot reescriure:

on Δt és l'instant de temps entre t i t1 i Nt és el nombre de persones en risc al moment t. Per tant, la taxa de perill és el nombre de defuncions per unitat de temps i en relació a la població en risc i es pot interpretar com una velocitat que estima la rapidesa a l'instant t (velocitat instantània) en que la població va cap a la defunció.

La taxa de perill pot prendre valors des de zero i no te límit superior. A diferència de la supervivència que parteix de un i mai augmenta amb el temps, la taxa (al igual que la velocitat d'un vehicle) amb el temps pot augmentar, mantenir-se estable o disminuir (veure, p.ex., la figura 7 de l'article [11] o la 3 de l'article [14]). La seva evolució dependrà del procés que genera les dades. P. ex., si l'esdeveniment és la defunció després d'una intervenció quirúrgica, la taxa és molt elevada les primeres hores i dies després de la intervenció, i disminueix molt al cap de pocs dies.

Figura 2. Evolució temporal de la taxa de perill (instantània) dels malalts amb sida

A la figura 2 es presenta l'estimació de les taxes de perill (instantànies) dels malalts amb sida de l'exemple presentat anteriorment. Malgrat que la corba és molt irregular (el nombre de defuncions per unitat de temps i per persona en risc varia molt d'un moment a un altre), fins aproximadament el dia 1.300, es pot identificar un patró d'un increment de la taxa amb el temps. És a dir, la velocitat amb que aquesta població va cap a la defunció es va incrementant lleugerament amb el temps fins aproximadament el dia 1.300.

En el camp de l'epidemiologia, en que l'esdeveniment d'interès sol ser, en lloc de la defunció, una determinada malaltia, la taxa de perill s'anomena taxa d'incidència o densitat d'incidència i es denota com λ(t). Quan l'esdeveniment és la defunció, també s'anomenat força de mortalitat. La taxa d'incidència es sol expressar en termes de la disminució de les persones que estan en risc de presentar l'esdeveniment d'interès, pel fet de que algunes d'elles el presenten i deixen d'estar a risc. Si en un moment determinat hi han Nt persones en risc, la taxa d'incidència és la disminució potencial i instantània d'aquesta població (per l'aparició de nous casos de la malaltia) per unitat de temps i en relació a quantes persones estan en risc.[15] En termes matemàtics, és la primera derivada de Nt en el moment t dividit per la quantitat de persones en risc en el mateix moment (Nt) ([16] pàg. 100):

Aquesta equació és fonamentalment la mateixa expressió que la de l'estimació anterior de la taxa de perill (h(t)), ja que el numerador (-d(Nt )) no és més que el nombre d'esdeveniments que tenen lloc i que provoca un reducció (el signe és negatiu) de la mida de la població en risc de d(Nt) persones.

La taxa d'incidència estima la velocitat en que la població en risc va cap a la malaltia. La taxa així presentada seria l'equivalent a la velocitat d'un vehicle en un moment donat. Però com que aquesta velocitat varia d'un moment a un altre, s'utilitza per descriure-la, no la instantània, sinó la mitjana. De la mateixa manera, se sol estimar una taxa d'incidència mitjana (que se denotarà com TI) durant un determinat període de temps. Aquesta s'estima a partir de la relació del nombre de casos nous de malaltia i la quantitat de persones que encara estan en risc d'emmalaltir en cada moment. Si en una població determinada, Nt individus encara estan en risc d'emmalaltir en el moment t, la λ mitjana (o TI) entre l'inici del seguiment i el moment t, és el nombre de nous casos (n) dividit per la integral de Nt·(dt) entre el temps zero i el temps t ([16] pàg. 100):

Aquesta quantitat es pot estimar de forma aproximada dividint el nombre de casos nous (casos incidents) en un període determinat per la quantitat de persones en risc durant l'estudi o persones-temps:

El denominador (les persones-temps) és una aproximació del denominador de l'equació anterior i s'estima sumant els temps en risc de cada uns dels individus. Quan no es disposa del temps de seguiment de cada individu, les persones-temps es poden estimar multiplicant la població en risc en la meitat del període per la duració de l'estudi. Aquests conceptes es desenvolupen a l'apartat Taxa d'incidència de l'entrada Incidència.

Taxa de perill acumulada (Incidència acumulada)

No sempre és fàcil estimar la taxa de perill (instantània). Una alternativa és utilitzar la taxa de perill acumulada (en anglès, cumulative hazard) que sovint s'anomenada en el camp de l'epidemiologia o quan l'esdeveniment és una malaltia determinada, incidència acumulada.[17]

Si el temps de seguiment, T, és una variable aleatòria contínua, la taxa de perill acumulada des del inici del seguiment fins el moment t, s'estima integrant (és a dir sumant) les taxes de perill instantànies entre el temps zero i el moment t ([2] pàg. 66):

on h(t) és la taxa de perill (o la taxa d'incidència, λ(t), si l'esdeveniment és una malaltia) en cada uns dels instants "i" que hi han entre l'inici i el moment t.

Com que anteriorment s'ha comentat que h(t) és:

es pot deduir que H(t) és ([2] pàg. 3):

per tant, estimada la funció de supervivència, és pot estimar la incidència acumulada (que no s'ha de confondre amb la probabilitat acumulada). I viceversa, a partir de la taxa de perill acumulada es pot estimar la probabilitat de sobreviure:

Quan la taxa de perill (h) és petita, llavors la incidència acumulada numèricament és aproximadament igual a la probabilitat acumulada de morir en el període entre l'inici del seguiment i el temps t, sempre que no existeixin altres causes de mort competitives, sempre que aquestes altres causes actuïn independentment de la causa d'interès.[18]

Igualment, si la taxa d'incidència (λ, taxa de perill en que l'esdeveniment d'interès és una malaltia) es petita, la incidència acumulada és una aproximació de la probabilitat "pura" de presentar la malaltia en absència d'altres causes de mort competitives. [18]

Figura 3. Taxa de perill acumulada

La taxa de perill acumulada és l'àrea sota la corba de la funció que descriu el valor de la taxa de perill (o d'incidència) instantània en cada un dels moments entre l'inici i el temps t (figura 2) i representa, en cada instant, la quantitat de persones en risc que presenta l'esdeveniment (en relació al nombre de persones en risc). Aquesta àrea estima la quantitat total del risc que s'ha acumulat fins el temps t i, per tant, te una relació inversa amb la probabilitat de sobreviure: al disminuir amb el temps el nombre de persones que sobreviuen, augmenta la taxa de perill acumulada (el risc acumulat va augmentant).

Mentre que la taxa de perill (o taxa d'incidència) és equivalent a la velocitat (instantània o mitjana) d'un vehicle, la taxa de perill acumulada equival a la distancia recorreguda. Si un cotxe va a una velocitat mitjana de 50 km/h, vol dir que en dos hores haurà recorregut 100 km. De la mateixa manera, si la taxa d'incidència d'una malaltia és de 50/any, vol dir que la taxa de perill acumulada en dos anys serà de 100.

En la figura 3 es mostra la taxa de perill acumulada dels malalts amb sida de l'exemple anterior. Partint de zero, a mesura que transcorre el temps, el "risc" acumulat va augmentant. Per tant la corba evoluciona totalment al contrari que la corba de supervivència (figura 1): al disminuir aquesta, augmenta l'altre.

En els articles biomèdics, per representar la supervivència de diferents grups (p. ex., tractats i no tractats), sovint s'utilitza la corba que representa la incidència acumulada en funció del temps (veure, p. ex. la figura 1 de l'article [19] o la figura 2 de l'article [11]). Cal no confondre-la amb la corba que representa la probabilitat acumulada (1 - S(t)) que s'utilitza, p. ex., en la figura 1 de l'article de Zhu i col.[8] (encara que ells l'anomenen incidència acumulada).

Estimació de la supervivència

L'estimació de la supervivència presentada en la figura 1 (o qualsevol de les anterior mesures relacionades amb ella) a partir de les dades d'un estudi, es pot realitzar utilitzant dos aproximacions diferents. Una és assumir que la variable temps de supervivència (la variable aleatòria T, el temps en risc) no segueix cap distribució en particular (estimació no paramètrica) i l'altre és assumir que T s'ajusta a una distribució matemàtica coneguda.

Estimació no paramètrica

Aquest tipus d'estimació no fa cap assumpció sobre la distribució del temps de supervivència T. Si no existeixen censurats, l'estimació de la funció de supervivència es realitza calculant la proporció de supervivents en cada instant t:

Si existeixen censures, es pot utilitzar el mètode de Kaplan–Meier (és el mètode utilitzat per estimar la supervivència de la figura 1). Aquest mètode estima la supervivència calculant en cada moment en què té lloc un esdeveniment la probabilitat de sobreviure següent:

on ni és el nombre d'individus en risc al moment i, (inclosos els que presenten l'esdeveniment i els censurats en aquest moment) i di és el nombre d'esdeveniments en aquest moment.

Finalment es multipliquen totes les pi, de manera que si tenen lloc, p. ex, 15 esdeveniments, la fórmula final és:

S'assumeix que els casos censurats es distribueixen de forma uniforme al llarg de tot el temps i que entre dos esdeveniments la probabilitat de presentar l'esdeveniment no canvia.

Estimació paramètrica

S'assumeix que el temps de supervivència T s'ajusta a una distribució matemàtica coneguda com, p. ex., una de Weibull, una exponencial o una log-normal. En aquest cas, el problema es redueix a estimar els paràmetres de la funció que millor s'ajusti a les dades.

Vegeu també

Referències

  1. 1,0 1,1 Collett, David. Modelling Survival Data in Medical Research. 2. London: Chapman and Hall/CRC, 2003. 
  2. 2,0 2,1 2,2 2,3 2,4 Miller, Rupert G; Gong, Gail; Muñoz, Álvaro. Survival analysis. New York: Wiley-Interscience, 1981 (Wiley Classics Library).  Error de citació: Etiqueta <ref> no vàlida; el nom «Miller1981» està definit diverses vegades amb contingut diferent.
  3. Muñoz, Álvaro; Sunyer, Jordi «Comparison of Semiparametric and Parametric Survival Models for the Analysis of Bronchial Responsiveness». Am J Respir Crit Care Med, 154, 1996, p. 5234-39.
  4. Aids2, Australian AIDS Survival Data
  5. Maindonald, John; Braun, John. Data analysis and graphics using R. 2ed. Cambridge: Cambridge University Press, 2007 (Cambridge Series in Statistical and Probabilistic Mathematics). 
  6. 6,0 6,1 Es tradueix "hazard" per "perill" de la mateixa manera que, per exemple "Potentially Hazardous Object" es tradueix per "Objecte potencialment perillós" o "Hazard symbol" per "símbols de perill" o perillositat
  7. 7,0 7,1 Rothman, Kenneth J; Greenland, Sander. Modern Epidemiology. 2ª ed. Philadelphia: Lippincott Williams & Wilkins, 1998. 
  8. 8,0 8,1 Zhu, H; Napravnik, S; Eron, J; Cole, S «Attrition among Human Immunodeficiency Virus (HIV)- Infected Patients Initiating Antiretroviral Therapy in China, 2003-2010». PLoS One, 7, 6, 2012, p. e39414. DOI: 10.1371/journal.pone.0039414.
  9. 9,0 9,1 9,2 Klein, John P. «Survival Distributions and Their Characteristics». A: Armitage, Peter. Encyclopedia of Biostatistics. 2. New York: J Wiley, 2005. 
  10. Celik, S; Celik, M; Aydemir, B «Surgical properties and survival of a pericardial window via left minithoracotomy for benign and malignant pericardial tamponade in cancer patients». World J Surg Oncol, 10, 1, 2012, p. 123. DOI: 10.1186/1477-7819-10-123.
  11. 11,0 11,1 11,2 Axente, L; Sinescu, C; Bazacliu, G «Heart failure prognostic model». J Med Life., 4, 2, 2011, p. 210-225.
  12. Jacobson, LP; Li, R; Phair, J; Margolick, JB «Evaluation of the effectiveness of highly active antiretroviral therapy in persons with human immunodeficiency virus using biomarker-based equivalence of disease progression». Am J Epidemiol, 155, 8, 2002, p. 760-70. DOI: 10.1093/aje/155.8.760.
  13. Cleves, Mario; Gould, DWilliam W; Gutierrez, Roberto G [et al.].. An Introduction to Survival Analysis Using Stata. 2ed. College Station TX: Stata Press, 2008. 
  14. Yan, Tingting; Wenjin, Yin; Zhou, Liheng; Jiang, Yiwei «Postoperative Fever: The Potential Relationship with Prognosis in Node Negative Breast Cancer Patients». PLoS ONE, 5, 12, 2010, p. e15903. DOI: 10.1371/journal.pone.0015903.
  15. Elandt-Johnson, Regina «Definition of rates: some remarks on their use and misuse». Am J Epidemiol, 102, 4, 1973, p. 267-71.
  16. 16,0 16,1 Kleinbaum, David G; Kupper, Lawrence L; Morgenstern, Hal. Epidemiologic research: principles and quantitative methods. Belmont, CA: Lifetime Learning Publications, 1982. 
  17. Gail, Mitchell H. «Cumulative incidence rate». A: Armitage, Peter. Encyclopedia of Biostatistics. 2. New York: J Wiley, 2005. 
  18. 18,0 18,1 Gail, Mitchell H. «Cumulative hazard». A: Armitage, Peter. Encyclopedia of Biostatistics. 2. New York: J Wiley, 2005. 
  19. Loeb, S; Metter, EJ; Carter, HB; Gann, PH «What is the true number needed to screen and treat to save a life with prostate-specific antigen testing?». J Clin Oncol, 29, 4, 2011, p. :464-7. DOI: 10.1200/JCO.2010.30.6373.

Enllaços externs

Bibliografia

  • Borges, R. (2005). Análisis de sobrevivencia utilizando el Lenguaje R. XV Simposio de Estadística, Paipa, Colombia. Disponible en PDF (castellà)
  • Guadalupe Gómez, Carles Serrat y Klaus Langohr: S-PLUS en los estudios de supervivencia. Disponible en PDF. (castellà)