Critical Assessment of Techniques for Protein Structure Prediction

Critical Assessment of Techniques for Protein Structure Prediction (CASP) ("avaluació crítica de les tècniques per la predicció estructural proteica") és un experiment mundial comunitari per la predicció estructural proteica que es duu a terme cada dos dos anys des del 1994.^[1] CASP proporciona als grups d'investigació una oportunitat d'avaluar objectivament els seus mètodes de predicció estructural i ofereix una avaluació independent sobre l'estat de l'art del modelatge estructural proteic a la comunitat investigadora i als usuaris de programari. Encara que l'objectiu principal de CASP és ajudar a promoure els mètodes d'identificació de l'estructura tridimensional proteica a partir de la seva seqüència d'aminoàcids, molts veuen l'experiment més com un "campionat mundial" d'aquesta matèria de la ciència. Més de 100 grups d'arreu del món participen a CASP de forma regular i no és poc comú que grups sencers suspenguin altres investigacions per mesos mentre s'enfoquen en tenir els servidors llestos per l'experiment i en realitzar la detallada predicció.

Selecció de la proteïna objectiu[modifica]

Per assegurar-se que cap predictor pugui tenir informació prèvia sobre l'estructura de la proteïna que el posaria en avantatge, és important que l'experiment sigui dut a terme de manera doble cega: Ni els predictors ni els organitzadors i avaluadors coneixen les estructures de les proteïnes objectiu en el moment que les prediccions s'estiguin fent. Els objectius de les prediccions estructurals són o bé estructures que seran pròximament determinades per cristal·lografia de rajos X o espectroscòpia de RMN, o són estructures que acaben de ser resoltes (principalment per un dels centres de genòmica estructural) i són mantingudes en espera pel Protein Data Base. Si la seqüència donada és trobada relacionada per descendència comuna a una seqüència proteica d'estructura coneguda (anomenada plantilla), el modelatge homòleg pot ser ocupat per predir l'estructura terciària. Les plantilles poden ser trobades utilitzant mètodes d'alineament de seqüències com ara BLAST o FASTA o mètodes protein threading, que són millors en trobar plantilles que estan remotament relacionades. Altrament, una predicció estructural proteica de novo ha de ser aplicada, que és menys fiable però a vegades pot produir models amb el plegament correcte. Els plegaments realment nous són cada vegada més rars entre els objectius,^[2]^[3] fent aquella categoria menor del que seria desitjable.

Avaluació[modifica]

El mètode principal d'avaluació^[4] és una comparació de les posicions α-carboni del model predit amb les de l'estructura objectiu. La comparació és mostrada visualment per traços acumulatius de les distàncies entre parells d'equivalents α-carboni en l'alineació del model i en el de l'estructura, tal com es mostra en la figura (un model perfecte es mantindria en zero per tota l'amplada del gràfic), i és assignada una puntuació numèrica GDT-TS (Global Distance Test — Total Score)^[5] que descriu el percentatge de residus ben modelats en el model respecte a l'objectiu. Modelatge lliure (sense plantilles, o de novo) també és visualment avaluada pels avaluadors, car les puntuacions numèriques no funcionen igual de bé en trobar semblances en els casos més difícils.^[6] Prediccions d'alta exactitud basades en plantilles foren avaluades a CASP7 per si funcionaven per les fases de substitució molecular de l'estructura cristall objectiu^[7] amb els èxits seguits després,^[8] i per la qualitat del model sencer (no només α-carboni) i comparació del model sencer a l'objectiu a CASP8.^[9]

L'avaluació dels resultats és duta a terme en les següents categories de predicció:

Predicció estructural terciària (tots els CASP)
Predicció estructural secundària (només fins a CASP5)
Predicció de complexos proteics (només CASP2; un experiment independent - CAPRI - continua en aquest tema)
Predicció contacte residu-residu (a partir de CASP4)
Predicció de regions desordenades (a partir de CASP5)
Predicció de fronteres del domini proteic (CASP6–CASP8)
Predicció de la funció biològica (a partir de CASP6)
Avaluació de qualitat del model (a partir de CASP7)
Refinament de model (a partir de CASP7)
Prediccions d'alta exactitud basades en plantilles (a partir de CASP7)

La categoria de predicció estructural terciària fou a més subdividida en:

Modelatge homòleg
Reconeixement de plegament (també anomenat protein threading, cosa que és incorrecte car threading és un mètode)
Predicció estructural de novo, ara coneguda com a New Fold car molts mètodes apliquen avaluacions, o puntuació, funcions que són parcials pel coneixement de l'estructura proteica nativa, tal com una xarxa artificial neural.

A partir de CASP7, les categories han sigut redefinides per reflectir el desenvolupament en els mètodes. La categoria de modelatge basat en plantilles inclou tots els modelatges comparatius antics, models basats en plegaments homòlegs i alguns models basats en plegaments anàlegs. La categoria de modelatge sense plantilles inclou models de proteïnes amb plegaments mai abans vistos i models basats en plegaments anàlegs difícils.

Els resultats de CAPS són publicats en publicacions suplementàries de la revista científica Proteins, les quals són accessibles a través de la pàgina web de CASP.^[10] Un article de portada a cadascun d'aquests suplements descriu els detalls de l'experiment^[11]^[12] mentre que un article de tancament avalua el progrés en aquesta matèria.^[13]^[14]

Classificació de resultats[modifica]

Avaluacions automàtiques per CASP9 (2010)

Avaluacions automàtiques per CASP8 (2008)

Avaluacions automàtiques per CASP7 (2006)

Classificació per Livebench Arxivat 2007-10-22 at Archive.is
Classificació per Zhang Lab

Referències[modifica]

↑ Moult, J., et al. «A large-scale experiment to assess protein structure prediction methods» (en anglès). Proteins, 23, 3, 1995, pàg. ii–iv.
↑ Tress, M., et al. «Target domain definition and classification in CASP8» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 10–17. DOI: 10.1002/prot.22497. PMC: 2805415. PMID: 19603487.
↑ Zhang Y and Skolnick J «The protein structure prediction problem could be solved using the current PDB library» (en castellà). Proc Natl Acad Sci USA, 102, 4, 2005, pàg. 1029–1034. DOI: 10.1073/pnas.0407152101. PMC: 545829. PMID: 15653774.
↑ Cozzetto, D., et al. «Evaluation of template-based models in CASP8 with standard measures» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 18–28. DOI: 10.1002/prot.22561. PMID: 19731382.
↑ Zemla, A. «LGA: a method for finding 3D similarities in protein structures» (en anglès). Nucleic Acids Research, 31, 13, 2003, pàg. 3370–4. DOI: 10.1093/nar/gkg571. PMC: 168977. PMID: 12824330.
↑ Ben-David, M., et al. «Assessment of CASP8 structure predictions for template free targets» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 50–65. DOI: 10.1002/prot.22591. PMID: 19774550.
↑ Read, R.J., Chavali, G. «Assessment of CASP7 predictions in the high accuracy template-based modeling category» (en anglès). Proteins: Structure Function Bioinformatics, 69, Suppl 8, 2007, pàg. 27–37. DOI: 10.1002/prot.21662. PMID: 17894351.
↑ Qian, B., et al. «High-resolution structure prediction and the crystallographic phase problem» (en castellà). Nature, 450, 7167, 2007, pàg. 259–264. DOI: 10.1038/nature06249. PMC: 2504711. PMID: 17934447.
↑ Keedy, D.A.; Noivirt-Brik, O; Paz, A; Prilusky, J; Sussman, JL; Levy, Y «The other 90% of the protein: Assessment beyond the α-carbon for CASP8 template-based and high-accuracy models» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 50–65. DOI: 10.1002/prot.22591. PMID: 19774550.
↑ «CASP Proceedings».
↑ Moult, J., et al. «Critical assessment of methods of protein structure prediction — Round VII» (en anglès). Proteins, 69, Suppl 8, 2007, pàg. 3–9. DOI: 10.1002/prot.21767. PMC: 2653632. PMID: 17918729.
↑ Moult, J., et al. «Critical assessment of methods of protein structure prediction — Round VIII» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 1–4. DOI: 10.1002/prot.22589. PMID: 19774620.
↑ Kryshtafovych, A., et al. «Progress from CASP6 to CASP7» (en anglès). Proteins: Structure, Function, and Bioinformatics, 69, Suppl 8, 2007, pàg. 194–207. DOI: 10.1002/prot.21769. PMID: 17918728.
↑ Kryshtafovych, A., et al. «CASP8 results in context of previous experiments» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 217–228. DOI: 10.1002/prot.22562. PMID: 19722266.

Vegeu també[modifica]

Enllaços externs[modifica]

Pàgina web dels experiments CASP (anglès)

[1] Moult, J., et al. «A large-scale experiment to assess protein structure prediction methods» (en anglès). Proteins, 23, 3, 1995, pàg. ii–iv.

[2] Tress, M., et al. «Target domain definition and classification in CASP8» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 10–17. DOI: 10.1002/prot.22497. PMC: 2805415. PMID: 19603487.

[zhang2005-3] Zhang Y and Skolnick J «The protein structure prediction problem could be solved using the current PDB library» (en castellà). Proc Natl Acad Sci USA, 102, 4, 2005, pàg. 1029–1034. DOI: 10.1073/pnas.0407152101. PMC: 545829. PMID: 15653774.

[4] Cozzetto, D., et al. «Evaluation of template-based models in CASP8 with standard measures» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 18–28. DOI: 10.1002/prot.22561. PMID: 19731382.

[5] Zemla, A. «LGA: a method for finding 3D similarities in protein structures» (en anglès). Nucleic Acids Research, 31, 13, 2003, pàg. 3370–4. DOI: 10.1093/nar/gkg571. PMC: 168977. PMID: 12824330.

[6] Ben-David, M., et al. «Assessment of CASP8 structure predictions for template free targets» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 50–65. DOI: 10.1002/prot.22591. PMID: 19774550.

[7] Read, R.J., Chavali, G. «Assessment of CASP7 predictions in the high accuracy template-based modeling category» (en anglès). Proteins: Structure Function Bioinformatics, 69, Suppl 8, 2007, pàg. 27–37. DOI: 10.1002/prot.21662. PMID: 17894351.

[8] Qian, B., et al. «High-resolution structure prediction and the crystallographic phase problem» (en castellà). Nature, 450, 7167, 2007, pàg. 259–264. DOI: 10.1038/nature06249. PMC: 2504711. PMID: 17934447.

[9] Keedy, D.A.; Noivirt-Brik, O; Paz, A; Prilusky, J; Sussman, JL; Levy, Y «The other 90% of the protein: Assessment beyond the α-carbon for CASP8 template-based and high-accuracy models» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 50–65. DOI: 10.1002/prot.22591. PMID: 19774550.

[10] «CASP Proceedings».

[11] Moult, J., et al. «Critical assessment of methods of protein structure prediction — Round VII» (en anglès). Proteins, 69, Suppl 8, 2007, pàg. 3–9. DOI: 10.1002/prot.21767. PMC: 2653632. PMID: 17918729.

[12] Moult, J., et al. «Critical assessment of methods of protein structure prediction — Round VIII» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 1–4. DOI: 10.1002/prot.22589. PMID: 19774620.

[13] Kryshtafovych, A., et al. «Progress from CASP6 to CASP7» (en anglès). Proteins: Structure, Function, and Bioinformatics, 69, Suppl 8, 2007, pàg. 194–207. DOI: 10.1002/prot.21769. PMID: 17918728.

[14] Kryshtafovych, A., et al. «CASP8 results in context of previous experiments» (en anglès). Proteins, 77, Suppl 9, 2009, pàg. 217–228. DOI: 10.1002/prot.22562. PMID: 19722266.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]