Peak calling: diferència entre les revisions
m retocs de format |
seguretat 05/12 5 |
||
Línia 6: | Línia 6: | ||
La identificació dels llocs d'unió de les proteïnes genòmiques a travès de la ChIP o de les metilacions a través de la ''MeDIP'' han necessitat de noves eines computacionals, diferents a les emprades anteriorment per als experiments ChIP-Chip, la qual combinava la ChIP i els [[Xip d'ADN|xips de DNA]] (en anglès, DNA ''chip''). Actualment hi ha més d'una quarantena de programes analítics, molts dels quals es basen en algoritmes per a cridar pics.<ref name=":0" /> |
La identificació dels llocs d'unió de les proteïnes genòmiques a travès de la ChIP o de les metilacions a través de la ''MeDIP'' han necessitat de noves eines computacionals, diferents a les emprades anteriorment per als experiments ChIP-Chip, la qual combinava la ChIP i els [[Xip d'ADN|xips de DNA]] (en anglès, DNA ''chip''). Actualment hi ha més d'una quarantena de programes analítics, molts dels quals es basen en algoritmes per a cridar pics.<ref name=":0" /> |
||
El fet que molts dels algoritmes matemàtics siguin lliures ha permés que hi hagi un progrés elevat dels mateixos. Així, al 2014 els més populars eren el F-seq<ref>{{Ref-publicació|article=F-Seq: a feature density estimator for high-throughput sequence tags|doi=10.1093/bioinformatics/btn480|nom4=Terrence S.|cognom3=Crawford|nom3=Gregory E.|cognom2=Guinney|nom2=Justin|cognom=Boyle|nom=Alan P.|exemplar=21|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2732284/|volum=24|pàgines=2537–2538|pmid=18784119|pmc=2732284|issn=1367-4803|data=2008-11-01|publicació=Bioinformatics|cognom4=Furey}}</ref> i el Hotspot<ref>{{Ref-publicació|article=Chromatin accessibility pre-determines glucocorticoid receptor binding patterns|nom=Sam|nom5=Simon C.|cognom4=Sung|nom4=Myong-Hee|cognom3=Thurman|nom3=Robert E.|cognom2=Sabo|nom2=Peter J.|cognom=John|llengua=en|url=https://www.nature.com/articles/ng.759|doi=10.1038/ng.759|exemplar=3|volum=43|pàgines=264–268|pmid=21258342|pmc=PMC6386452|issn=1546-1718|data=2011-03|publicació=Nature Genetics|cognom5=Biddie}}</ref>, útils sobretot per a [[:en:DNase-Seq|DNAse-seq]]; el ZINBA (de l'anglès ''Zero-Inflated Negative Bionomial Algorithm'')<ref>{{Ref-publicació|article=ZINBA integrates local covariates with DNA-seq data to identify broad and narrow regions of enrichment, even within amplified genomic regions|cognom=Rashid|nom5=Jason D.|cognom4=Sun|nom4=Wei|cognom3=Ibrahim|nom3=Joseph G.|cognom2=Giresi|nom2=Paul G.|nom=Naim U.|url=https://doi.org/10.1186/gb-2011-12-7-r67|doi=10.1186/gb-2011-12-7-r67|exemplar=7|volum=12|pàgines=R67|issn=1474-760X|data=2011-07-25|publicació=Genome Biology|cognom5=Lieb}}</ref>, útil també per a [[:en:FAIRE-Seq|FAIRE-seq]],ChIP-seq i [[RNA-Seq|RNA-seq]]<ref>{{Ref-publicació|article=A Comparison of Peak Callers Used for DNase-Seq Data|llengua=en|nom4=Tim|cognom3=Spivakov|nom3=Mikhail|cognom2=Down|nom2=Thomas A.|cognom=Koohy|nom=Hashem|doi=10.1371/journal.pone.0096303|url=https://dx.plos.org/10.1371/journal.pone.0096303|exemplar=5|volum=9|pàgines=e96303|pmid=24810143|pmc=PMC4014496|issn=1932-6203|data=2014-05-08|publicació=PLoS ONE|cognom4=Hubbard}}</ref>; el MACS<ref>{{Ref-publicació|article=Model-based Analysis of ChIP-Seq (MACS)|nom=Yong|nom5=David S|cognom4=Eeckhoute|nom4=Jérôme|cognom3=Meyer|nom3=Clifford A|cognom2=Liu|nom2=Tao|cognom=Zhang|doi=10.1186/gb-2008-9-9-r137|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2592715/|exemplar=9|volum=9|pàgines=R137|pmid=18798982|pmc=2592715|issn=1465-6906|data=2008|publicació=Genome Biology|cognom5=Johnson}}</ref> o l'Spp<ref name=":4">{{Ref-publicació|article=Design and analysis of ChIP-seq experiments for DNA-binding proteins|url=https://www.nature.com/articles/nbt.1508/email/correspondent/c1/|publicació=Nature Biotechnology|data=2008-12|issn=1546-1696|pàgines=1351–1359|volum=26|exemplar=12|doi=10.1038/nbt.1508|llengua=en|nom=Peter V.|cognom=Kharchenko|nom2=Michael Y.|cognom2=Tolstorukov|nom3=Peter J.|cognom3=Park}}</ref>. En l'actualitat s'ha arribat a fer gràfiques (''Graphic Peak Calling'')<ref name=":1" /> i seqüenciacions en 3-D com amb el HiChIP<ref name=":2" />. |
|||
== Procediment per a trobar pics == |
== Procediment per a trobar pics == |
||
Línia 43: | Línia 45: | ||
* Localitzats però amples: ~1 kb |
* Localitzats però amples: ~1 kb |
||
* Amples: ~100 kb |
* Amples: ~100 kb |
||
[[Fitxer:Detecció ChIP.png|miniatura|'''Detecció de la unió de proteïnes amb dades ChIP-seq.''' a) Passes principals per al procés de ChIP-seq. b) Esquema del mesuraent amb ChIP-seq. El DNA és fragmentat o digerit, i els fragments reticualts (cross-linked) amb la proteïna d'interés es seleccionen per immunoprecipitació. L'extrem 5' dels fragments seleccionats es seqüencien, normalment fent grups d'etiquetes de cadenes positiva i negativa als dos costats de la regió en qüestió.]] |
|||
⚫ | El poder predictiu de les eines existents depenen del tipus de dades a processar.<ref>{{Ref-publicació|article=Computation for ChIP-seq and RNA-seq studies|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4121056/|publicació=Nature methods|data=2009-11|issn=1548-7091|pmc=4121056|pmid=19844228|pàgines=S22–S32|volum=6|exemplar=11 0|doi=10.1038/nmeth.1371|nom=Shirley|cognom=Pepke|nom2=Barbara|cognom2=Wold|nom3=Ali|cognom3=Mortazavi}}</ref> |
||
[AFEGIR IMATGE doi:10.1038/nbt.1508] |
|||
⚫ | El poder predictiu de les eines existents depenen del tipus de dades a processar.<ref>{{Ref-publicació|article=Computation for ChIP-seq and RNA-seq studies|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4121056/|publicació=Nature methods|data=2009-11|issn=1548-7091|pmc=4121056|pmid=19844228|pàgines=S22–S32|volum=6|exemplar=11 0|doi=10.1038/nmeth.1371|nom=Shirley|cognom=Pepke|nom2=Barbara|cognom2=Wold|nom3=Ali|cognom3=Mortazavi}}</ref> |
||
=== MeDIP-seq === |
=== MeDIP-seq === |
||
Línia 54: | Línia 58: | ||
Els programes emprats per a desenvolupar els ''peak callings'' s'anomenen '''''peak callers'''''. Una de les característiques comunes per a tots els ''peak callers'' és que l'[[:en:Input_(computer_science)|entrada]] són lectures mapades i la comparen amb genomes linears de referència.<ref name=":1" /> Els programes més emprats són: |
Els programes emprats per a desenvolupar els ''peak callings'' s'anomenen '''''peak callers'''''. Una de les característiques comunes per a tots els ''peak callers'' és que l'[[:en:Input_(computer_science)|entrada]] són lectures mapades i la comparen amb genomes linears de referència.<ref name=":1" /> Els programes més emprats són: |
||
* MACS |
* MACS |
||
* |
* Spp |
||
* Gràfic de ''peak calling'' |
* Gràfic de ''peak calling'' |
||
* HiChIP |
* HiChIP |
||
=== MACS ( |
=== MACS (Anàlisi de Dades de ChIP-seq Basat en Models) === |
||
El MACS (de l'anglès ''Model-based Analysis of ChIP-Seq data'') és un [[Algorisme|algoritme]] que permet optimitzar els resultats en comparació al ''ChIP-chip'' de diferents formes: |
El MACS (de l'anglès ''Model-based Analysis of ChIP-Seq data'') és un [[Algorisme|algoritme]] que permet optimitzar els resultats en comparació al ''ChIP-chip'' de diferents formes: |
||
Línia 72: | Línia 76: | ||
# ''Window tag density'' (''WTD''): estén les etiquetes (''tag'') de les cadenes positiva i negativa segons la llargada esperada del fragment de DNA seleccionat. Els llocs d'unió es trobarant a les parts amb major solapament del fragment. |
# ''Window tag density'' (''WTD''): estén les etiquetes (''tag'') de les cadenes positiva i negativa segons la llargada esperada del fragment de DNA seleccionat. Els llocs d'unió es trobarant a les parts amb major solapament del fragment. |
||
# ''Matching Strand Peaks'' (''MSP''): determina quins són els pics locals segons les densitats específiques de les etiquetes |
# ''Matching Strand Peaks'' (''MSP'' ): determina quins són els pics locals segons les densitats específiques de les etiquetes, i identifica les posicions envoltades per pics de les cadenes positiva i negativa. |
||
# ''Mirror tag correlation'' (''MTC''): escaneja el genoma per a identificar les posicions que tenen paterns pronunciats en mirall a les cadenes positiva i negativa. És a dir, que tenen un pic en ambdues cadenes. |
# ''Mirror tag correlation'' (''MTC''): escaneja el genoma per a identificar les posicions que tenen paterns pronunciats en mirall a les cadenes positiva i negativa. És a dir, que tenen un pic en ambdues cadenes. |
||
Aquests tres mètodes han d'emprar un control de densitats d'etiquetes pe a corregir la distribució desigual de fons. |
Aquests tres mètodes han d'emprar un control de densitats d'etiquetes pe a corregir la distribució desigual de fons.<ref>{{Ref-publicació|article=Design and analysis of ChIP-seq experiments for DNA-binding proteins|exemplar=12|nom3=Peter J.|cognom2=Tolstorukov|nom2=Michael Y.|cognom=Kharchenko|nom=Peter V.|doi=10.1038/nbt.1508|volum=26|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2597701/|pàgines=1351–1359|pmid=19029915|pmc=2597701|issn=1087-0156|data=2008-12|publicació=Nature biotechnology|cognom3=Park}}</ref> Tot i que en tots tres mètodes hi ha una sensitibitat òptima, hi ha una diferència considerable en la precisió identificant les posicions d'unió. Aquesta diferència pot atribuir-se a la consideració dels patrons d'etiquetes colindant el centre del patró d'unió.<ref name=":4" /> |
||
=== Gràfic de ''peak calling'' === |
=== Gràfic de ''peak calling'' === |
||
El '''Gràfic de ''Peak Calling''''' (''Graph Peak Caller'' o ''GPC'') és nou mètode, presentat per ''Grytten, et al.'' el 2019,<ref name=":1" /> que converteix les lectures mapades per una ''ChIP-seq'' en un genoma de referència basat en gràfics. És una generalització gràfica del MACS2. |
El '''Gràfic de ''Peak Calling''''' (''Graph Peak Caller'' o ''GPC'') és nou mètode, presentat per ''Grytten, et al.'' el 2019,<ref name=":1" /> que converteix les lectures mapades per una ''ChIP-seq'' en un genoma de referència basat en gràfics. És una generalització gràfica del MACS2. |
Revisió del 17:44, 5 des 2020
El peak calling (en català: crida de pics) és un mètode computacional que permet identificar els llocs d'unió de proteïnes putatives.[1] En concret, aquest mètode permet identificar àrees del genoma enriquides amb lectures alineades per haver fet una seqüènciació per immunoprecipitació de cromatina (ChIP-seq, de Chromatin Immunoprecipitation sequencing) o de DNA metilat (MeDIP-seq, de Methylated DNA Immunoprecipitation sequencing).
Antecedents
A partir de l'any 2000 es van començar a desenvolupar els mètodes de seqüenciació de nova o de segona generació (NGS, de l'anglès New Generation Sequencing). Aquest nou mètode, en combinació amb el ChIP i el MeDIP, han revolucionat l'habilitat d'analitzar les interaccions dins del genoma de proteïnes i DNA.[2]
La identificació dels llocs d'unió de les proteïnes genòmiques a travès de la ChIP o de les metilacions a través de la MeDIP han necessitat de noves eines computacionals, diferents a les emprades anteriorment per als experiments ChIP-Chip, la qual combinava la ChIP i els xips de DNA (en anglès, DNA chip). Actualment hi ha més d'una quarantena de programes analítics, molts dels quals es basen en algoritmes per a cridar pics.[2]
El fet que molts dels algoritmes matemàtics siguin lliures ha permés que hi hagi un progrés elevat dels mateixos. Així, al 2014 els més populars eren el F-seq[3] i el Hotspot[4], útils sobretot per a DNAse-seq; el ZINBA (de l'anglès Zero-Inflated Negative Bionomial Algorithm)[5], útil també per a FAIRE-seq,ChIP-seq i RNA-seq[6]; el MACS[7] o l'Spp[8]. En l'actualitat s'ha arribat a fer gràfiques (Graphic Peak Calling)[9] i seqüenciacions en 3-D com amb el HiChIP[10].
Procediment per a trobar pics
Per a dur a terme un peak calling cal primer saber quin tipus d'experiment volem dur a terme. En el ChIP, es poden emprar una o dues mostres, depenent de si només tenim la mostra problema o si tenim també un control, respectivament. Tot i això, el més recomanat és emprar controls per assegurar que es troben pics significatius i rellevants.
Les passes a seguir un cop sabem el tipus d'experiment que volem dur a terme són:
- Creació d'un perfil de senyal
- Selecció de llocs candidats
- Càlcul de la significança
- Determinar el llindar
Creació d'un perfil de senyal
El perfil ChIP s'obtè suavitzant el comptatge de les etiquetes amb o sense correcció del canvi d'etiquetes o tag-shifting (com podria ser la diferència en la distància genòmica entre les etiquetes observsades i la posició real del lloc d'unió). Això ajuda en la intrapolació dels comptatges no observats degut a la baixa mapabilitat o cobertura, millorant la resolució i l'exclusió dels artegactres. Per a dur a terme aquesta passa, hi ha multitud de programes que es poden emprar amb característiques diferents.
Calling peaks
Un cop es té el perfil, cada unitat ha de tenir una senyal absoluta de ChIP o un enriquiment relatiu en comparació al fons (o background en anglès) per a poder ser considerat un pic candidat. Aquesta selecció té dos principals utilitats. La primera és que els pics candidats seleccionats en aquesta passa s'empren per a estimar la mida del fragment i la distància del canvi d'etiquetes. La segona és que les regions que no se solapen amb els pics s'empren per a estimar els paràmetres del control negatiu.
Càlcul de la significança dels pics
Es poden aplicar diferents models de fons per a cada pic candidat. L'opció més habitual és la distribució de Poisson[11], assumint un efecte uniforme del control negatiu sobre el genoma. La distribució binomial és un model alternatiu per a efectes no-uniformes, però cal primer normalitzar la taxa de la mostra entre el ChIP i el control negatiu en una regió on no s'uneixi res.[12]
Determinació de llindar
Donades les puntuacions dels pics, cal seleccionar un valor llindar. Quan els valors p estan disponibles, es poden emprar per a calcular la taxa de descobriment falsa (o FDR, de l'anglès False Discovery Rate).[13] En cas de no tenir valos p, es pot calcular empíricament l'FDR mostrejant les etiquetes del control i de les dades ChIP. En aquest cas, l'FDR es defineix com una taxa dle nombre de pics en el control amb el del ChIP.
La passa de després del processament considera els efectes canvis d'etiqueta i prediu la mida del fragment a partir d'una biblioteca. En el cas de l'Spp, es fa una autocorrecció entre el comptatge d'etiquetes de les cadenes positiva i negativa.[14]
Mètodes de seqüenciació de DNA
ChIP-seq
Pel que respecta la ChIP-seq, l'enriquiment es fa a aquells fragments de cromatina que tenen una interacció proteïna-DNA, les quals es basen en reticulacions mediades per formaldehid. Quan aquesta proteïna és un factor de transcripció (TF), l'àrea enriquida és un lloc d'unió del factor de transcripció (o TFBS, de l'anglès TF Binding Site).[2] La combinació paral·lela de la ChIP i la seqüenciació total de genoma (el ChIP-seq en si) permeten analitzar el patró d'interacció de qualsevol proteïna amb el DNA o el patró de qualsevol modificació epigenètica de la cromatina, sobretot TFs.[15][9] Tant el ChIP-chip com el ChIP-seq han facilitat enormement la definició del cistroma dels TF i altres proteïnes associades a la cromatina.[16]
Els tipus de pics que es poden obtenir amb la ChIP-seq es poden classificar en tres grups segons la quantitat de parells de bases:
- Puntuals: ~100
- Localitzats però amples: ~1 kb
- Amples: ~100 kb
El poder predictiu de les eines existents depenen del tipus de dades a processar.[17]
[AFEGIR IMATGE doi:10.1038/nbt.1508]
MeDIP-seq
Pel que fa a la MeDIP-seq, l'enriquiment es fa a seqüències de DNA metilades. Aquestes seqüències poden canviar l'activitat del segment de DNA sense canviar la seqüència. Normalment, les metilacions reprimeixen la transcripció dels gens sobre els quals actua.[18]
Així doncs, la diferència entre la ChIP-seq i la MeDIP-seq rau en el fet que la primera analitza si hi ha interacció o no (pot ser activant o reprimint la transcripció) i la segona analitza si hi ha metilació (repressió) o no (activació).
Programari: peak callers
Els programes emprats per a desenvolupar els peak callings s'anomenen peak callers. Una de les característiques comunes per a tots els peak callers és que l'entrada són lectures mapades i la comparen amb genomes linears de referència.[9] Els programes més emprats són:
- MACS
- Spp
- Gràfic de peak calling
- HiChIP
MACS (Anàlisi de Dades de ChIP-seq Basat en Models)
El MACS (de l'anglès Model-based Analysis of ChIP-Seq data) és un algoritme que permet optimitzar els resultats en comparació al ChIP-chip de diferents formes:
- Millora en la resolució espacial dels llocs predits.
- Utilitza el paràmetre λlocal (paràmetre de la distribució de Poisson) per a capturar biaixos locals en el genoma i millora la robustesa i l'especificitat de la predicció.
- No calen controls quan és aplicada a ChIP-seq, així com millora els resultats quan hi ha control.
- Proporciona informació detallada per a cada pic (com les coordenades del genoma o el p-value).
Posteriorment es va desenvolupar el MACS2, el qual conté subcomandes i la possibilitat de combinar-les entre elles per a controlar cada passa i analitzar les dades de forma més personalitzada.[19]
Spp (Canalització de Processament ChIP-Seq)
L'Spp (de l'anglès ChIP-Seq Processing Pipeline) es va desenvolupar específicament per a detectar acuradament posicions de llocs d'unió a proteïnes introduint mètodes per a millorar l'alineació d'etiquetes i corregint les senyals de fons. L'Spp introdueix tres mètodes de peak calling:
- Window tag density (WTD): estén les etiquetes (tag) de les cadenes positiva i negativa segons la llargada esperada del fragment de DNA seleccionat. Els llocs d'unió es trobarant a les parts amb major solapament del fragment.
- Matching Strand Peaks (MSP ): determina quins són els pics locals segons les densitats específiques de les etiquetes, i identifica les posicions envoltades per pics de les cadenes positiva i negativa.
- Mirror tag correlation (MTC): escaneja el genoma per a identificar les posicions que tenen paterns pronunciats en mirall a les cadenes positiva i negativa. És a dir, que tenen un pic en ambdues cadenes.
Aquests tres mètodes han d'emprar un control de densitats d'etiquetes pe a corregir la distribució desigual de fons.[20] Tot i que en tots tres mètodes hi ha una sensitibitat òptima, hi ha una diferència considerable en la precisió identificant les posicions d'unió. Aquesta diferència pot atribuir-se a la consideració dels patrons d'etiquetes colindant el centre del patró d'unió.[8]
Gràfic de peak calling
El Gràfic de Peak Calling (Graph Peak Caller o GPC) és nou mètode, presentat per Grytten, et al. el 2019,[9] que converteix les lectures mapades per una ChIP-seq en un genoma de referència basat en gràfics. És una generalització gràfica del MACS2.
La informació de sortida (output) del GPC consisteix en una gràfics d'intervals. Aquests gràfics es poden convertir en posicions aproximades en un genoma linear de referència, cosa que permet l'anàlisi de pics en base a biblioteques de pics ja trobats.[9] En comparar els resultats del GPC amb el MACS2, es comprova que el primer troba seqüències enriquides que no troba el segon. El GPC també arriba a analitzar més del doble de parells de bases en comparació al MACS2. Això permet cobrir més variacions del genoma linear de referència.[9]
El funcionament del GPC es basa en:
a) Lectura sense processar (raw read). Lles lectures d'entrada (blau) i les control (roig) es mapen en el genoma de referència basat en gràfics i es filtra en base a la qualitat de mapatge.
b) Muntatge dels fragments estenent els alineaments de l'entrada forward i reverse al llarg de tots els camins possibles segons la direcció corresponent.
c) Creació d'una pista de fons (background track) projectant els resultats de l'alineament de les lectures control sobre el camí linear. Després es calcula la mitjana de les lectures locals i el resultat, que és linear, es projecta de nou en la gràfica. El muntatge de fragments es crea com a quantitat (counts) i la pista de fons es tracta com una taxa (rate) en una distribució de Poisson. El valor p es calcula per a cada posició en les quantitats observades, segons la taxa corresponent.
d) S'ajusten els valors q.
e) Es produeix una sèrie d'àrees amb pics candidates amb buits entre ells.
f) Els buits petits s'omplen, donant una sèrie de subgràfics de pic (subgràfics connectats).
g) El GPC troba només un únic camí màxim ("maximum path"), que s'aconsegueix seleccionant el camí que té el nombre més gran de lectures d'entrada mapat en ell.
HiChIP-peak
El HiChIP és una tècnica recentment desenvolupada per a analitzar la conformació de la cromatina i que se centra en la conformació de les proteïnes de la cromatina. Això permet millorar per 10 la lectura de la informació conformacional i reduir per 100 els requeriments d'entrada en comparació al ChIA-PET.[21] Consisteix en una preparació in situ d'una llibreria Hi-C[22] seguida d'una ChIP, normalment per a modificacions en la histona H3K27ac o en la cohesina.[10] Aquesta és la innovació principal de la tècnica, la combinació dels biaixos d'aquestes dues tècniques (Hi-C i ChIP), permetent que només es calguin sets de dades HiChIP.
El mètode HiChIP (figura de la dreta) consisteix en una reticulació de les cèl·lules i posades en contacte in situ. El nucli es sonica i es duu a terme la ChIP, moment en què s'enriqueixen els contactes associats amb proteïnes d'interès. Els contactes biotinilats són identificats i es generen llibreries de seqüències utilitzant la transposasa Tn5.[21]
Els beneficis respecte d'altres mètodes és l'abaratiment de despeses, la major sensibilitat, la necessitat de menors quantitats d'entrades i requeriments per a la seqüenciació reduïdes.[21] Tot i això, hi ha massa poques eines específiques per a analitzar dades HiChIP, ja que la majoria encara utilitzen en dades Hi-C.
Teòricament, és possible extreure dos tipus diferents d'informació de les dades HiChIP: la posició de regions enriquides (o pics) per a la ChIP i les interaccions de llarg abast que involucren aquestes regions.[10]
Referències
- ↑ Wilbanks, Elizabeth G.; Facciotti, Marc T. «Evaluation of Algorithm Performance in ChIP-Seq Peak Detection» (en anglès). PLOS ONE, 5, 7, 07-08-2010, pàg. e11471. DOI: 10.1371/journal.pone.0011471. ISSN: 1932-6203. PMC: PMC2900203. PMID: 20628599.
- ↑ 2,0 2,1 2,2 Stanton, Kelly P.; Jin, Jiaqi; Lederman, Roy R.; Weissman, Sherman M.; Kluger, Yuval «Ritornello: high fidelity control-free chromatin immunoprecipitation peak calling». Nucleic Acids Research, 45, 21, 01-12-2017, pàg. e173. DOI: 10.1093/nar/gkx799. ISSN: 1362-4962. PMC: 5716106. PMID: 28981893.
- ↑ Boyle, Alan P.; Guinney, Justin; Crawford, Gregory E.; Furey, Terrence S. «F-Seq: a feature density estimator for high-throughput sequence tags». Bioinformatics, 24, 21, 01-11-2008, pàg. 2537–2538. DOI: 10.1093/bioinformatics/btn480. ISSN: 1367-4803. PMC: 2732284. PMID: 18784119.
- ↑ John, Sam; Sabo, Peter J.; Thurman, Robert E.; Sung, Myong-Hee; Biddie, Simon C. «Chromatin accessibility pre-determines glucocorticoid receptor binding patterns» (en anglès). Nature Genetics, 43, 3, 2011-03, pàg. 264–268. DOI: 10.1038/ng.759. ISSN: 1546-1718. PMC: PMC6386452. PMID: 21258342.
- ↑ Rashid, Naim U.; Giresi, Paul G.; Ibrahim, Joseph G.; Sun, Wei; Lieb, Jason D. «ZINBA integrates local covariates with DNA-seq data to identify broad and narrow regions of enrichment, even within amplified genomic regions». Genome Biology, 12, 7, 25-07-2011, pàg. R67. DOI: 10.1186/gb-2011-12-7-r67. ISSN: 1474-760X.
- ↑ Koohy, Hashem; Down, Thomas A.; Spivakov, Mikhail; Hubbard, Tim «A Comparison of Peak Callers Used for DNase-Seq Data» (en anglès). PLoS ONE, 9, 5, 08-05-2014, pàg. e96303. DOI: 10.1371/journal.pone.0096303. ISSN: 1932-6203. PMC: PMC4014496. PMID: 24810143.
- ↑ Zhang, Yong; Liu, Tao; Meyer, Clifford A; Eeckhoute, Jérôme; Johnson, David S «Model-based Analysis of ChIP-Seq (MACS)». Genome Biology, 9, 9, 2008, pàg. R137. DOI: 10.1186/gb-2008-9-9-r137. ISSN: 1465-6906. PMC: 2592715. PMID: 18798982.
- ↑ 8,0 8,1 Kharchenko, Peter V.; Tolstorukov, Michael Y.; Park, Peter J. «Design and analysis of ChIP-seq experiments for DNA-binding proteins» (en anglès). Nature Biotechnology, 26, 12, 2008-12, pàg. 1351–1359. DOI: 10.1038/nbt.1508. ISSN: 1546-1696.
- ↑ 9,0 9,1 9,2 9,3 9,4 9,5 Grytten, Ivar; Rand, Knut D.; Nederbragt, Alexander J.; Storvik, Geir O.; Glad, Ingrid K. «Graph Peak Caller: Calling ChIP-seq peaks on graph-based reference genomes» (en anglès). PLOS Computational Biology, 15, 2, 19-02-2019, pàg. e1006731. DOI: 10.1371/journal.pcbi.1006731. ISSN: 1553-7358. PMC: PMC6396939. PMID: 30779737.
- ↑ 10,0 10,1 10,2 Shi, Chenfu; Rattray, Magnus; Orozco, Gisela. «HiChIP-Peaks: A HiChIP peak calling algorithm», 27-06-2019. [Consulta: 3 desembre 2020].
- ↑ Robertson, Gordon; Hirst, Martin; Bainbridge, Matthew; Bilenky, Misha; Zhao, Yongjun «Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing» (en anglès). Nature Methods, 4, 8, 2007-08, pàg. 651–657. DOI: 10.1038/nmeth1068. ISSN: 1548-7091.
- ↑ Xu, Han; Handoko, Lusy; Wei, Xueliang; Ye, Chaopeng; Sheng, Jianpeng «A signal–noise model for significance analysis of ChIP-seq with negative control» (en anglès). Bioinformatics, 26, 9, 01-05-2010, pàg. 1199–1204. DOI: 10.1093/bioinformatics/btq128. ISSN: 1460-2059.
- ↑ Zang, Chongzhi; Schones, Dustin E.; Zeng, Chen; Cui, Kairong; Zhao, Keji «A clustering approach for identification of enriched domains from histone modification ChIP-Seq data» (en anglès). Bioinformatics, 25, 15, 01-08-2009, pàg. 1952–1958. DOI: 10.1093/bioinformatics/btp340. ISSN: 1460-2059. PMC: PMC2732366. PMID: 19505939.
- ↑ Kim, Hyunmin; Kim, Jihye; Selby, Heather; Gao, Dexiang; Tong, Tiejun «A short survey of computational analysis methods in analysing ChIP-seq data» (en anglès). Human Genomics, 5, 2, 2011, pàg. 117. DOI: 10.1186/1479-7364-5-2-117. ISSN: 1479-7364. PMC: PMC3525234. PMID: 21296745.
- ↑ Johnson, David S.; Mortazavi, Ali; Myers, Richard M.; Wold, Barbara «Genome-Wide Mapping of in Vivo Protein-DNA Interactions» (en anglès). Science, 316, 5830, 08-06-2007, pàg. 1497–1502. DOI: 10.1126/science.1141319. ISSN: 0036-8075. PMID: 17540862.
- ↑ «TFmapper: A Tool for Searching Putative Factors Regulating Gene Expression Using ChIP-seq Data». DOI: 10.7150/ijbs.28850. [Consulta: 2 desembre 2020].
- ↑ Pepke, Shirley; Wold, Barbara; Mortazavi, Ali «Computation for ChIP-seq and RNA-seq studies». Nature methods, 6, 11 0, 2009-11, pàg. S22–S32. DOI: 10.1038/nmeth.1371. ISSN: 1548-7091. PMC: 4121056. PMID: 19844228.
- ↑ Li, Heng; Ruan, Jue; Durbin, Richard «Mapping short DNA sequencing reads and calling variants using mapping quality scores» (en anglès). Genome Research, 18, 11, 01-11-2008, pàg. 1851–1858. DOI: 10.1101/gr.078212.108. ISSN: 1088-9051. PMC: PMC2577856. PMID: 18714091.
- ↑ «Advanced: Call peaks using MACS2 subcommands» (en anglès). Liu, T., 22-03-2017. [Consulta: 2 desembre 2020].
- ↑ Kharchenko, Peter V.; Tolstorukov, Michael Y.; Park, Peter J. «Design and analysis of ChIP-seq experiments for DNA-binding proteins». Nature biotechnology, 26, 12, 2008-12, pàg. 1351–1359. DOI: 10.1038/nbt.1508. ISSN: 1087-0156. PMC: 2597701. PMID: 19029915.
- ↑ 21,0 21,1 21,2 Mumbach, Maxwell R.; Rubin, Adam J.; Flynn, Ryan A.; Dai, Chao; Khavari, Paul A. «HiChIP: Efficient and sensitive analysis of protein-directed genome architecture» (en anglès). bioRxiv, 08-09-2016, pàg. 073619. DOI: 10.1101/073619.
- ↑ Lieberman-Aiden, Erez; Berkum, Nynke L. van; Williams, Louise; Imakaev, Maxim; Ragoczy, Tobias «Comprehensive Mapping of Long-Range Interactions Reveals Folding Principles of the Human Genome» (en anglès). Science, 326, 5950, 09-10-2009, pàg. 289–293. DOI: 10.1126/science.1181369. ISSN: 0036-8075. PMC: PMC2858594. PMID: 19815776.
Vegeu també
Enllaços externs
- https://www.biorxiv.org/content/10.1101/073619v1.full
- Design and analysis of ChIP-seq experiments for DNA-binding proteins - https://www.nature.com/articles/nbt.1508
- Peak calling by Sparse Enrichment Analysis for CUT&RUN chromatin profiling - https://pubmed.ncbi.nlm.nih.gov/31300027/
- hichip: https://academic.oup.com/bioinformatics/article/36/12/3625/5811234
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3375645/
- http://bioinformatics.sph.harvard.edu/ngs-workshops/courses/introduction-to-chip-seq/