Ensembl

De Viquipèdia
Salta a la navegació Salta a la cerca
Projecte Ensembl
Ensembl logo.png
Logotip del projecte
Descripció
Nom Ensembl
Eina Navegador genòmic
Primera publicació Hubbard, et al. (2002)[1]
Desenvolupament
Institucions involucrades Institut Bioinformàtic Europeu
Wellcome Trust Sanger Institute
Seu Cambridge, Regne Unit
Fundació 1999
Accés
http://www.ensembl.org
Modifica les dades a Wikidata

Ensembl és un projecte científic conjunt entre l'Institut Bioinformàtic Europeu i el Wellcome Trust Sanger Institute (ambdós amb seu a Cambridge, Regne Unit), el qual va ser fundat el 1999 com a resposta a la finalització imminent del Projecte del Genoma Humà.[2] Després de 10 anys d'existència, l'objectiu d'Ensembl segueixent sent proporcionar un recurs centralitzat per genetistes, biòlegs moleculars i altres investigadors que estudien els genomes de l'espècie humana i d'altres vertebrats i organismes model.[3] Ensembl és un dels recursos digitals més emprats de la xarxa de navegadors de genomes quant a recerca d'informació genòmica.

Aquesta base de dades i d'altres similars es troben acollides al cercador genèric NCBI i a la Universitat de Califòrnia, Santa Cruz (UCSC).

Rerefons del projecte[modifica]

Al projecte Ensembl, les dades de la seqüència s'introdueixen en un sistema d'anotació de gens (una col·lecció de programari amb arquitectura en pipeline i escrit en Perl) que crea un conjunt d'ubicacions de gens predits i els guarda en una base de dades MySQL per a la seva posterior anàlisi i visualització. Ensembl converteix les dades en unes lliure accés per a la comunitat investigadora mundial. Totes les dades i el codi produït pel projecte Ensembl està disponible per a descarregar, i també hi ha un servidor de bases de dades d'accés públic que permet l'accés remot. A més a més, ofereix visualitzacions digitals de les dades seleccionades.[4]

Tot i que els seus orígens estaven centrats en el genoma humà, al llarg del temps el projecte s'ha expandit per incloure espècies addicionals - incloent-hi organismes de model clau com el ratolí, la mosca del vinagre i el peix zebra - així com una gamma més àmplia de dades genòmiques, incloent variacions genètiques i característiques reguladores. D'ençà abril de 2009, es va escindir un nou projecte associat, Ensembl Genomes, que ha estès l'abast de Ensembl a metazous, plantes, fongs, bacteris, i protists, mentre que el projecte original continua enfocat en vertebrats.[5]

Divisions i camps de treball[modifica]

El projecte actualment es divideix en 8 seccions de treball, que ocupen uns 50 treballadors:[6]

  • Genebuild: Crea els conjunts de gens per a les diferents espècies.
  • Programari Core: Manté el nucli de la Interfície de programació d'aplicacions (API).
  • Compara: Produeix dades comparatives i les API relacionades.
  • Variation: Produieix dades de variació i API.
  • Regulation: Controla l'estructura regulatòria i l'API FuncGen.
  • Web Team: Manté i desenvolupa el lloc web Ensembl a nivell general.
  • Production: Gestiona els cicles d'alliberament de noves versions de programari Ensembl i l'Ensembl BioMart.
  • Outreach: Proporciona servei d'assistència i tallers.

Visualització de dades genòmiques[modifica]

Situació al cromosoma del gen BRCA2 a través d'una visualització de l'Ensembl.

Un dels conceptes principals d'Ensembl és l'habilitació automàtica de generar visualitzacions gràfiques de l'alineament de gens i altres dades genòmiques vers un genoma de referència. Aquestes visualitzacions són mostrades com a pistes de dades, en què les pistes individuals poden ser adaptades permetent l'usuari fer modificacions en la interfície segons convingui als seus interessos de recerca: zooms en diferents regions, moviments al llarg del genoma en qualsevol direcció, etc.

Per altra banda, hi ha opcions de visualització de cariotips sencers basant-se en seqüències nucleotídiques i aminoacídiques, o representacions d'arbres filogenètics de gens homòlegs a través d'una varietat d'espècies. Els gràfics es complementen amb pantalles tabulars, i en molts casos, les dades es poden exportar directament des de la pàgina en una varietat de formats d'arxiu estàndard, com ara el format FASTA.[4]

Les dades produïdess externament també poden ésser afegides a la pantalla, ja sigui a través d'un servidor DAS (Distributed Annotation System), o bé carregant un arxiu adequat en un dels formats suportats, com ara BAM, LLIT o PSL.

Els gràfics es generen usant un conjunt de mòduls de Perl personalitzats i basats en GD, el mètode estàndard Perl per a la visualització de gràfics.

Vegeu també[modifica]

Enllaços externs[modifica]

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Ensembl Modifica l'enllaç a Wikidata

Referències[modifica]

  1. Hubbard T., et al. «The Ensembl genome database project» (en anglès). Nucleic Acid Res., 30, 1, gener 2002, pàg. 38-41. PMID: 11752248 [Consulta: 27 febrer 2015].
  2. Flicek P, Amode MR, Barrell D, et al. «Ensembl 2011» (Database issue) (en anglès). Nucleic Acids Res, 39, novembre 2010, pàg. D800–D806. DOI: 10.1093/nar/gkq1064. PMC: 3013672. PMID: 21045057 [Consulta: 27 febrer 2015].
  3. Flicek P, Aken BL, Ballester B, et al. «Ensembl's 10th year» (Database issue) (en anglès). Nucleic Acids Res., 38, gener 2010, pàg. D557–62. DOI: 10.1093/nar/gkp972. PMC: 2808936. PMID: 19906699 [Consulta: 27 febrer 2015].
  4. 4,0 4,1 Birney, Ewan; Andrews, T. Daniel; Bevan, Paul; Caccao, Mario «An Overview of Ensembl» (en anglès). Genome Research, 14, 5, maig 2004, pàg. 925-928. DOI: 10.1101/gr.1860604.
  5. Kersey, P. J.; Staines, D. M.; Lawson, D; Kulesha, E. «Ensembl Genomes: An integrative resource for genome-scale data from non-vertebrate species» (en anglès). Nucleic Acids Research, 40 (Database issue), pàg. D91–D97. DOI: 10.1093/nar/gkr895.
  6. «About us» (en anglès). Ensembl Blog. [Consulta: 27 febrer 2015].