DisGeNET

De la Viquipèdia, l'enciclopèdia lliure

DisGeNET és una plataforma de descobriment dissenyada per a abordar una gran varietat de qüestions relatives a la contribució genètica en malalties humanes. DisGeNET és una de les col·leccions més grans i completes d'associacions entre gens i malalties humanes (AGM) disponibles en l'actualitat.[1] També ofereix un conjunt d'eines bioinformàtiques per facilitar l'anàlisi d'aquestes dades per a diferents perfils d'usuari. DisGeNET és mantinguda pel Grup d'Informàtica Biomèdica Integrativa (IBI) Arxivat 2016-11-26 a Wayback Machine., del GRIB-IMIM-UPF, amb seu al Parc de Recerca Biomèdica de Barcelona (PRBB) a Barcelona (Catalunya).

Àmbit d'aplicació i accés[modifica]

En la cerca per reunir diferents aspectes del coneixement actual sobre les bases genètiques de les malalties humanes, DisGeNET conté informació en totes les àrees de malalties (Mendelianes, malalties complexes i ambientals). Amb més de 400 000 relacions genotip-fenotip provinents de fonts diferents integrades i explícitament anotades amb la procedència i el fonament, DisGeNET és un recurs per al descobriment de coneixement basat en l'evidència especialment valuós per la Recerca translacional. DisGeNET és un recurs d'accés obert que posa a disposició per a tota la comunitat una àmplia base de dades del coneixement actual sobre els gens i les seves malalties associades, conjuntament amb diferents eines per a la seva explotació i anàlisi. DisGeNET està disponible a través d'una interfície web, un plug-in de Cytoscape,[2] com 'dades vinculades' o el terme en anglès Linked Data en la web semàntica, un paquet en R, i també admet accés programàtic a les dades. Aquest conjunt d'eines permet la investigació dels mecanismes moleculars subjacents de les malalties d'origen genètic,[3] i està dissenyat per donar suport a l'explotació de dades des de diferents perspectives, i per cobrir les necessitats de diferents tipus d'usuari, des de bioinformàtics, biòlegs a professionals de la Salut.

Dades integrades[modifica]

La base de dades de DisGeNET integra més de 400 000 associacions entre més de 17 000 gens i més de 14 000 malalties extretes de diverses fonts curades per experts amb dades humanes i de models animals, amb AGMs extretes de MEDLINE utilitzant tècniques de mineria de dades basades en el processament del llenguatge natural.[4] Els aspectes més destacats de DisGeNET són la integració de dades de diferents orígens i diferents nivells d'evidència, la normalització usant vocabularis estàndard, i una anotació precisa i granulada a nivell d'associació de la seva procedència. La integració es realitza mitjançant mapatge de vocabularis tant per a gens com per a malalties, i utilitzant l'ontologia DisGeNET per a les associacions. D'altra banda, les AGM estan organitzades en funció del tipus i el nivell d'evidència com ara: CURATED (curada), PREDICTED (predita) i LITERATURE (bibliografia), i també són avaluades d'acord amb el volum i la mena de proves que les suporta per a prioritzar-les i facilitar-ne l'exploració.

Ontologia del tipus d'associació DisGeNET[modifica]

Per a la integració de les associacions entre gens i malalties, s'utilitza l'ontologia del tipus d'associació DisGeNET desenvolupada i mantinguda en l'IBI. Tots els diferents tipus d'associació tal com es troben anotades en les fonts de dades originals es representen com classes ontològiques, i s'estructuren formalment a partir de la classe pare 'AssociacióGenMalaltia', la qual dona entitat a la relació entre gen/proteïna i malaltia. És una ontologia OWL que es troba integrada en l'ontologia Sematicscience Integrated Ontology (SIO)[Enllaç no actiu], la qual proporciona els tipus i les relacions essencials per a una rica descripció d'entitats, processos i els seus atributs [5] Les classes DisGeNET en SIO es poden navegar des de la següent URL.

Cytoscape[modifica]

El plug-in o connector de DisGeNET en Cytoscape[2] ofereix representacions de les associacions entre gens i malalties en forma de xarxes o grafs. Les AGMs les representa en termes de grafs bipartits i, a més, proporciona representacions centrades en gen i en malaltia. Aquest tipus de representacions ajuden a l'usuari en la interpretació i exploració de malalties humanes complexes pel que fa al seu origen genètic mitjançant una varietat de funcions incorporades. Utilitzant el connector de DisGeNET a Cytoscape es poden fer consultes restringides a (i) la font de dades original, (ii) el tipus d'associació, (iii) la classe de trastorn d'interès i (iv) malalties o gens específics.

Linked Data[modifica]

La informació continguda en DisGeNET també es pot ampliar i complementar via l'ús de les tecnologies de la Web Semàntica i, enllaçar a una varietat de recursos que ja es troben presents en el núvol de Linked Open Data. Les dades de DisGeNET es distribueixen en formats RDF i Nanopublication. El DisGeNET-RDF és una forma alternativa d'accedir a les dades en DisGeNET i proporciona noves oportunitats per a la integració de dades, la consulta i, l'enllaç i integració de les dades en DisGeNET amb altres conjunts de dades RDF externs. Les distribucions de RDF i Nanopublication de DisGeNET s'han desenvolupat en el context del projecte Europeu Open PHACTS com a font d'informació rellevant relativa a malalties humanes en la base de coneixements en dades farmacològiques.

Projectes Europeus[modifica]

Vegeu també[modifica]

Referències[modifica]

  1. Piñero, J.; Queralt-Rosinach, N.; Bravo, A.; Deu-Pons, J.; Bauer-Mehren, A.; Baron, M.; Sanz, F.; Furlong, L. I. «DisGeNET: a discovery platform for the dynamical exploration of human diseases and their genes». Database, 2015, 0, 15-04-2015, pàg. bav028–bav028. DOI: 10.1093/database/bav028. PMC: 4397996. PMID: 25877637 [Consulta: 15 agost 2015].
  2. 2,0 2,1 Bauer-Mehren, A; Rautschka, M; Sanz, F; Furlong, LI «DisGeNET: a Cytoscape plugin to visualize, integrate, search and analyze gene-disease networks.». Bioinformatics (Oxford, England), 26, 22, 15-11-2010, pàg. 2924–6. DOI: 10.1093/bioinformatics/btq538. PMID: 20861032.
  3. Bauer-Mehren, A; Bundschus, M; Rautschka, M; Mayer, MA; Sanz, F; Furlong, LI «Gene-disease network analysis reveals functional modules in mendelian, complex and environmental diseases.». PLoS ONE, 6, 6, 14-06-2011, pàg. e20284. DOI: 10.1371/journal.pone.0020284.
  4. Bravo, À; Piñero, J; Queralt-Rosinach, N; Rautschka, M; Furlong, LI «Extraction of relations between genes and diseases from text and large-scale data analysis: implications for translational research.». BMC Bioinformatics, 16, 55, 21-02-2015, pàg. 1–39. DOI: 10.1186/s12859-015-0472-9.
  5. Dumontier, Michel; Baker, Christopher JO; Baran, Joachim; Callahan, Alison; Chepelev, Leonid; Cruz-Toledo, José; Del Rio, Nicholas R; Duck, Geraint; Furlong, Laura I «The Semanticscience Integrated Ontology (SIO) for biomedical research and knowledge discovery». Journal of Biomedical Semantics, 5, 1, 2014, pàg. 14. DOI: 10.1186/2041-1480-5-14.