Базы данных по биоинформатике - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Базы данных по биоинформатике - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Базы данных по биоинформатике

Печать E-mail
Автор Николай   
23.07.2008 г.
Биолог в биоинформатике обычно имеет дело с базами данных и инструментами их анализа. В настоящее время существуют сотни Web-сайтов, которые доступны для обзора и поиска данных по молекулярной биологии и другим смежным дисциплинам. Каждая из них имеет свой формат хранения данных, различную степень избыточности, взаимосвязи с родственными или аналогичными базами данных. Каждая база данных имеет также свои средства доступа к информации - различные поисковые программы, программные средства визуализации, пополнения базы. Крупнейшие хранилища первичных структур ДНК и аминокислотных последовательностей (такие, как EMBL, GenBank, DDBJ, SWISS-PROT, PIR и др.) пополняются аннотированными последовательностями непосредственно исследователями, расшифровавшими их, с помощью автоматизированной системы пополнения баз данных по сети Интернет.

Конечно, впоследствии эти данные проверяются персоналом администраций баз данных и существенно пополняются. Вторым основным источником информации во всех базах является специальная научная литература. Многие базы данных, работающие над коллекционированием однородной информации, координируют свои усилия, осуществляя международное разделение труда, это можно проиллюстрировать примером сотрудничества трех всемирных коллекций последовательностей нуклеотидов EMBL (Европа), GenBank (США), DDBJ (Япония)

Наряду с общими базами данных в последнее время появилось много специализированных информационных ресурсов. Многие из них хранят данные, полученные с помощью компьютерных методов, результаты теоретических предсказаний. Большую роль в биоинформатике играют хранилища последовательностей ДНК и кДНК, специализированные базы данных по отдельным регуляторным мотивам нуклеотидных последовательностей, базы данных по экспрессии генов, библиотеки геномов, карт, последовательностей РНК, белков, белковых мотивов, по продукции белков. Есть базы данных по протеомике, структурам белков, мутациям , метаболическим путям и регуляции, по трансгеннным организмам, анатомии, биохимии,   а  также по научной литературе, по существующему в этих областях исследований программному обеспечению.

Теперь разберемся, какие базы данных бывают в зависимости от того, что в них помещают. Первый тип – архивные базы данных, это большая свалка, куда любой может поместить все, что захочет. К таким базам относятся

  • GeneBank & EMBL – здесь хранятся первичные последовательности
  • PDB – пространственные структуры белков,  и многое другое.

Второй тип – курируемые базы данных, за достоверность которых отвечает хозяева базы данных. Туда информацию никто не присылает, ее из архивных баз данных отбирают эксперты, проверяя достоверность информации – что записано в этих последовательностях, какие есть экпериментальные основания для того, чтобы считать, что эти последовательности выполняют ту или иную функцию.

К базам данных такого типа относятся:

  • Swiss- Prot – наиболее качественная база данных, содержащая аминокислотные последовательности белков
  • KEGG – информация о метаболизме
  • FlyBase – информация о Drosophila
  • COG – информация об ортологичных генах.

Поддержание базы требует работы кураторов или аннотаторов.

Третий тип – производные базы данных. Такие базы получаются в результате обработки данных из архивных и курируемых баз данных. Сюда входит:

  • SCOP – База данных структурной классификации белков (описывается структура белков)
  • PFAM – База данных по семействам белков
  • GO (Gene Ontology) – Классификация генов (попытка создания набора терминов, упорядочивания терминологии, чтобы один ген не назывался по разному, и чтобы разным генам не давали одинаковые названия)
  • ProDom – белковые домены
  • AsMamDB – альтернативный сплайсинг у млекопитающих
  • NCBI Entrez – доступ к информации о нуклеотидных и аминокислотных последовательностях и структурах
  • Ecocyc – все о E. coli – гены, белки, метаболизм и пр.(0)
 
Читайте также:
Биоинформатика: геном уникальности
Биоинформатика: Виртуальный эксперимент в шаге от реальности. Часть 1
Последнее обновление ( 06.04.2009 г. )
 
« Пред.   След. »


Copyright 2012 Bioinformatix.ru