Методы, использующиеся биоинформатикой для анализа макромолекул и создания лекарств. Часть 1. - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Методы, использующиеся биоинформатикой для анализа макромолекул и создания лекарств. Часть 1.

Печать E-mail
Автор Арчаков А.И.   
17.10.2008 г.

Часть 1.  Анализ геномов – что можно извлечь из генетических текстов

<a href='http://www.bioinformatix.ru/bioinformatika/' target='_self'>Биоинформатика</a>: Лаборатория биоинформатикиК настоящему времени полностью расшифрованы геномы около 30 биологических видов. В ближайшие годы ожидается завершение работ по анализу геномов еще несколько десятков видов, среди них – геномы ряда патогенных микроорганизмов; микроорганизмов, находящих применение в биотехнологии; геномов млекопитающих, в том числе – человека. Информация о геномах указанных видов предоставлена для свободного доступа на Web-серверах ряда организаций, которые занимаются собственно расшифровкой геномов (например, The Sanger Centre, Wellcome Trust, Великобритания; The Institute of Genomic Research, США), хранением и систематизацией медико-биологической и биотехнологической информации (например, National Center for Biotechnology Information, США), ее компьютерным анализом, а также активно использующих такую информацию в прикладных и фундаментальных исследованиях (например, Institut Pasteur, Франция).

Базы данных (БД) геномов содержат нуклеотидные последовательности и "транслированные" по ним аминокислотные последовательности белков. В большинстве БД также содержатся дополнительные данные, как экспериментальные (например, значимость гена для выживаемости организма), так и полученные расчетным путем (например, функция белка, кодируемого геном, может быть постулирована на основе сходства его аминокислотной последовательности с первичной структурой уже охарактеризованного белка).

Web-серверы, предоставляющие пользователю генетическую информацию, оснащены комплексом программных средств для поиска в БД и анализа нуклеотидных и аминокислотных последовательностей. В качестве запросов при поиске последовательностей в БД могут использоваться номенклатурные названия генов, организмов, ключевые слова и др.

Ядро любой генетической информационной системы составляет программа поиска в БД гомологов последовательности, заданной пользователем. Обычно используются программы BLAST или FastA. Кроме того, на Web-серверах представлены программные средства, позволяющие рассчитать некоторые физико-химические свойства белка (например, изоэлектрическую точку), предсказывать вторичную структуру, наличие и локализацию трансмембранных участков и т.  д . Такие данные часто используются при выполнении широкого круга исследований.

Перечисленные программные средства позволяют ориентировочно установить некоторые характеристики отдельного выбранного белка. Вместе с тем, возможности выполнения операций с группами последовательностей как правило, ограничены, что не позволяет осуществлять сравнительный анализ целых геномов или больших групп последовательностей. Это ограничение значительно затрудняет решение с использованием этих программных средств задач по прогнозированию структурно-функциональных взаимосвязей для групп белков и поиску потенциальных молекулярных мишеней лекарственных препаратов на основе сравнительного анализа генетической информации.

После определения последовательности генома необходимо выделить в его составе отдельные гены. Задача включает в себя определение локализации отдельных генов в нуклеотидной последовательности и идентификацию их границ и решается с применением методов биоинформатики. Эти методы позволяют определить с высокой степенью вероятности, является ли ген интроном или экзоном, а также является ли ген структурным или регуляторным. Используемые для этого подходы основаны на сравнении изучаемого генома с геномами, охарактеризованными ранее. Для локализации генов наилучшие результаты дает комбинация методов определения открытых рамок считывания и различий в частоте использования кодонов. Наиболее часто используемые компьютерные программы – GeneMark (Borodovsky, 1993), GenomeBrowser (Robinson, 1995), BLAST (Altschul, 1990), BLAZE или MPsrch (MPsrch).

Когда "разметка" генома выполнена, осуществляется функциональная классификация отдельных генов. Задача решается путем поиска последовательностей, гомологичных рассматриваемому гену, в базах данных ранее охарактеризованных генов и белков. Таким образом, функция нового гена прогнозируется, исходя из функции гомологов. Далее, путем выравнивания исследуемой последовательности с ее гомологами можно выявить в ней мотивы, ответственные за функцию белка, например - формирующие активный центр фермента. Сопоставлением групп последовательностей можно обнаружить, какие белки образуют функциональные комплексы, в реализации каких метаболических путей они принимают участие.

На следующем этапе осуществляют поиск новых потенциальных мишеней для действия лекарственных средств. Проблема поиска мишеней встала особенно остро в связи с ситуацией, сложившейся в области создания новых противомикробных средств. Во многих случаях возможности воздействия лекарств на известные белки-мишени - практически исчерпаны (как, например, в случаях ВИЧ, вирусов гриппа, микобактерий туберкулеза и др.). Это обусловило необходимость поиска новых молекулярных мишеней для лекарств. С другой стороны, применение современных эффективных подходов к созданию новых лекарств требует детального изучения потенциальной молекулярной мишени. При создании нового противомикробного средства необходимо также учитывать его возможный спектр действия и вероятные побочные эффекты. Перечисленные факторы создают предпосылки для использования генетической информации при выборе мишеней для действия противомикробных средств.

В 1999 году была опубликована первая работа, описывающая попытку выбора мишеней для действия лекарственных средств на основании сравнительного анализа генетической информации. Программа CATS (Computer-Aided Target Selection) была разработана с целью автоматизации выбора молекулярных мишеней для поиска новых противогрибковых средств (Spaltman, 1999). Вместе с тем, авторы преследовали цель создать достаточно гибкую систему, которая могла бы быть также использована применительно к другим фармакологическим группам.

Программа CATS предназначена для анализа геномов с целью поиска белков, которые могли бы рассматриваться как наиболее предпочтительные мишени для действия лекарственных веществ. В качестве входной информации программа использует аминокислотные последовательности, соответствующие генам рассматриваемого микроорганизма, сравнниваемых геномов и сопутствующую информацию.

Такой подход позволяет автоматизировать выбор потенциальных мишеней и определить приоритеты более детального изучения каждой из них, что сокращает число рассматриваемых объектов с нескольких тысяч до десятков.

Как видно из рассмотренного в данном разделе материала, подход к конструированию лекарств на основе биоинформатики носит комплексный характер: уже на стадии анализа генетических текстов (сравнительный анализ целых геномов, отдельных генов) приходится принимать во внимание известную на конкретный момент информацию о структуре и функции ряда белков из различных организмов, возможности создания метода тестирования, возможности построения модели 3D структуры выбранной мишени, и ряд других факторов.

 

Читайте также:

Биоинформатика: геном уникальности
Биоинформатика: Виртуальный эксперимент в шаге от реальности. Часть 1
Последнее обновление ( 03.04.2009 г. )
 
« Пред.   След. »