Облако тегов

Авторизация


Телеконференции, научные статьи, исследования в медицине, биологии и экологии
 
 

Прикладные задачи биоинформатики

Печать E-mail
Автор Фролов Костя   
02.10.2008 г.
Одной из прикладных задач компьютерной биологии является применение вычислительных алгоритмов, используемых для анализа и систематизации генетической информации, выяснения структуры, динамики и функции макромолекул для создания новых лекарственных препаратов.

Область науки о компьютерном анализе генетических текстов, аминокислотных последовательностей, пространственной структуры и динамики белков, лежащем в основе определения макромолекул-мишеней, и поиск низкомолекулярных комплексов с целью создания новых лекарств превратилась в быстроразвивающееся направление биомедицины в конце 20-го века.

 
Весь процесс создания нового лекарственного соединения в ряде случаев может быть разделен на следующие этапы: (1) поиск мишени (например, белка) действия нового лекарства; (2) поиск низкомолекулярного соединения, обладающего нужным фармакологическим действием; (3) изучение этого соединения в эксперименте; (4) проведение испытаний в клинике. Лишь малый процент возможных кандидатов на лекарство проходит успешное клиническое испытание. Собственно компьютерными являются 1-й и 2-ой из перечисленных этапов.

Если пространственная структура белка-мишени известна, то применяют так называемые прямые методы компьютерного конструирования лекарств. Вначале устанавливают место связывания низкомолекулярного соединения (лекарства) и белка-мишени. Затем проводят анализ полученного комплекса с помощью молекулярной графики (так называемый докинг) с последующим молекулярно-динамическим и квантовохимическим расчетом. Все этапы этого расчета требуют высокопроизводительных вычислений. Уже самый первый этап поиска подходящего кандидата на лекарство связан с перебором сотен миллионов вариантов из соответствующей базы данных низкомолекулярных соединений. Последующие этапы расчета, как следует из вышесказанного, также требуют применения суперкомпьютеров.

В таблице 2 представлены методы и вычислительные затраты на полный расчет способности связывания низкомолекулярного соединения для различных размеров баз данных лекарств. Точность расчета, даваемого каждым из представленных методов, возрастает при движении от верхней части таблицы к ее нижней части. Из приведенного сравнения следует, что более точные методы могут оказаться неприемлемыми из-за чрезмерных затрат времени на вычисления. Оценка необходимых ресурсов при использовании квантовохимических методов для расчета энергии системы из 10416 флоп. На 100-терафлопной машине такой расчет займет 5 минут. тяжелых атомов приводит к величине ~10

Таблица 2. Оценки современных вычислительных потребностей для полного расчета энергии связывания всех низкомолекулярных соединений, входящих в различные базы данных.

Уровень сложности моделирования

Метод

Размер базы

Время расчета

Молекулярная механика

SPECTTOPE

140000

~ 1 часа

Жесткие лиганд/мишень

LUDI

30000

1 - 4 часа

Молекулярная механика

Hammerhead

80000

3 - 4 дня

Частично деформируемый лиганд

DOCK

17000

3 - 4 дня

Жесткая мишень

DOCK

53000

14 дней

Молекулярная механика

ICM

50000

21 день

Молекулярная механика

AMBER
CHARMM

1

несколько дней

Квантомеханичеcкий активный сайт

Gaussian,
Q - Chem

1

несколько недель

В случае, когда пространственная структура белка-мишени неизвестна, имеется достаточно большое число различных подходов сравнительного моделирования. При построении трехмерной модели белка с заданной аминокислотной последовательностью эта полипептидная цепочка сначала "вписывается" в координаты, соответствующие остаткам гомологичного белка с расшифрованной пространственной структурой, а затем осуществляется минимизация внутренней энергии, чтобы "убрать" возможные напряжения в структуре. В дальнейшем методами молекулярной динамики моделируется движение отдельных частей молекулы с целью уточнения расположения гибких участков. Качество полученной модели оценивают с использованием программы, которая сравнивает пространственное расположение аминокислотных остатков моделируемого белка с известной статистикой, полученной для белков с расшифрованной экспериментально пространственной структурой.

Построенные таким способом модели были успешно использованы для конструирования, например: новых ингибиторов протеазы вируса иммунодефицита человека для лечения СПИДа; ингибиторов ренина, как средства для лечения эссенциальной гипертензии; для белковой инженерии гибридных нейтрофорных факторов и т.д.

Неукротимый рост вычислительных мощностей сопровождается лавинообразным расширением биологических данных по геномам человека и других организмов. Дополнительная информация поступает из фармацевтической химии, неврологии, микробиологии, иммунологии, клинических испытаний, токсикологии, эпидемиологии и др. дисциплин и должна интегрироваться с генетическими и структурными данными. Создать единую картину всей информации, установить связи между отдельными областями знания - задача биоинформатики.

В основе будущих открытий в этих науках лежит использование огромных массивов баз данных по первичным последовательностям, структурам белков и низкомолекулярным соединениям. Их число в настоящее время составляет несколько сотен. С усовершенствованием техники секвенирования скорость расшифровки генома человека и других организмов в ближайшие несколько лет возрастет в сотни раз. Число различных баз данных в ближайшие годы будет экспоненциально нарастать. Работа с такими огромными массивами информации требует создания принципиально новых подходов к обработке данных и соответствующего программного обеспечения. По-видимому, наиболее эффективный путь решения этой проблемы - создание систем с параллельной обработкой информации, что хорошо вписывается в кластерную структуру современных суперкомпьютеров.

Важно подчеркнуть, что полноценное решение проблемы конструирования лекарств невозможно без создания общей базы знаний по физико-химической биологии. Такая база знаний должна включать не только сведения о структуре и функции отдельных белков, но и карты всех метаболических путей огромного количества реакций, протекающих в живом организме. В настоящее время в Пущинском научном центре предприняты первые попытки создания базы каталитических реакций белков и их математических моделей в клетках и клеточных ансамблях.

Подводя итог, можно сказать, что развитие высокопроизводительных вычислений в ближайшем будущем будет определять прогресс в молекулярной биологии. Именно на решение проблем молекулярной биологии ориентируются создатели будущих сверхпроизводительных вычислительных систем. В частности, на решение проблемы фолдинга и конструирования лекарств ориентированы создатели петафлопного суперкомпьютера (Blue Gene), который по проекту фирмы IBM должен вступить в строй в 2004 году. Эта область определена как приоритетная Национальным научным фондом и Национальной академией наук США, а также всеми развитыми и многими развивающимися странами.

Вплоть до самого последнего времени в России направление "Компьютерная биология" практически отсутствовало. Создание Межведомственного суперкомпьютерного центра (МСЦ), ориентированного в том числе и на решение задач молекулярной биологии во взаимодействии со специалистами в области компьютерной и математической биологии, и поддержка этого направления на правительственном уровне может качественно изменить сложившуюся ситуацию.

 
Читайте также:
Последнее обновление ( 06.04.2009 г. )
 
« Пред.   След. »
 
 
Научно-информационный портал. Биоинформатика, геномика, протеомика. Биософт. Анализ изображений (Imaging). Copyright © 2008-2010
Rambler's Top100 создание сайтов, разработка сайтов