Методы, использующиеся в биоинформатике для анализа макромолекул и создания лекарств. Часть 2. - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Методы, использующиеся в биоинформатике для анализа макромолекул и создания лекарств. Часть 2.

Печать E-mail
Автор Арчаков   А .И.   
17.10.2008 г.
 Часть 2   От последовательности – к структуре и функции

ImageВ случае, когда молекула белка-мишени определена, но ее пространственная структура не известна, приходится прибегнуть к построению 3D модели данного белка. С этой целью в настоящее время применяют три группы методов:

 (1) распознавание фолда (укладки, упаковки) с использованием библиотеки известных фолдов;

(2) предсказания ab initio на основе знаний об атомных взаимодействиях и архитектуре белковой глобулы;

(3) моделирование по гомологии.

 Распознавание фолда – это первая стадия для построения модели трехмерной структуры белка. Оно применяется, если отсутствует информация о близких гомологах исследуемого белка, пространственная структура которых расшифрована ранее. Хотя при этом удается предсказать корректно укладку для ~75% белков, "разрешение" построенной таким образом модели не достаточно, чтобы использовать ее в дальнейших исследованиях как базовую для выявления механизма функционирования макромолекул.

При предсказании ab initio целью является построение модели 3D структуры без использования знаний по структуре гомологов. Эти методы близки к методам предсказания фолда как по точности распознавания, так и по "разрешению".

Предсказание трёхмерной структуры белка по известной аминокислотной последовательности осуществляется наиболее успешно, когда известна пространственная структура одного или нескольких его гомологов. В этих случаях информация об известных структурах может экстраполироваться на новую аминокислотную последовательность, что позволяет получить 3D модель до расшифровки структуры нового белка методами рентгеноструктурого анализа или ЯМР. Такой подход получил название сравнительного моделирования (иногда используются также термины - моделирование по гомологии или моделирование, основанное на знаниях).

Первые попытки моделирования пространственной структуры белков, основанные на гомологии с другими белками, были предприняты в конце шестидесятых - начале семидесятых годов с использованием конструкцией из проволоки и пластиковых моделей. Значительно позже начали использовать интерактивную компьютерную графику.

В результате этих экспериментов было показано, что моделирование дает хорошие результаты, если гомология между аминокислотными последовательностями рассматриваемых белков достаточно высока, но становится ненадежным, если эта гомология составляет менее 30%.

В настоящее время разработано достаточно большое число различных подходов к сравнительному моделированию. Одним из наиболее широко используемых является метод, первоначально разработанный Бланделом и реализованный в программе COMPOSER комплекса молекулярного моделирования SYBYL (TRIPOS, Inc.).

При построении трехмерной модели для новой аминокислотной последовательности эта полипептидная цепочка сначала "вписывается" в координаты, соответствующие остаткам гомологичного белка с расшифрованной пространственной структурой,  а  затем осуществляется минимизация внутримолекулярной энергии, чтобы "убрать" возможные напряжения в структуре. В дальнейшем методами молекулярной динамики моделируется Броуновское движение отдельных частей молекулы с целью уточнения расположения гибких участков (петель). Качество полученной модели оценивают с использованием программы PROCHECK. Построенные таким способом модели были успешно использованы для конструирования, например: новых ингибиторов протеазы вируса иммунодефицита человека для лечения СПИДа; ингибиторов ренина, как средств для лечения эссенциальной гипертензии; для белковой инженерии гибридных нейротрофных факторов; и т.д. .

Сравнительная оценка различных подходов к предсказанию пространственной структуры белка по аминокислотной последовательности традиционно проводится в Асиломаре (Калифорния, США). При этом авторам методов предсказания предъявляются аминокислотные последовательности белков, пространственная структура которых будет расшифрована к моменту очередного рабочего совещания CASP (Critical Assessment of Structure Prediction). Предсказание, таким образом, делается "вслепую", что позволяет объективно оценить его результаты. Недавно состоялось уже третье рабочее совещание CASP-3, на котором были обсуждены предсказания, сделанные 98 группами исследователей для 36 белков, структура которых была расшифрована к моменту проведения совещания. По итогам CASP-3 было сделано заключение, что наилучшие предсказанные модели могут быть охарактеризованы величинами среднеквадратичного отклонения в расположении С? атомов 0.2, 0.4, и 0.6 нм. Разрешение 0.2 нм может быть достаточным для использования таких моделей с целью исследования механизма функционирования макромолекул. Разрешение 0.4 нм позволяет определить, какие остатки расположены по одну сторону молекулы и может быть использовано в планировании экспериментов. Разрешение 0.6 нм – слишком грубое и не может применяться ни в планировании дальнейших экспериментов, ни в анализе структурно-функциональных соотношений.

Второй подход, широко используемый в биоинформатике – это анализ биологических текстов как таковых с целью выяснения функции как целых молекул, так и их отдельных фрагментов. При этом используется только информация, содержащаяся в аминокислотной последовательности. Результаты такого рода работ оформляются в виде структурно-функциональных карт, на которых отмечены вероятные участки, участвующие в обеспечении каталитической активности, пространственной конформации, взаимодействии с белками-партнерами и т.п.

1. Моделирование по гомологии ядра белковой глобулы;

2. Моделирование активного центра (для фермента);

3. Моделирование поверхностных петель;

4. Моделирование мембранного якоря (для мембранного белка).

 Стратегия предсказания функционально значимых фрагментов белка применима только при наличии группы белков, обладающих сходными каталитическими свойствами. Такая группа формируется на первом этапе с использованием поиска по гомологии (BLAST) и/или информации, известной из эксперимента. Далее, среди гомологов выделяются семейства и подсемейства при помощи методов кластерного анализа на основании результатов парного выравнивания. Выделение кластеров необходимо, чтобы избежать вырожденности, т.е. искусственного преобладания высокогомологичных последовательностей одной группы.

Следующий этап - иерархическое множественное выравнивание. Белки в каждой группе выравниваются и заменяются одной консенсусной последовательностью или строятся соответствующие частотные профили. Их можно рассматривать как гипотетические белки-прародители (БП) для данной группы. На следующем уровне иерархии уже производится выравнивание БП.

БП для группы функционально родственных белков анализируется статистическими методами. При этом переход от строки символов к нормально распределенной величине осуществляется при помощи статистического критерия Шермана. Последняя характеризует, насколько сгруппированы консервативные остатки вдоль БП. Очевидно, что значимость одиночного консервативного остатка намного меньше, чем значимость кластера из нескольких инвариант.

В качестве примера можно привести недавно выполненный в НИИ биомедхимии РАМН анализ аминокислотных последовательностей оболочечных белков Е1 и Е2 различных штаммов вируса гепатита С человека. Путем множественного выравнивания 827 аминокислотных последовательностей были определены наиболее консервативные фрагменты и гипервариабельный участок. Эти данные являются основой для создания ингибиторов, блокирующих взаимодействие вируса с рецептором CD81; ингибиторов, блокирующих фолдинг белков вируса; синтеза антигенных детерминант; создания вакцин.

Таким образом, наибольшей эффективности в анализе аминокислотных последовательностей можно добиться последовательно применяя различные методы биоинформатики. Стратегии такого рода настраиваются и апробируются на конкретных надсемействах, но общий принцип применим к белкам всех классов. Основное в подходе - это определение функционально значимых участков в последовательности, минуя стадию построения молекулярной модели.

 

Читайте также:

Биоинформатика: геном уникальности
Биоинформатика: Виртуальный эксперимент в шаге от реальности. Часть 1
Последнее обновление ( 03.04.2009 г. )
 
« Пред.   След. »