Облако тегов

Авторизация


Полезная информация

жалюзи
 
 

Уроень 3. Цикл выравнивание-моделирование-оценка. Случай дигидрофолат-редуктазы Haloferax volcanii.

Печать E-mail
Автор Королёва Юлия   
08.04.2009 г.
Некоторые структуры дигидрофолат-редуктаз (DHFR) известны. Тем не менее, структура DHFR из Haloferax volcanii неизвестна и тождество её последовательности с дигидрофолат-редуктазами известной структуры - довольно низкое,  ~30%. Модель DHFR (HVDFR) Haloferax volcani была создана прежде, чем  её структура была решенаэкспериментально. Этот пример иллюстрирует мощность метода повторного выравнивания-моделирования-оценки в сравнительном моделировании.
Из всех доступных структур DHFR, последовательность HVDHFR имеет наибольшее сходство с DHFR из E. coli. В PDB-файл 4dfr переписывается с высоким разрешением (1.7 Å) структура DHFR E. coli. Она содержит две копии молекулы: цепь A и цепь B. Согласно авторам, структура для цепи B - лучшего качества, чем для цепи A. Следующий скрипт выравнивает HVDFR и цепь B 4dfr.
from modeller import *
env = environ()
mdl = model(env, file='4dfr.pdb', model_segment=('FIRST:B', 'LAST:B'))
aln = alignment(env)
aln.append_model(mdl, align_codes='4dfr')
aln.append(file='hvdfr.seq', align_codes='hvdfr')
aln.align2d()
aln.write(file='hvdfr-4dfr.ali')
aln.write(file='hvdfr-4dfr.pap', alignment_format='PAP',
alignment_features='INDICES HELIX BETA')

File: align2d-4.py

Некоторые опции в этом примере включают model_segment, который использован, чтобы указывать цепь B 4dfr; и alignment_features, получаемый на выходе как вторичная структура файла выравнивания в формате PAP.

 _aln.pos         10        20        30        40        50        60
4dfr      -MISLIAALAVDRVIGMENAMPW-NLPADLAWFKRNTLDKPVIMGRHTWESIGRPLPGRKNIILSSQ- 
hvdfr     MELVSVAALAENRVIGRDGELPWPSIPADKKQYRSRIADDPVVLGRTTFESMRDDLPGSAQIVMSRSE 
_helix                            999999999999       999999999
_beta     9999999999                           999999             99999999
_aln.p   70        80        90       100       110       120       130
4dfr      -PGTDDRVTWVKSVDEAIAACG--DVPEIMVIGGGRVYEQFLPKAQKLYLTHIDAEVEGDTHFPDYEP 
hvdfr     RSFSVDTAHRAASVEEAVDIAASLDAETAYVIGGAAIYALFQPHLDRMVLSRVPGEYEGDTYYPEWDA 
_helix               9999999999           99999999
_beta           99999              9999999            999999999
_aln.pos  140       150       160
4dfr      DDWESVFSEFHDADAQNSHSYCFKILERR 
hvdfr     AEWELDAETDHEG---FTLQEWVRSASSR 
_helix
 _beta     999999999999    999999999999

File: hvdfr-4dfr.pap

Начальная модель вычислена с использованием файла выравнивания PIR hvdfr-4dfr.ali:

from modeller import *
from modeller.automodel import *
env = environ()
a = automodel(env, alnfile='hvdfr-4dfr.ali',
knowns='4dfr', sequence='hvdfr')
a.starting_model = 1
a.ending_model = 1
a.make()

File: model4.py

Поскольку тождество последовательности между 4dfr и HVDFR сравнительно мало (30%), автоматическое выравнивание вероятно будет содержать ошибки. Оценка модели с потенциалом DOPE в MODELLER показывает два региона с положительной энергией.

 

Image

 DOPE score profile for model inihvdfr.B99990001.pdb

Первый регион - вокруг остатка 85, второй регион - в C-конце белка. Глядя на  шаблон выравнивания целевой молекулы выше (hvdfr-4dfr.pap), легко понять почему появляется первый положительный пик. В шаблоне в середине α-спирали, между позицией 85 и 88 выравнивания, были установлены вставки  (символы "9" на первой линии ниже последовательности отметки спиралей). Перемещая вставку на конец α-спирали, можно улучшить модель.

Вторая проблема в C-терминальном регионе выравнивания - меньшая очистка. Делеция в этом регионе выравнивания соответствует петле между последними двумя β-витками 4dfr (β-шпилька). Так как профиль напоминает, что в этом регионе имеется ошибка, следует попытаться провести альтернативное выравнивание. Его возможность в том, что делеция действительно длиннее, что делает короче C-терминальную β-шпильку HVDFR.

Одно возможное выравнивание, основанное на этих соображениях, показано здесь.

 _aln.pos         10        20        30        40        50        60
4dfr      M-ISLIAALAVDRVIGMENAMPW-NLPADLAWFKRNTLDKPVIMGRHTWESIGRPLPGRK 
hvdfr     MELVSVAALAENRVIGRDGELPWPSIPADKKQYRSRIADDPVVLGRTTFESMRDDLPGSA 
_helix                            999999999999       999999999
_beta    9 999999999                           999999             999
_aln.pos         70        80        90       100       110       120
4dfr      NIILSSQPGT--DDRVTWVKSVDEAIAACG--DVPEIMVIGGGRVYEQFLPKAQKLYLTH 
hvdfr     QIVMSRSERSFSVDTAHRAASVEEAVDIAASLDAETAYVIGGAAIYALFQPHLDRMVLSR 
_helix                       9999999999           99999999
_beta    99999          99999              9999999            9999999
_aln.pos        130       140       150       160
4dfr      IDAEVEGDTHFPDYEPDDWESVFSEFHDADAQNSHSYCFKILERR---- 
hvdfr     VPGEYEGDTYYPEWDAAEWELDAETDHE-------GFTLQEWVRSASSR 
_helix
_beta    99               999999999999    999999999999

File: hvdfr-4dfr-2.pap

Новая модель была вычислена с использованием этого выравнивания и скрипта, модифицированного, чтобы прирменить новое выравнивание (см. model5.py). Профиль оценки DOPE показан на следующем рисунке.

 

DOPE profile for model hvdfr.B99990001.pdb

 DOPE profile for model hvdfr.B99990001.pdb

Основной положительный пик исчез и новая глобальная оценка DOPE упала с -15498.7 до -15720.3.

Процесс, показанный здесь мог бы быть повторен, пока оценка не перестала бы улучшаться. Этот повторный процесс выравнивания-построения-оценки разработан в протоколе MOULDER, который дальше будет осуществлен в MODELLER.

 

перевод с английского

Последнее обновление ( 10.12.2010 г. )
 
« Пред.
 
 
Научно-информационный портал. Биоинформатика, геномика, протеомика. Биософт. Анализ изображений (Imaging). Copyright © 2008-2010
Rambler's Top100 создание сайтов, разработка сайтов