|
Некоторые структуры дигидрофолат-редуктаз (DHFR) известны. Тем не менее, структура DHFR из Haloferax volcanii неизвестна и тождество её последовательности с дигидрофолат-редуктазами известной структуры - довольно низкое, ~30%. Модель DHFR (HVDFR) Haloferax volcani была создана прежде, чем её структура была решенаэкспериментально. Этот пример иллюстрирует мощность метода повторного выравнивания-моделирования-оценки в сравнительном моделировании.
Из всех доступных структур DHFR, последовательность HVDHFR
имеет наибольшее сходство с DHFR из E. coli. В
PDB-файл 4dfr переписывается с высоким разрешением (1.7 Å) структура DHFR E.
coli. Она содержит две копии молекулы: цепь A и цепь
B. Согласно авторам, структура для цепи B - лучшего качества, чем для
цепи A. Следующий скрипт выравнивает HVDFR и цепь B 4dfr.
from modeller import *
env = environ()
mdl = model(env, file='4dfr.pdb', model_segment=('FIRST:B', 'LAST:B'))
aln = alignment(env)
aln.append_model(mdl, align_codes='4dfr')
aln.append(file='hvdfr.seq', align_codes='hvdfr')
aln.align2d()
aln.write(file='hvdfr-4dfr.ali')
aln.write(file='hvdfr-4dfr.pap', alignment_format='PAP',
alignment_features='INDICES HELIX BETA')
File: align2d-4.py
Некоторые опции в этом примере
включают model_segment, который использован, чтобы указывать цепь
B 4dfr; и alignment_features, получаемый на выходе как вторичная структура файла выравнивания в
формате PAP.
_aln.pos 10 20 30 40 50 60
4dfr -MISLIAALAVDRVIGMENAMPW-NLPADLAWFKRNTLDKPVIMGRHTWESIGRPLPGRKNIILSSQ-
hvdfr MELVSVAALAENRVIGRDGELPWPSIPADKKQYRSRIADDPVVLGRTTFESMRDDLPGSAQIVMSRSE
_helix 999999999999 999999999
_beta 9999999999 999999 99999999
_aln.p 70 80 90 100 110 120 130
4dfr -PGTDDRVTWVKSVDEAIAACG--DVPEIMVIGGGRVYEQFLPKAQKLYLTHIDAEVEGDTHFPDYEP
hvdfr RSFSVDTAHRAASVEEAVDIAASLDAETAYVIGGAAIYALFQPHLDRMVLSRVPGEYEGDTYYPEWDA
_helix 9999999999 99999999
_beta 99999 9999999 999999999
_aln.pos 140 150 160
4dfr DDWESVFSEFHDADAQNSHSYCFKILERR
hvdfr AEWELDAETDHEG---FTLQEWVRSASSR
_helix
_beta 999999999999 999999999999
File: hvdfr-4dfr.pap
Начальная модель вычислена с использованием
файла выравнивания PIR hvdfr-4dfr.ali:
from modeller import *
from modeller.automodel import *
env = environ()
a = automodel(env, alnfile='hvdfr-4dfr.ali',
knowns='4dfr', sequence='hvdfr')
a.starting_model = 1
a.ending_model = 1
a.make()
File: model4.py
Поскольку тождество последовательности между 4dfr
и HVDFR сравнительно мало (30%), автоматическое выравнивание вероятно
будет содержать ошибки. Оценка модели с потенциалом DOPE в MODELLER показывает два региона с положительной
энергией.
DOPE score
profile for model inihvdfr.B99990001.pdb
Первый регион - вокруг остатка 85, второй регион - в
C-конце белка. Глядя на шаблон выравнивания целевой молекулы выше (hvdfr-4dfr.pap), легко понять почему появляется
первый положительный пик. В шаблоне в середине α-спирали, между позицией 85 и 88 выравнивания,
были установлены вставки (символы "9" на первой линии
ниже последовательности отметки спиралей). Перемещая вставку на конец α-спирали, можно улучшить модель.
Вторая проблема в C-терминальном регионе
выравнивания - меньшая очистка. Делеция в этом регионе выравнивания
соответствует петле между последними двумя
β-витками 4dfr (β-шпилька). Так как профиль напоминает, что в этом
регионе имеется ошибка, следует попытаться провести альтернативное
выравнивание. Его возможность в том, что делеция действительно длиннее,
что делает короче C-терминальную β-шпильку HVDFR.
Одно возможное выравнивание, основанное на этих
соображениях, показано здесь.
_aln.pos 10 20 30 40 50 60
4dfr M-ISLIAALAVDRVIGMENAMPW-NLPADLAWFKRNTLDKPVIMGRHTWESIGRPLPGRK
hvdfr MELVSVAALAENRVIGRDGELPWPSIPADKKQYRSRIADDPVVLGRTTFESMRDDLPGSA
_helix 999999999999 999999999
_beta 9 999999999 999999 999
_aln.pos 70 80 90 100 110 120
4dfr NIILSSQPGT--DDRVTWVKSVDEAIAACG--DVPEIMVIGGGRVYEQFLPKAQKLYLTH
hvdfr QIVMSRSERSFSVDTAHRAASVEEAVDIAASLDAETAYVIGGAAIYALFQPHLDRMVLSR
_helix 9999999999 99999999
_beta 99999 99999 9999999 9999999
_aln.pos 130 140 150 160
4dfr IDAEVEGDTHFPDYEPDDWESVFSEFHDADAQNSHSYCFKILERR----
hvdfr VPGEYEGDTYYPEWDAAEWELDAETDHE-------GFTLQEWVRSASSR
_helix
_beta 99 999999999999 999999999999
File:
hvdfr-4dfr-2.pap
Новая модель была вычислена с использованием этого
выравнивания и скрипта, модифицированного, чтобы прирменить новое
выравнивание (см. model5.py). Профиль оценки DOPE показан на следующем рисунке.
DOPE profile
for model hvdfr.B99990001.pdb
Основной положительный пик исчез и
новая глобальная оценка DOPE упала с -15498.7 до -15720.3.
Процесс,
показанный здесь мог бы быть повторен, пока оценка не перестала бы улучшаться. Этот повторный процесс
выравнивания-построения-оценки разработан в протоколе MOULDER, который
дальше будет осуществлен в MODELLER.
перевод с английского
|