Геномика и геносистематика. Часть 2. - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Геномика и геносистематика. Часть 2. - BioinforMatix.ru - портал по биоинформатике, имейджингу и биософту

Геномика и геносистематика. Часть 2.

Печать E-mail
Автор Антонов А.С.   
02.10.2008 г.
Антонов А.С., доктор биологических наук, профессор, заведующий отделом эволюционной биохимии Научно-исследовательского института физико-химической биологии им.А.Н.Белозерского Московского государственного университета им.М.В.Ломоносова.
 
Первые математические методы построения филограмм на основе преимущественно молекулярных данных, возникли еще в начале 60-х годов вместе с первыми вычислительными программами. Все они были основаны на принципах нумерической таксономии (Fitch, Margoliash, 1967; Wagner, 1969; Farris, 1970 и др.). Следовательно, в данном случае родство определялось по критерию "общего сходства" - чем выше значение этого параметра, тем ближе таксоны друг к другу.

В основе современных дистанционно-матричных методов филогенетического анализа лежат те же принципы с их модификациями, которые технически менее громоздки. С их помощью за короткое время можно анализировать довольно массивные базы данных (Swofford, Olsen, 1990). Филограмма, полученная такими методами, не отражает эволюционного процесса, а только демонстрирует конечную степень дивергенции таксонов.

Для выяснения эволюционного родства необходим анализ состояния конкретных признаков, которые изменялись в процессе эволюции. Обычно предполагают, что эволюционный путь признака должен быть таким, который требует наименьшего числа его преобразований. В этом и заключается принцип "максимальной экономии", следуя которому, возможно выстроить схемы родственных отношений (Sober, 1988; Harvey, Pagel 1991; Stewart, 1993). Это универсальный кладистический метод, позволяющий анализировать любые сравнительные базы данных - морфологические, поведенческие, физиологические, молекулярные и т.  д . (Swofford, Olsen, 1990).

За последние десятилетия были разработаны компьютерные программы, использующие этот принцип для анализа филогенетических связей на основе первичных структур нуклеиновых кислот (Swofford, 1993). После того, как была предложена надежная модель, описывающая вторичную структуру 18S рРНК, появилась возможность применить кладистический подход для анализа гомологичных элементов вторичной структуры рРНК у разных организмов. Этот подход оказался очень информативным при реконструкции филогении, поскольку позволил напрямую проследить приобретение новых признаков родственными группами. Таким образом, мы можем обнаружить явные плезиоморфии и апоморфии в эволюционной истории уже на молекулярном уровне (Сampbell et а1., Алешин и др; 1998). Несмотря на то, что данная область молекулярной систематики сравнительно молода, она становится весьма перспективным направлением молекулярных исследований.

 

Выравнивание и построение филограмм

При анализе нуклеотидных последовательностей в качестве отдельных признаков выступают отдельные нуклеотидные позиции. А поскольку принцип филогенетического анализа предполагает сравнение гомологичных признаков, то необходимо установить позиционную гомологию нуклеотидов в разных последовательностях. К этому и сводится следующий этап обработки данных после того, как определены последовательности гомологичных генов, - процедура выравнивания.

Чтобы систематизировать постоянно растущий массив информации, созданы и поддерживаются международные публичные базы данных по выровненным последовательностям генов 18S рРНК разных групп живых организмов (Van de Peer et al., 1996 и др.) GeneBank.

Процесс выравнивания подразумевает выстраивание последовательностей наиболее близких к исследуемому объекту видов друг под другом с таким расчетом, чтобы они совпадали как можно более полно, тогда одни консервативные участки будут располагаться под другими.

К примеру, получив нуклеотидную последовательность гена 18S рРНК какого-нибудь жука, экспериментальные данные необходимо сравнить с уже известными выровненными последовательностями других насекомых.

Более вариабельные участки необходимо выравнивать до тех пор, пока идентичные нуклеотиды по вертикали не будут наиболее максимально соответствовать друг другу. При этом возможно включение пропусков, поскольку в некоторых последовательностях могут быть как делеции, так и вставки. Участки блока последовательностей, которые не могут быть достоверно выровнены, чаще всего исключаются из анализа, чтобы не привносить систематических ошибок (см. Swofford, Olsen, 1990).

В настоящее время, этот этап работы компьютеризирован, хотя некоторые исследователи предпочитают более аккуратное, с их точки зрения, выравнивание "вручную".

Вернемся к методам молекулярной систематики. Все методы молекулярной систематики, так или иначе связанные с анализом нуклеотидного состава ДНК, оперируют только с выравненными последовательностями. Их можно разделить на две большие группы:

1. Методы, создающие филограммы по принципу объединения наименее отличающихся последовательностей или групп последовательностей. Для этого выровненные последовательности попарно сравниваются друг с другом и для каждой пары структурные отличия трансформируются в особый числовой коэффициент, являющийся мерой их сходства или различия. Создается числовая матрица данных, которая затем преобразуется в графическую модель эволюционного дерева (или филограмму) на основе принципов кластерного анализа. Пары наименее различающихся последовательностей объединяются в кластеры первого порядка, наименее различающиеся кластеры первого порядка - в кластеры второго порядка, и т. д . В этом заключается принцип действия так называемых "дистанционно - матричных" методов.

Самый распространенный из них - метод связывания ближайших соседей (neighbour - joining или NJ) (Saitou, Nei, 1987).

Технические возможности компьютерной обработки данных позволяют при расчете дистанций учитывать влияние вторичной структуры РНК на вероятность изменений в конкретных позициях гена и неравную скорость эволюции разных участков молекулы 18S рРНК. Самые современные версии NJ анализа способны оценить такие погрешности и, "настроив молекулярные часы" (см. предыдущую часть статьи "Геносистематика - что это такое") давать более достоверные результаты.

Еще раз напомним, что все дистанционно - матричные методы основаны на принципах нумерической таксономии и способны оценить только степень дивергенции таксонов.

2. Другая группа методов основана на анализе конкретных признаков на молекулярном уровне. В отличие от вышеописанных подходов, они способны давать информацию о конкретных эволюционных событиях. Один из них называется методом максимальной экономии (maximum parsimony, или МР). Технически, он гораздо более трудоемок и занимает больше времени, чем все дистанционно - матричные приемы. Это объясняется тем, что весь массив выровненных последовательностей анализируется целиком.

Суть метода состоит в последовательном анализе всех возможных филограмм, состоящих из всех возможных комбинаций представленных элементов (т.е. последовательностей). Анализ проводится по каждому признаку (т.е. по каждой колонке выравнивания). Цель его - найти среди всего множества такую филограмму, для которой необходимое число изменений признака в процессе предполагаемой эволюции будет минимальным. Этим и объясняется название метода: "максимально экономным" будет такое дерево, для которого в сумме число изменений всех признаков будет наименьшим.

Использование МР анализа позволяет не только получить вероятную картину действительного эволюционного процесса, но и обнаружить набор "максимально экономных" признаков для каждого узла ветвления филограммы, который записывается программой в специальном файле. Эта информация незаменима при поиске участков молекулы, которые с большей вероятностью содержат следы апоморфных приобретений того или иного таксона в процессе его естественной истории.

Значение МР анализа для молекулярной систематики трудно переоценить. В настоящее время, созданы специальные пакеты программ, анализирующие различные типы данных с использованием этого метода (Williams, Fitch, 1990; Swofford, 1993; Felsenstein, 1993).

Молекулярная систематика оперирует признаками, полностью независимыми от тех, что используются в других эволюционных построениях. Поэтому можно считать, что это направление является хорошим методом, как для сопоставления разных гипотез, так и для самостоятельного построения системы живого мира. Более того, метод молекулярной систематики позволяет анализировать гомологичные признаки там, где классические методы пока не дали определенного результата. Например, в случае сильно дивергировавших таксонов, таких, как типы или царства. К тому же, в геносистематике число учитываемых признаков намного больше, чем критериев, используемых морфологами: анализируются сотни нуклеотидов, даже после удаления неинформативных позиций. Результаты исследования структуры нуклеиновых кислот является мощным критерием установления родственных связей, но, как и любой инструмент, требует осторожного и правильного применения. Используя метод молекулярной систематики были получены доказательства монофилии эукариот (Kumar, Rzhetsky, 1996), всех многоклеточных животных (Wainraight et al., 1993), происхождение двумембранных клеточных органелл (митохондрий и хлоропластов) от прокариотического предка (Lang et а1., 1997), и многое другое.

Можно надеяться, что молекулярные данные, полученные при изучении разных молекулярных структур (рРНК, нуклеиновых кислот, белков ядра и органелл, наборов пигментов, и др.), в совокупности с морфологическими сведениями, включая данные эмбриологии и палеонтологии, приблизят нас к пониманию эволюционных связей всего живого мира.

Словарь:

Апоморфия означает производный, или специализированный признак,
Плезиоморфия - примитивную черту…
Например, существуют амфибии аксолотли, внешний вид которых напоминает головастика, у которого уже сформировались легкие, передние и задние конечности, но еще не резорбировался хвост. При этом аксолотли живут и размножаются. То, что они примитивно устроены (как головастик) - это плезиоморфная черта, а их способность к размножению - это апоморфия.

 

Читайте также:

Последнее обновление ( 06.04.2009 г. )
 
« Пред.   След. »