Облако тегов

Авторизация


Полезная информация

Оборудование для складов - продажа строительного оборудования. Подними объем продаж в магазине. . Изоляторы б/у: изолятор ио 10. Изоляторы всех видов! Москва.
Телеконференции, научные статьи, исследования в медицине, биологии и экологии
 
 

Поиск последовательностей в промоторах из геномов организмов с использованием критерия серий

Печать E-mail
Автор А.А. Шеленков, Е.В. Коротков   
08.05.2009 г.
Аннотация.  В  статье  вводится  понятие «регулярность»  для  описания структурных  свойств  последовательностей  ДНК,  расширяющее  понятие скрытой  периодичности.  Предложен  метод  обнаружения  регулярности  с использованием  критерия  серий.  Проведенный  поиск  регулярных последовательностей в эукариотических промоторах показал, что более 60% из  них  обладают  регулярностью  на  статистически  значимом  уровне. Обсуждаются  возможные  биологические  функции  регулярности  и возможность  использования  данной  характеристики  для  аннотации промоторов.

ВВЕДЕНИЕ
В  настоящее  время  проводится  широкомасштабный  анализ  последовательностей различных  геномов,  в  частности,  генома  человека. Одной  из  важнейших  задач  этого анализа является характеристика и определение функций различных генов. В последнее десятилетие был предложен ряд достаточно надежных методов предсказания участков, кодирующих  белок.  Однако  предсказание  регуляторных  участков,  в частности, промоторов, все еще остается сложной задачей, хотя также был предложен ряд  методов  для  их  обнаружения.  Промотор –  это  участок  генома, расположенный вблизи сайта инициации транскрипции и играющий ключевую роль в генетической  регуляции. Промоторы  получают  сигналы  от  различных  источников (например,  от  клеточных  рецепторов)  и  контролируют  уровень  инициации транскрипции, которая в значительной степени определяет экспрессию гена. Таким образом, обнаружение промоторов является важным шагом для проведения аннотации генов.

Для  того,  чтобы  разделить  участки  геномов,  содержащие  и  не  содержащие промоторы (последних,  очевидно,  большинство)  был  использован  целый  ряд признаков,  например CpG  островки, TATA-боксы [4, 8], CAAT-боксы, некоторые  характерные  сайты  связывания  факторов  транскрипции,  матрицы пентамеров, олигонуклеотиды, а также комбинированные подходы.

Кроме  того,  были  использованы  различные  процедуры  распознавания  образов, такие как нейронные сети [4, 7, 8], линейный и квадратичный дискриминантный анализ,  интерполяционная  Марковская  модель,  анализ  независимых составляющих.

Однако  анализ  экспериментальных  данных  показал,  что  вопрос  выбора правильных  биологических  сигналов,  используемых  в  программах  предсказания промоторов,  все  еще остается открытым. Ни один из  этих  сигналов не описывает  все разнообразие  промоторов,  и  каждый  признак,  полученный  на  основе  изучения промоторных последовательностей, имеет свои ограничения в использовании.

Таким  образом,  существует  необходимость  выделения  некоторой  новой характеристики  последовательностей  промоторов,  которая  являлась  бы  специфичной по отношению к этим элементам, но при этом обладала бы достаточной гибкостью для того, чтобы соответствовать многообразию видов таких последовательностей. Ранее  нами  была  предложена  скрытая  периодичность  в  качестве  характеристики, позволяющей проводить аннотацию последовательностей с неизвестной функцией . В частности, нами было показано, что последовательности, обладающие  скрытой периодичностью  с  длиной  периода 2–100,  являются  потенциальными минисателлитами.  Скрытая  периодичность  является  достаточно  общим  явлением, свойственным различным группам организмов. Тем не менее, данная характеристика не позволяет выделить промоторные участки из всего множества регуляторных элементов генома.

В  данной  работе  мы  предлагаем  новую  характеристику  символьных последовательностей – регулярность, приводим метод ее обнаружения, основанный на использовании критерия серий, а также применяем этот метод для поиска регулярных последовательностей  в  промоторах  из  геномов  различных  групп  организмов.  Под регулярностью  мы  понимаем  статистически  значимое  подобие  распределений символов по участкам последовательности между исследуемой последовательностью и искусственной  периодической  последовательностью  с  некоторой  длиной  периода. Строгое определение регулярной последовательности дано в разделе 1.5.

Метод,  приведенный  в  данной  работе,  можно  использовать  в  том  числе  и  для поиска скрытой периодичности, но он позволяет обнаруживать и последовательности, которые  формально  нельзя  причислить  к  периодическим,  но  при  этом  имеющие сходную  структурную  организацию. Основными  достоинствами  метода  являются  его относительная нечувствительность к наличию вставок и делеций символов, отсутствие необходимости  предварительного  задания  типа  последовательности  для  поиска (например,  в  виде  матрицы  частот),  и  самое  главное,  возможность  обнаруживать регулярность, сильно размытую в результате эволюционного процесса. В разделе «Результаты и обсуждение» будет показано, что большинство известных промоторов обладают регулярной структурой...

Скачать полностью этот материал в формате PDF (440 кб)
Последнее обновление ( 08.05.2009 г. )
 
« Пред.   След. »
 
 
Научно-информационный портал. Биоинформатика, геномика, протеомика. Биософт. Анализ изображений (Imaging). Copyright © 2008-2010
Rambler's Top100 создание сайтов, разработка сайтов