A+ A A-

Разработан метод сравнения структур молекул РНК

 

Группа физиков из ФИАН, МФТИ и МГУ разработала метод сравнения двух молекул РНК, основанный на математическом сходстве метода динамического программирования и теории, описывающей образование комплекса двух полимерных цепей со сложной архитектурой. Этот метод может помочь предсказывать «оптимальную» вторичную структуру молекулы РНК по последовательности образующих ее нуклеотидов. Неожиданным следствием разработанного подхода стала гипотеза о статистическом механизме выделенности используемого природой числа нуклеотидов, 4.

 

Для эволюционной биологии вопрос сравнения ДНК и РНК последовательностей - один из ключевых, в частности, он позволяет судить о том, насколько далеко в эволюционном смысле разошлись друг от друга два рассматриваемых гена, и какие гены могут являться их общими предками. И если вопрос сравнения двух последовательностей молекул дезоксирибонуклеиновой кислоты (ДНК) с алгоритмической точки зрения не вызывает принципиальных трудностей, то задача построения алгоритма сравнения молекул рибонуклеиновой кислоты (РНК) наталкивается на серьезные препятствия и до сих пор полностью не решена. Дело в том, что молекулы РНК содержат нетривиальную вторичную структуру типа «клеверного листа» или «кактуса». Образование этой вторичной структуры обусловлено наличием слабых водородных связей между удаленными по цепи комплиментарными нуклеотидами. Сергей Нечаев (ФИАН), Михаил Тамм (МГУ) и Ольга Вальба (МФТИ) предлагают метод сравнения РНК, явно учитывающий как порядок следования нуклеотидов, так и комбинаторику, обусловленную тем, что при заданной первичной структуре молекула РНК может образовать разные вторичные кактусоподобные структуры.

«Молекулы ДНК и РНК – это нерегулярные последовательности, образованные четырьмя типами «букв» - нуклеотидов. Задача сравнения или, как говорят, «выравнивания» последовательностей молекул ДНК, заключается в нахождении максимальной общей подпоследовательности двух молекул. Эта подпоследовательность не обязательно состоит из идущих непосредственно друг за другом букв, они могут идти и с пробелами – делециями. Задачу о сравнении двух последовательностей РНК мы свели к задаче о вычислении свободной энергии комплекса двух взаимодействующих неоднородных (гетерополимерных) цепей, каждая из которых может образовывать кактусоподобную структуру. Мы показали, что с формально-математической точки зрения известный рекурсивный алгоритм выравнивания последовательностей ДНК – так называемый, метод динамического программирования Смита-Ватермана – может рассматриваться как предел нулевой температуры в статистической модели связывания двух полимерных цепочек с произвольной первичной структурой. Обобщить это наблюдение на случай молекул РНК было уже делом техники», - рассказывает руководитель работы, доктор физ.-мат.наук Сергей Нечаев.

В задаче о сравнении молекул РНК помимо непосредственной энергии связи контактов, свободная энергия учитывает комбинаторную энтропию образования разных вторичных структур. Таким образом, поиск максимальной общей подпоследовательности сводится к вычислению максимальной свободной энергии комплекса двух молекул: чем больше ее значение, тем более похожи две сравниваемые молекулы РНК. Разработанный статистический алгоритм можно использовать и для решения обратной задачи - восстановления оптимальной структуры каждой из взаимодействующих молекул РНК по известной последовательности нуклеотидов конкретной молекулы РНК.

«Представьте себе, - поясняет Нечаев, - что в эксперименте возникла необходимость предсказать вторичную структуру синтезированной молекулы РНК по последовательности нуклеотидов. Наш алгоритм позволяет предсказать оптимальную с точки зрения статистической физики вторичную структуру молекулы РНК, которая будет соответствовать максимуму свободной энергии. При этом мы старались по возможности оставаться в рамках статистической физики и избегать эвристических соображений, полученных лишь на основе анализа экспериментальных данных».

Следствием разработанного подхода стало довольно неожиданное наблюдение. Оказалось, что если не ограничиваться только четырьмя типами нуклеотидов (аденин, цитозин, гуанин и урацил), присутствующими в РНК, то «выравнивание» молекул РНК при числе нуклеотидов с ≤ 4 и при с > 4 происходит по-разному.

43.png
Кактусообразная структура (а) и ее «арочная» диаграмма (b)

«Алфавит, который использует природа, - говорит Сергей Нечаев, - выделен тем, что при числе букв, меньшем или равном четырем, укладка очень длинной молекулы РНК почти не содержит пропусков (делеций) и каждому нуклеотиду найдется комплиментарный, либо в той же самой молекуле, либо в той, с которой происходит сравнение. В случае же, когда число букв больше четырех, в очень длинной цепи РНК всегда присутствует большое количество делеций (их число сравнимо с длиной всей цепочки). Число «четыре» является пограничным: это максимальное число букв, при котором у каждого нуклеотида есть пара, и очень длинная случайная РНК может образовывать «совершенную» вторичную структуру, то есть у каждого нуклеотида в последовательности найдется комплиментарный.

Вопрос о том, почему природа использует именно 4 типа нуклеотидов, - один из важнейших в биологии и генной инженерии. Как предполагают исследователи из ФИАН, МГУ и МФТИ, с точки зрения статистической физики гетерополимеров со сложной иерархической вторичной структурой типа РНК, число «четыре» является статистически выделенным среди всех возможных алфавитов при изучении проблемы выравнивания. Для «линейной» молекулы ДНК, где количество нуклеотидов также равно четырем (аденин, цитозин, гуанин и тиминдин), оно уже ничем не выделено. Это наблюдение может рассматриваться как еще один косвенный аргумент в пользу гипотезы «РНК-мира», согласно которой на начальном этапе возникновение жизни на Земли существовали только РНК, а ДНК появились уже в результате их эволюции.

АНИ «ФИАН-информ»

 

О проекте

lebedev1

Агентство научной информации «ФИАН-информ» создано Физическим институтом имени П.Н. Лебедева РАН (ФИАН) с целью популяризации фундаментальных и прикладных исследований. 

Агентство научной информации «ФИАН-информ» работает в режиме оперативной передачи достоверной информации непосредственно от первоисточника (ФИАН и его научные, научно-технические, производственные и бизнес-партнеры) всем заинтересованным сторонам. 

Целью АНИ «ФИАН-информ» является развитие системы сбора, обработки и распространения научно-технической информации и анонсирования научных, научно-прикладных и научно-образовательных событий.

Rambler's Top100
ФИАН - Информ © 2012 | All rights reserved.