Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Нуклеотидные последовательности анализ частоты встречаемости

    Представьте себе, что Вам в руки попала книга на неизвестном языке. Можно ли понять правила этого языка и извлечь из книги какую-ни-будь информацию С похожей задачей столкнулись биологи и математики в конце 70-х годов сразу после появления методов определения последовательностей нуклеотидов в ДНК. Первые попытки ее решения были связаны с подробным статистическим анализом прочитанных генетических текстов, например определением частот встречаемости различных слов и сравнением этих характеристик у различных организмов. Поэтому первые работы по статистическому анализу нуклеотидных последовательностей напоминали порой демографические справочники - приводилась подробная статистическая информация, но вопросы о том, по каким законам записан генетический текст, как выявить в нем функционально значимые области, что в нем играет роль знаков препинания и т.д., нисколько не прояснялись. Можно ли с помощью статистического анализа ДНК извлекать из прочитанных генетических последовательностей нужную "смысловую" информацию и выявить законы формирования и "работы" генетического текста Положительный ответ на этот вопрос был дан в начале 80-х годов после появления алгоритмов поиска функциональных областей в первичных структурах ДНК. [c.36]


    Рост объема баз данных первичных структур биополимеров немедленно вовлек в сферу изучения генетических текстов традиционные для генетиков методы теории вероятностей и математической статистики. Статистический анализ генетических последовательностей выявил большое количество аномальных характеристик (например, обога-щенность геномов различными повторами, блоками), которые еще предстоит объяснить на функциональном уровне. Это наблюдение показало, что необходимы специальные усилия для того, чтобы корректно описать генетические тексты с помощью математических моделей, в частности с помощью аппарата теории марковских цепей. Такие модели необходимы для оценки статистической значимости гомологий, вычисления компактных информационных характеристик текстов (энтропии, избыточности и т.д.), предсказания частот встречаемости нуклеотидных "слов". В свою очередь, изучение наиболее (или наименее) распространенных слов, выявление участков генома различающихся по частоте использования некоторых "стандартных" комбинаций нуклеотидов, позволяет выдвигать новые гипотезы о функциональной роли фрагментов генетического текста и их эволюционной истории. Перечисленным вопросам посвящена гл. 2 (Бородовский М.Ю. и Певзнер П.А.). [c.6]

    Первичная структура. Если имеются данные о нуклеотидной последовательности одной цепи, то большинство профамм позволяют построить комплементарную цепь, вычислить нуклеотидный состав, выявить участки, богатые пуринами, пиримидинами или определенными сочетаниями оснований, и определить частоту встречаемости различных динуклеотидов (рис. 7.15). Могут быть выявлены специфические субпоследовательности в пределах определенного сегмента, что часто используется для нахождения сайтов для рестриктирующих эндонуклеаз (рис. 7.16). В программу введена информация о сайтах узнавания для известных ферментов, и по одной команде выдаются сведения о положении этих сайтов для каждого из ферментов, числе ожидаемых фрагментов, образующихся при расщеплении ими ДНК, размере каждого фрагмента в парах оснований и его процентном отнощении к общей длине сегмента, а также о нуклеотидных остатках, соответствующих концам каждого фрагмента. Существуют также профаммы, которые могут предсказать, какие продукты будут получены при совместном действии двух или нескольких эвдо-нуклеаз. При этом предсказания делаются как для линейных, так и для кольцевых молекул. Полученная информация может использоваться для подтверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклеаз. [c.330]



Биофизическая химия Т.1 (1984) -- [ c.0 ]




ПОИСК







© 2025 chem21.info Реклама на сайте