Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Алгоритмы предсказания вторичных

    В алгоритмах предсказания вторичных структур речь всегда идет лишь о форме основной цепи при полном игнорировании конформационных состояний боковых цепей аминокислотных остатков. [c.519]

    АЛГОРИТМЫ ПРЕДСКАЗАНИЯ ВТОРИЧНЫХ СТРУКТУР [c.244]

    В этой главе рассматриваются основные алгоритмы предсказания вторичных структур РНК. Можно выделить четыре основных подхода 1) комби- [c.189]


    Предсказания, рассматриваемые в настоящем отделе, основаны на вычислениях без минимизации энергии. Они, однако, бесспорно относятся к эвристическим методам и удобны как прием для выбора стартовой конформации глобулярного белку перед минимизацией энергии. Выбор стартовой конформации особенно актуален в связи с проблемой множественности минимумов. В то же время предсказание вторичной структуры не может прямо привести к третичной структуре объекта, для чего требуется дополнительная обработка, включающая минимизацию энергии. Два серьезных обстоятельства говорят в пользу этого мнения. Во-первых, алгоритмы предсказания вторичной структуры пе учитывают роли взаимодействий, ответственных за поддержание компактной третичной структуры, а рассматривают только взаимодействия, наиболее существенные при формировании вторичной структуры. Поскольку вторичная структура все же до известной степени зависит от неучтенных взаимодействий, точное предсказание выполнить не представляется возможным. Во-вторых, даже правильное предсказание вторичной структуры предполагает, что каждый двугранный угол, определяющий строение основной цепи белка, заключен в некотором интервале значений. Небольшая неточность в величине двугранного угла в случае белка большого размера может означать чрезмерную неопределенность пространственных координат многих атомов и самой третичной структуры [c.585]

    Схема комбинированного метода, на первый взгляд, выглядит достаточно логично. В действительности же она не может быть реализована в отношении всех своих положений, что следовало из уже имевшихся к моменту появления метода экспериментальных данных. Первый пункт схемы невыполним, по крайней мере, по трем причинам. Во-первых, у большей части белков вторичные структуры составляют незначительную долю трехмерной структуры в среднем, в а-спирали глобулярных белков входит 25-30% остатков, а в -структуры - 15-20%. Во-вторых, встречающиеся в конформациях белков вторичные структуры, как правило, сильно искажены и лишь условно и при большом желании могут быть отнесены к регулярным. Насколько геометрические параметры реальных конформационных состояний остатков полипептидной цепи могут отличаться от параметров вторичных структур видно из табл. IV. 16, в которой приведены значения двугранных углов остатков некоторых сегментов последовательностей а-химотрипсина и лизоцима. Во всех работах, посвященных поиску эмпирических корреляций, эти сегменты отнесены к а-спиральным или -структурным. И наконец, в-третьих, надежность существующих алгоритмов предсказания, несмотря на оптимистические сообщения (см. ниже), не >50%, что исключает их практическое использование. [c.508]


    Собранный Каба и Ву экспериментальный материал позволяет заключить, что конформационное состояние аминокислотного остатка в гетерогенной цепи далеко не в полной мере определяется его собственной потенцией принимать определенное конформационное состояние и встраиваться в соответствующую вторичную структуру. Напротив, эксперимент показывает, что у большинства остатков отсутствует ярко выраженная потенция и они обладают по ближним взаимодействиям большой конформационной свободой и могут приблизительно с одинаковой вероятностью находиться в различных низкоэнергетических областях потенциальной поверхности и занимать в каждой области положения с весьма отличающимися значениями геометрических параметров. Это никак не согласуется с гипотезой о доминантной роли в образовании вторичных структур взаимодействий атомов в пределах одного остатка. Алгоритм предсказания Каба и Ву [c.253]

    В ряде работ второй половины 1970-х и начала 1980-х годов (например, [151, 157]) для предсказания вторичных структур одновременно привлекаются все имеющиеся алгоритмы и выводы делаются на основе усредненных результатов. Однако такая процедура не может повысить достоверность предсказания, точно так же как не может возрасти, например, точность измерений при использовании не одного, а нескольких приборов, каждый из которых не удовлетворяет требуемым условиям. [c.267]

    ОСНОВНЫЕ АЛГОРИТМЫ ДЛЯ ПРЕДСКАЗАНИЯ ВТОРИЧНЫХ СТРУКТУР [c.197]

    Индуктивные методы. Индуктивный, или рекурсивный, подход наиболее широко распространен для предсказания вторичных структур РНК. Как правило, для зтой цели используют метод динамического программирования. Впервые зтот алгоритм для определения вторичной структуры РНК по нуклеотидной последовательности был использован В.Г.Туманяном с соавт. (Туманян и др.,1966). [c.200]

    Развитый в работах Ф. Коэна, М. Стернберга и соавт. [156-158, 168, 169, 171] подход не опирается на общую физическую теорию и единый метод расчета, устанавливающие логические и количественные связи между аминокислотной последовательностью белка и координатами атомов нативной конформации молекулы. Каждая стадия комбинированного подхода следует своим эмпирическим правилам, корреляционным соотношениям, предсказательным алгоритмам и методологическим приемам. Объединяющим (скорее, отягощающим) все его составные части началом служит традиционное, сложившееся еще в 1950-е годы, представление о пространственной организации белковой глобулы в виде ансамбля регулярных вторичных структур (концепция Полинга и Кори) с внутренним гидрофобным ядром и внешней гидрофильной оболочкой (концепция Козмана). Несмотря на отсутствие заметного прогресса и разочаровывающие результаты предсказаний, стремление решить проблему пространственной организации белков на основе эмпирического подхода не ослабевает ни в 1980-е, ни в 1990-е годы [107. Гл. 6, 7]. Оставаясь на тех же идейных позициях, работы последнего десятилетия приобретают большее разнообразие. [c.510]

    В последние годы интерес к поиску простых статистических корреляций между аминокислотной последовательностью и вторичными структурами не ослабевает. По-прежнему предпринимаются попытки создать новые методы предсказания, усовершенствовать предложенные ранее, реанимировать забытые. Принципиальных изменений в развитии этого направления, однако, не происходит. На протяжении вот уже трех десятилетий остается неизменной стратегия поиска, покоящаяся на вере в возможность эмпирическим путем и на основе вторичных структур решить одну из фундаментальных проблем молекулярной биологии. Поэтому неудивительно, что практически неизменной осталась и надежность предсказания. В табл.IV.20 представлены показатели качества алгоритмов, разработанных с 1974 г. по 1993 г. и предсказывающих три конформационных состояния аминокислотных остатков (а-спиральное, -структурное и неупорядоченное), В качестве количественной характеристики использован показатель Q3, равный сумме долей положительных и отрицательных правильных предсказаний трех форм остатков (со -t- х). [c.516]

    Метод статнстической информации. Это целое семейство процедур, в которых для отбора конформаций, служащих исходными приближениями в последующем расчете, используется разного рода вероятностная информация. Ее источником может быть банк данных белковых структур, статистическое распределение остатков на конформационных картах усредненная предпочтительность парных остаток-остаточных контактов или алгоритмы предсказаний вторичных структур [210-216]. Очевидно, данные такого рода ориентировочны и могут скорее ввести в заблуждение, чем помочь в решении структурной проблемы пептидов и тем более белков. Конформационные возможности каждого из них определяются не статистикой, а определенной и всегда уникальной аминокислотной последовательностью. Показательно в этом отношении исследование М. Ламберта и Г. Шераги [210-212] панкреатического полипептида из 36 остатков. В расчет его структуры в качестве дополнительной вероятностной информации привносятся данные о распределении значений двугранных углов основной цепи в четырех областях конформационной карты ф-ц/ и распределении конформационных состояний трипептидных сегментов на нерегулярных участках трехмерных структур белков, изученных кристаллографически. Набор исходных для оптими- [c.244]


    С такой оценкой согласуются данные Робсона и соавт. [135], проанализ1фовавших надежность различных алгоритмов предсказания вторичных структур на 26 белках известного пространственного строения. Авторы пришли к выводу, что точность отнесения остатков к четырем конформационным состояниям (а-спираль, -структура, -изгиб и клубок) не превышает 49%. Приблизительно такую же точность (50%) имеют как старый метод [94], так и новый метод Нагано [136, 137], усовершенствованный включением корреляции между тремя остатками в спиральных областях, выведенной из анализа 36 белков. [c.265]

    Ф. Коэном и соавт. [261—263] развит ступенчатый метод предсказания трехмерной структуры белка по известной аминокислотной последовательности. Метод, получивший название комбинированного, предусматривает проведение трех последовательных стадий 1) предсказание на основе существующих алгоритмов регулярных вторичных структур 2) упаковку а-спиралей и -складчатых листов в конформацию, отражающую характерные особенности нативной структуры 3) энергетический расчет отобранных конформаций с использованием моделей, подобных сверхупрощенным моделям Левитта [254], Кунтца и соавт. [155], Робсона и Осгуторпа [270]. План исследования на первый взгляд выглядит логично. В действительности же он нереален, причем нереален в отношении всех своих трех положений, что следовало из данных, уже имевшихся к моменту его появления. Первый пункт плана невыполним по крайней мере по трем причинам. Во-первых, у большей части белков вторичные структуры составляют незначительную долю трехмерной структуры, а в среднем в а-спирали входит 25—30% остатков, а в -структуры — 15—20%. Во-вторых, встречающиеся в конформациях белков вторичные структуры, как правило, сильно искажены и лишь условно могут быть отнесены к регулярным (рис. П.З). В-третьих, надежность существующих алгоритмов предсказания вторичных структур не превышает 50% (гл. 8), что исключает их практическое использование. Возможно, по этим или иным причинам авторы не стали обращаться к предсказательным алгоритмам, а приступили к реализации второго пункта своего плана, выбрав для демонстрации возможностей предлагаемого ими метода белки, изученные рентгеноструктурно, и взяв всю информацию о геометрии [c.319]

    Алгоритм предсказания вторичной структуры. На первом этапе необходимо определить те кирпичики, лэ которых будет построена структура, т.е. выявить все возможные спиральные фрагменты. Здесь сразу возникает вопрос, что является критерием существования такого фрагмента Можно ли ограничиться минимальной длиной, например три пары оснований в спирале По-видимому, разумно использовать энергетический критерий и отбирать спирали, стабильность которых выще заранее заданной величины. Воспользуемся для этого такигл критерием, как время жизни спирали. Существует отличная от нуля вероятность, что спонтанно раскроются последовательно все основания спирали. Среднее время этого процесса назовем временем распада спирали - Из формулы (6.1) это время оценива- [c.213]

    Проанализировав существовавшие к тому времени алгоритмы предсказания (Е. Каба и Т. Ву [133-135], Б. Робсона и Р. Пейна [136, 137], П. Чоу и Г. Фасмана [138, 139], Г. Шераги и соавт. [39]), А. Бэржес и Г. Шерага констатировали, что ни один из них не может быть использован для достижения поставленной цели. Затем они переводят свою задачу в гипотетическую область и ведут поиск решения с идеальным алгоритмом предсказания. На основе известной кристаллической структуры БПТИ, а не эмпирических корреляций, авторы относят 58 аминокислотных остатков белка к 5 конформационным состояниям (а , а , е, ), отвечающим экспериментальным данным и низкоэнергетическим областям потенциальной поверхности конформационной карты p-V /. Каждому состоянию они приписывают усредненные по известным кристаллическим структурам восьми белков соответствующие значения углов ф, j/. Двугранные углы боковых цепей (%) были взяты с округлением до 5° из рентгеноструктурных данных для молекулы БПТИ. Вопреки ожиданиям оказалось, что построенная таким образом трехмерная структура даже отдаленно не напоминает конформацию белка. Ситуация не улучшилась и при минимизации энергии с учетом невалентных взаимодействий. Сравнение контурных карт расстояний между атомами С модельной и опытной конформаций показывает, что в собранной с помощью идеального алгоритма экспериментальной геометрии боковых цепей и проминимизированной трехмерной структуре отсутствуют все характерные особенности нативной конформации удалены друг от друга цистеиновые остатки, образующие между собой дисульфидные связи, практически нет намека на вторичные структуры и не воспроизводится глобулярная форма молекулы трипсинового ингибитора. Для исправления положения были введены дополнительные ограничительные условия, облегчающие приближение модельной структуры к нативной конформации. Однако ни учет реализуемой в белке системы дисульфидных связей (5-55, 14-38, 30-51), ни введение сближения соответствующих остатков ys, ни включение в расчет специальной функции, имитирующей стремление неполярных остатков оказаться внутри глобулы, а полярных выйти наружу, ничто не помогло получить пространственную форму белка, близкую к нативной. Конечно, можно было бы еще более ужесточить условия и добиться совпадения. Но это не имело бы значения, поскольку не повлияло бы на окончательный вывод о невозможности даже в случае 100%-ного правильного предсказания конформационных состояний остатков получить структуру, отдаленно напоминающую реальный белок. [c.502]

    Аналогичная задача, отвечающая второй стадии комбинированного Метода, решалась в работе Бэржеса и Шераги [132], которая уже рассматривалась. В ней также конформационные состояния всех остатков Панкреатического трипсинового ингибитора были отнесены не с помощью эмпирических корреляций, а на основе кристаллической структуры молекулы. Оказалось, что рассчитанная с использованием такого идеального Алгоритма предсказания, каким является эксперимент, конформация белка Даже отдаленно не напоминала его нативную структуру. Следовательно, Попытки уложить вторичные структуры в супервторичные и получить [c.509]

    Простейший статистический подход, не учитывающий взаимодействий даже между смежными остатками, был использован Ф. Бегхином и Дж. Дирксом, Дж. Кроуфордом и соавт. [82, 83]. Алгоритмы предсказания строились по статистическим оценкам склонностей остатков входить в а-спирали, -структуры и -изгибы. Соответствующие потенциалы рассчитывались из частот встречаемости каждого из 20 стандартных остатков в перечисленных вторичных структурах. Точность предсказания алгоритмов Диркса и Кроуфорда невысока. [c.253]

    В конце 1970-х годов было проведено много исследований, посвященных различным аспектам корреляционного подхода к предсказанию вторичной структуры по аминокислотной последовательности. Однако они не внесли принципиально нового в решение обсуждаемой проблемы. Не претерпела серьезных изменений и надежность предсказательных алгоритмов, как предложенных вновь, так и сделанных ранее, модифицированных и опирающихся на значительно больший экспериментальный материал [140—157]. В этой связи интересны данные сопоставления конформационных параметров П. Чоу и Г. Фасмана [99] с параметрами, полученными таким же образом М. Левиттом из анализа приблизительно вдвое большего количества белков [153]. Исследователи обнаружили значительное различие в распределении остатков в двух наборах по их способностям образовывать и разрушать вторичные структуры. С помощью парамет- [c.266]

    Насколько может быть далеким от реальности представление о возможностях алгоритмов предсказания, которое, вероятно, при некритическом отношении к такому показателю качества, как Q3, Г. Шульц и Р. Ширмер иллюстрируют двумя типичными примерами идентификации вторичных структур [157]. В первом примере для белка с незначительным а-спиральным содержанием не было сделано ни одного положительного правильного предсказания (w = 0) при сравнительно большой доле, что почти неизбежно в данном случае, отрицательных правильных предсказаний (например, х = 0,7). При таком, казалось бы, плачевном для использованного алгоритма результате (по существу, не получено никакой информации о структуре белка) количественная оценка его эффективности по значению Q3 получается тем не менее вполне удовлетворительной (70% достоверных предсказаний). Если же при этом сделано даже небольшое число положительных правильных предсказаний (например, W = 0,1), то показатель качества Q3 возрастает до 80%, что уже близко к оптимальному соответствию теории и эксперимента. [c.268]

    Обстоятельный анализ предсказательных возможностей корреляционного подхода был проведен К. Нишикавой [165], который в качестве примера также рассмотрел уже упоминавшиеся три алгоритма. Оценка методов Чоу и Фасмана и Робсона проведена по 9, а метода Лима — по 11 белкам, не входившим в состав базовых наборов. При идентификации трех состояний (а-спираль, -структура, клубок) точность определялась по показателю качества Q3, дающего как отмечалось, сильно завышенные значения, а при идентификации четырех состояний (а-спираль, -структура, -изгиб, клубок) использовался показатель Q4, занижающий вклад отрицательного предсказания и более реально отражающий действительные возможности методов. При переводе эмпирических правил на язык ЭВМ, т.е. при компьютеризации методов предсказания, Нишикава столкнулся с большими трудностями. Так, в случае метода Чоу и Фасмана были обнаружены неопределенности при индивидуальном предсказании вторичных структур, несогласованность предсказаний -изгибов с предсказаниями а-спиралей и -структур, отсутствие эффективного критерия для разделения перекрываний предсказанных а-спиральных и -структурных областей. Помимо этого, оказалось невозможным воспроизвести на ЭВМ результаты, полученные первоначально Чоу и Фасманом для 25 базовых белков. Преодолев эти трудности, Нишикава показал, что предсказательные возможности трех проанализированных им методов находятся на почти одном и том же, довольно низком уровне рассчитанные Нишикавой показатели качества Q3 попали в интервал 50—53%, а Q4 [c.272]

    В работе (Studni ka et al.,1978) громоздкость переборного метода была немного облегчена. Авторам удалось снизить время перебора до величины, пропорциональной N , где N - число нуклеотидов в последовательности. Алгоритм был успешно опробован для предсказания вторичной структуры 5S РНК. [c.199]

    К числу наиболее популярных методов предсказания вторичной структуры относится также алгоритм, предложенный Дукером и Стиглером (Zuker, Stiegler,1981). Идея их индуктивного подхода очень проста. Рассматривается небольшой фрагмент нуклеотидной последовательности. На нем выбирается структура с наименьшей свободной энергией. На следующем шаге фрагмент увеличивается на один нуклеотид.При анализе возможных вторичных структур предполагается, что выбранная на предыдущем этапе структура является частью вновь образованной. Поэтому необходимо вычислить энергию только тех возможных элементов вторичной структуры, которые образуются при элонгации цепи. Затем выбрать минимальную структуру и перейти к следующему этапу. На последнем этапе вычисляется энергия структуры, сформированной уже всей цепью. [c.203]

    Кинетический подход. Для предсказания вторичной структуры РНК пыло предложено еще несколько оригинальных алгоритмов, которые можно условно объединить под названием кинетический подход. На наш взгляд, этот подход является наиболее перспективным. Идея его заключается в моделЕ-ровании на ЭВМ процесса формирования вторичной структуры РНК. [c.205]

    Методы предсказания вторичных структур РНК получают большое расг ространение в молекулярной биологии и генной инженерии. Анализ вторич ных структур позволяет объяснить многие биологические явления.Первона чально при определении структуры подсчитывалось число Уотсон - Криковских пар и выбиралась Структура с наибольшим числом спаренных оснований. Позже с появлением термодинамических параметров, характеризующих вклад в свободную энергию различных комплементарных пар, а также одноцепочечных участков - петель, появилась возможность выбрать в качестве критерия свободную энергию, причем на новом этапе снова были использованы те же подходы - перебор, методы динамического программирования и кинетический алгоритм. [c.218]

    Кроме разобранных методов предсказания можно назвать алгоритм Шераги [44, 73], который использует метод МонтС Карло в модификации Метрополиса (разд. 21.4.3). В качестве первого шага при укладке полипептидной цепи белка в подходе Шераги осуществляется предсказание вторичной структуры. О качестве получаемых результатов судить затруднительно, но, по-видимому, оно не хуже, чем при моделировании процесса самоорганизации белков по Левитту —Варшелу. [c.598]

    Создание количественных методов компьютерного определения вторичных структур в опытных трехмерных структурах белков необходимо также вследствие усложнения процедуры корреляционного анализа, увеличения количества исследованных рентгеноструктурно белков и по некоторым другим причинам, в частности, из-за неоднозначности результатов предсказания того или иного метода при использовании его разными исследователями. Первые алгоритмы идентификации -изгибов с помощью ЭВМ по экспериментальным данным были созданы И. Кунтцем [142, 143] и П. Льюисом и соавт. [111]. Позднее они усовершенствовались П. Чоу и Г. Фасманом [172], Г. Раузе и Дж. Селтцером [173]. С. Лифсон п К. Сандер [174] разработали компьютерный метод определения -структуры, а М. Левитт и Дж. Грир [153] создали первый алгоритм установ- [c.510]

    Подобные представления легли в основу комбинаторных моделей, предназначенных для предсказания пространственной структуры (или вторичной, шпилечнообразной структуры) т-РНК или м-РНК. Эти модели основывались на критерии максимального спаривания в шпильках. В частности, Туманян [114] разработал общий алгоритм нахождения структуры с максимальным спариванием для любой последовательности оснований в полинуклеотидах и применил его в расчетах оптимальной структуры аланиновой т-РНК. [c.202]


Смотреть страницы где упоминается термин Алгоритмы предсказания вторичных: [c.304]    [c.265]    [c.304]    [c.508]    [c.517]    [c.267]    [c.271]    [c.282]    [c.316]    [c.508]    [c.517]    [c.201]    [c.204]    [c.587]    [c.415]    [c.259]   
Проблема белка (1996) -- [ c.0 ]




ПОИСК





Смотрите так же термины и статьи:

Алгоритм

Алгоритмы предсказания вторичных структур



© 2025 chem21.info Реклама на сайте