Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Распознавание последовательное, метод

    Фу К. Последовательные методы в распознавании образов и обучении машин.— М. Наука, 1971. [c.81]

    Недостатком метода потенциальных функций является его большая чувствительность к неравномерному расположению точек обучающей последовательности в пространстве признаков. Может оказаться, например, что наибольшая плотность точек будет в тех частях каждого из классов, которые соответствуют малонаселенной области другого класса (рис. 2.10). В этом случае возможны ошибки при распознавании. Действительно, новая точка х может быть ошибочно отнесена к классу Б, так как она ближе к основной массе точек этого класса, а не к точкам своего класса А. Для компенсации этого недостатка используют специальный прием, когда увеличивают потенциал класса в областях с малой плотностью точек это повышает надежность распознавания [49]. [c.86]


    Однако, усложняя признак, дополняя его новыми условиями, можно достичь хорошего разделения обучающей последовательности, но при этом может выявиться не объективный закон, в соответствии с которым объекты разделены на классы, а предрассудок , характеризующий случайные свойства объектов обучающей последовательности. Сложность признаков и надежность их имеют определенную связь. Для устранения совокупностей сложных признаков, склонных к формированию предрассудков, применяют специальные процедуры. Так, при построении булевых моделей пользуются методом минимизации булевых функций [72, вторая ссылка 139]. Рассмотрим кратко некоторые понятия алгебры логики, необходимые для дальнейшего изложения логического аспекта теории распознавания образов. [c.257]

    Одним из методов распознавания образов является последовательная [c.31]

    В последнем разделе были очерчены основные теоретические принципы, но можно разработать почти неограниченное число вариантов связывания активных центров последовательностей и сандвичей, которые в конечном итоге достигают одной цели, а именно оценки концентрации определяемого вещества Общими чертами классических методов иммунного анализа является то, что они определяют содержание не напрямую, а с помощью меченого аналога определяемого вещества или меченой системы распознавания определяемого вещества. Они также требуют разделения сигналов от свободного и связанного меченого маркера это требование является первостепенным в иммунном анализе. [c.574]

    Чисто теоретически для однозначного предсказания результатов величина обучающей последовательности (число реализаций в массиве, используемом для обучения машины) должна превышать размерность пространства признаков, в котором проводится распознавание. Поскольку, однако, задача имеет статистический характер, то такого жесткого условия не ставится. Фактически существенным является вопрос о взаимосвязи между надежностью распознавания (Р) и соотношением между величиной обучающей последовательности (N) и размерностью пространства признаков D). В работе [9] методом математического эксперимента была проанализирована такая зависимость для случая гауссового распределения реализаций в пространствах признаков каждого из двух классов. Было показано, что вероятность правильного распознавания более 80% достигается только при N/D 2. Для N/D 3 надежность распознавания существенно не зависит ни от размерности пространства признаков, ни от незначительного перекрывания границ классов в этом пространстве. Проверка этих выводов на реальных задачах распознавания строения молекул по их спектрам показала, что и эти условия являются слишком жесткими и хорошие результаты (Р>80%) были достигнуты и при N/D = 1. Исходя из имеющегося опыта, свидетельствующего, что апостериорное число значащих признаков при распознавании катализаторов обычно не превышает 10—15, можно считать, что указанные цифры являются нижней границей величины массива обучающей последовательности в рассматриваемом круге задач. Желательно, однако, но возможности существенно увеличить этот массив. Дело в том, что указанные соотношения соблюдаются при достаточно точном определении самих значений признаков. В задачах распознавания катализаторов это имеет место не так часто, как указывалось выше. Каковы соотношения между величинами Р, N/D и а (среднеквадратичной ошибкой в определении [c.107]


    После получения обучающей последовательности и разбиения ее по классам следует составить перечень свойств катализатора или его компонентов для включения их в таблицу признаков при проведении прогнозирования методом распознавания. В основу перечня свойств, как указывалось в предыдущей главе, кладутся общетеоретические соображения, изложенные в первой главе. Список свойств допол- [c.129]

    Способность оснований к распознаванию своего партнера приводит к свертыванию двух таких сахарофосфатных цепей в структуру, известную как двойная спираль, что экспериментально установлено рентгеноструктурным методом. В этой структуре две комплементарные молекулы ДНК, каждая из которых образована ковалентными связями, удерживаются вместе в спиральной конформации гораздо более слабыми водородными связями. Поскольку взаимодействия между азотистыми основаниями в высшей степени специфичны, спираль может сформироваться лишь в том случае, если последовательности оснований в обеих цепях полностью идентичны. [c.114]

    Основываясь на этом предварительном описании методов распознавания образов, следует поставить несколько вопросов. Какие признаки должны быть выбраны Как Должны ли использоваться последовательные или одновременные измерения Могут ли служить признаками оценки переменных состояния или параметров Каким должен быть вид классификатора или дискриминирующей функции Существует небольшое количество практических ответов на первый [c.224]

    Вид профилактики определяется методом распознавания образов. Наиболее приемлемым в данном случае будет последовательный анализ Вальда, так как его применяют тогда, когда измерения по своей природе последовательны. К достоинствам данного метода относится и то обстоятельство, что он обеспечивает минимизацию среднего числа наблюдений и потерь от неверной классификации распознаваемых образцов. [c.97]

    МЕТОД РАСПОЗНАВАНИЯ СИНТЕТИЧЕСКИХ ВОЛОКОН ПОСЛЕДОВАТЕЛЬНЫМ ВОЗДЕЙСТВИЕМ РАСТВОРИТЕЛЕй  [c.53]

    Выявление и анализ закодированных в последовательностях функциональных сигналов требует применения современных методов информатики - качественных баз данных с современными средствами управления, новейших методов распознавания образов, статистических исследований, применения специальных алгоритмов для преодоления возникающих вычислительных трудностей. [c.5]

    Определенного прогресса можно ожидать в ближайшие годы в развитии методов поиска и анализа локальных функциональных сигналов в нуклеотидных последовательностях. Вероятно, применение статистических методов, методов распознавания образов, возможно, совершенно новых подходов (например, вычислительных систем типа нейронных сетей, обладающих свойствами ассоциативной памяти), позволит в ближайшие годы заметно повысить надежность теоретических предсказаний функциональных свойств последовательностей биополимеров. [c.6]

    Наиболее простой способ реализации этой процедуры связан, как и п.3.3, с использованием движущегося окна и последовательного принятия решений о принадлежности фрагментов первичной структуры ДНК (в просвете окна) к классу кодирующих или некодирующих. Недостатком такого способа, как и других методов распознавания по содержанию, являются затруднения при анализе фрагментов, содержащих внутри себя граничную позицию, т.е. частично принадлежащих к тому и другому классу одновремен- [c.100]

    Процедуру оптимизации коллектива, которая состоит в таком подборе правил и их замене, назвали селекцией. Для решения задачи селекции предлагается использование эвристического алгоритма, предусматривающего последовательное применение неформальных приемов — эвристик, в качестве которых могут выступать метод, прием, правило или стратегия Ц561. В работе [149] сравниваются эффективности различных известных методов распознавания с методом коллективного распознавания и показаны его преимущества по отношению к отдельно взятым методам минимума расстояния до средних потенциальных функций Байеса, ближайшей точки и квадратичной регрессии. [c.265]

    Реализация первой процедуры требует репгения вопроса о взаимосвязи между надежностью распознавания Р и отношением NID, где N — величина обучающей последовательности, D — размерность пространства признаков. Для случая гауссова распределения реализаций в пространствах признаков каждого из двух классов методом математического эксперимента абстрактно можно показать, что вероятность правильного распознавания более 80% достигается при NID 2 [45]. Проверка этого вывода на реальных задачах распознавания строения молекул по их пектрам показывает, что это условие является слишком жестким и хорошие результаты (Р > 80%) достигаются и при NID = 1. Очевидно, что чем больше среднеквадратическая ошибка в определении значений признаков, тем больше должно быть NID. [c.82]

    Следующий этап процедуры состопт в проведении уточняющих расчетов о природе и составе потенциальных катализаторов. Эти расчеты в зависимости от полноты знаний и типа реакции могут базироваться на расчетных методах подбора катализаторов, упомянутых в разд. 2.1. После анализа литературных и расчетных данных выполняется колшлектация обучающей последовательности. Практический опыт показывает, что на самом первом этапе обучения для подбора однокомпонентных катализаторов можно исходить из последовательности в 10—15 катализаторов, а при подборе многокомпонентных катализаторов это число надо умножить, по крайней мере, на максимально возможное число компонентов в одном катализаторе. После получения обучающей последовательности п разбиения ее по классам следует составить перечень свойств катализатора плн его компонентов для включения их в таблицу признаков при проведении прогнозирования методом распознавания. [c.88]


    Из методов теории распознавания образов для обнаружения и выявления причин неисправностей, основанных на непараметрическом (со свободными распределениями) подходе к устаков-лению стратегии классификации, можно выделить дискретный анализ, кластерный анализ и последовательные непараметрические методы классификации. [c.86]

    Модуляционный метод обычно используют в дефектоскопии для оценки пространственного распределения свойств объекта. Если ВТП и объект взаимно перемещаются, то изменения свойств объекта, распределенные в пространстве, преобразуются в изменения сигнала во времени. Полученный от ВТП сигнал усиливается и детектируется, а затем анализируется огибающая высокочастотных колебаний. Структурная схема вьщеления информации модуляционным методом отличается от схем, приведенных на рисунках 3.4.9 и 3.4.10, только наличием усилителя огибающей, фильтров и блока распознавания сигналов, последовательно включенных межпу детектором и индикатором. [c.172]

    Частичное упорядочивание, к которому приводит наш теоретико-графовый анализ, позволяет расположить структуры в соответствии с выбранными стандартами. Примерами являются сравнение дофаминов [9], обсуждение бензморфанов [10] и даже попытка установить связь с активностями небольших пептидов [11]. Совсем недавно последовательности цепей были использованы при разработке метода неэмпирического распознавания образов для классификации лекарственных препаратов, обладающих высокой активностью и различных по действию, — метода, в котором полностью отсутствует какая-либо подгонка параметров [12]. Послед- [c.223]

    База данных Р1К содержит 19 последовательностей гистонов Н1, из которых 16 было отобрано нами в базу знаний для построения методов распознавания. Оставшиеся 3 последовательности не были использованы в базе знаний, так как представляют собой фрагменты полных последовательностей гистонов Н1. Из них 2 последовательности длиной менее 40 аминокислотных остатков не приринимались во внимание при анализе баз данных, так как минимальная длина последовательностей при сканировании была равна 50-ти аминокислотным остаткам. Что же касается 3-й последовательности, то в ней [c.256]

    Многие из методов переноса поляризации, разработанных первоначально для гетероядерных систем, могут быть приспособлены для изучения гомоядерных спин-спиновых взаимодействий. Разработано множество методов редактирования, которые основаны на распознавании спиновой конфигурации . Эти методы чувствительны к топологии спин-спиновых взаимодействий и позволяют упростить анализ сложных перекрывающих протонных спектров. Поскольку многие из этих методов выводятся из двумерной спектроскопии, более подробно мы их рассмотрим в гл. 8. Здесь достаточно упомянуть, что многоквантовые фильтры позволяют выборочно выделить сигналы взаимодействующих групп, содержащих по меньшей мере определенное минимальное число взаимодействующих ядер. Так, двухквантовую фильтрацию можно применить для выделения сигналов от взаимодействующих пар ядер углерода-13 [4.165] и от взаимодействующих систем по крайней мере с двумя ядрами [4.166 — 4.170]. Чтобы выделить сигналы, относящиеся к более сложным спиновым системам, были использованы многоквантовые фильтры более высокого порядка [4.171 —4.173]. При помощи так называемых методов /7-спиновой фильтрации в благоприятных случаях можно подавить сигналы спиновых систем с числом ядер 7V > р м 7V < р [4.173]. И наконец, при помощи специальных последовательностей импульсов, подобранных для спиновой системы [4.174, 4.175], можно разделить сигналы, соответствующие группам спинов, связанных со спин-спиновыми взаимодействиями различной топологии (конфигурации), но с одинаковым числом ядер. Например, можно разделить четырехспиновые системы типа АзХ и А2Х2. В будущем можно ожидать появления большого числа методов усиления и редактирования сигналов, поэтому любая попытка сделать полный обзор этих методов не только выходит за рамки настоящей главы, но и вскоре может быстро устареть. Поэтому мы обсудим лишь некоторые из методов, которые могут помочь в понимании основных принципов. [c.226]

    В зависимости от конкретной экономической конъюнктуры обычно имеют место два типа исследований по поиску катализаторов либо исследуется относительно небольшое количество наиболее вероятных веш,еств или их комбинаций для быстрого решения проблемы, либо приводятся очень широкие исследования с задачей во что бы то ни стало найти решение. С точки зрения задач прогнозирования в первом случае надо достаточно надежно определить круг наиболее вероятных объектов, а во втором отбросить явно непригодные. Это достигается решением трехклассной задачи, в которой верхняя граница проводится между безусловно пригодными и прочими катализаторами, а нижняя ограничивает явно невыгодные объекты. Из соображений надежности решения, о чем будет сказано далее, решение трехклассных задач лучше проводить последовательной дихотомией . Тогда при вероятности прогноза на каждой из стадий решения в 85% вероятность ошибочйого отнесения объекта из одного крайнего класса в другой составит (1—0,85) = 0,023. Таким образом, при первом из указанных подходов к задаче поиска вероятность засорения исследуемых объектов явно невыгодными равняется только 2,3%, а при втором подходе вероятность потери наиболее удачных решений составит ту же величину. Эти оценки подтверждают высокую эффективность применения методов распознавания при поиске катализаторов, даже при относительно низкой доверительности каждого шага решения. [c.103]

    Результаты машинного прогноза подвергаются экспериментальной проверке. Рассмотрим сперва наиболее трудоемкий и часто встречающийся случай полного отсутствия литературной иформа-ции. Тогда по сути мы имеем дело с планированием экспериментов по подбору катализаторов с использованием метода математической теории распознавания. План таких экспериментов является частью блок-схемы (см. схему). Прогнозы, полученные от машины на основе обучающей последовательности, построенной на первой серии собственных экспериментов, проверяются экспериментально. После этого составляется новая обучающая последовательность, которая состоит из первой и второй серии экспериментов. Выбираются объекты для второго тура прогноза и проводится прогнозирование машиной. Прогноз вновь проверяется экспериментально. Если полученные результаты удовлетворяют исследователя, отобранные катализаторы исследуются далее для уточнения их состава, структуры и режимов работы. Если полученные результаты не являются удовлетворительными либо в отношении точности прогноза, либо достигнутых [c.130]

    Химические исследования, проведенные в последние 20 лет, показали, что пространственные структуры белков необычайно сложны, а формы их молекул имеют решающее значение для осуществления каждым белком его специфической биологической функции. Полипептидная цепь, состоящая из сотен связанных друг с другом аминокислот, принимает такую пространственную форму (называемую конформацией), которая определяется его аминокислотной последовательностью. Например, молекула коллагена — белка, придающего прочность коже и костям, — имеет форму стержня. Антитела представляют собой молекулы -образной формы с выемками, которые служат для распознавания чужеродных веществ и запуска реакций, обеспечивающих их эффективное обезвреживание. Ценная информация об их архитектуре была получена в рентгеноструктурных исследованиях. Молекулы ферментов имеют щели, называемые активными центрами , в которых связывание реагентов осуществляется таким образом, что становится возможным образование новых химических связей между ними. Таким образом, определенной биологической функции белка соответствует определенная конформация. Основные успехи в исследовании конформации белков были получены с помощью рентгеновских лучей, а также нейтронных и электронных пучков и других методов, которые позволяют нам как бы увидеть белок под увеличением в миллион раз и более. Выяснение конформаций белка показывает, как он выполняет свою биологргаескую функцию. [c.173]

    Для идентификации различных типов углеводородов и се-русодержащих соединений довольно успешно применялся метод последовательного распознавания [62], в котором каждой координате масс-спектра приписывалось число, называемое информативностью. Распознавание неизвестных соединений осуществляется последовательно — от наиболее информативных координат до координат с меньшей информативностью [63]. [c.47]

    Объекты реализации, по которым определяются гиперповерхности, отграничивающие классы, называются обучающей последовательностью. При отсутствии строгого качественного различия в поведении объектов границы ь лассов выбираются произвольно. При делении объектов на классы мы теряем )н>которую информацию о количественных значениях их каталитической активности, но зато сводим практически нерешаемую з 1дачу многомерной корреляции для большого множества нри5каг ов к задаче распознавания образов. Целями настоящего исследования были следующие принципиальное установление эффективности применения статистических методов распознавания к прогнозированию каталитического действия разработка методики решения задач распознавания применительно к реальным проблемам прогнозирования каталитического действия. Одновременно был проведен теоретический анализ ре.зультатов, полученных на данном этапе исследований. [c.211]

    Рассматривая последовательные этапы развития автоматических методов диагностики, некоторые авторы выделяют алгоритмы, диагностические программы ЭВМ и соответствующие автоматизированные системы 1-го и 2-го поколений (в дальнейшем мы будем обобщенно называть системой всю эту совокупность автоматизированных диагностических средств). Под системами 1-го поколения понимаются автоматизированные системы, которые реализуют средствами ЭВМ формализованные диагностические правила, общеп ЖНятые в клинической диагностике на основе стандартной методики регистращ1и и параметризации сигналов соответствующих физических полей организма. Системами 2-го поколения считаются системы, в которых интенсивно используются статистические методы распознавания и классификации объектов, причем правила принятия диагностического решения вырабатываются предварительно в клинико-статистических исследованиях достаточно больших по численности и хорошо верифицированных групп испытуемых. Количественными характеристиками измеренных сигналов в этих исследованиях могут служить как общепринятые, так и любые другие параметры, извлекаемые из исходной записи статистическая обработка позволяет оценить диагностическую информативность этих параметров для конкретной исследуемой популяции. [c.275]

    Когда говорят о задаче компьютерного распознавания или идентификации кодирующих областей на известной последовательности ДЖ, имеют в виду следующее. По исходной нуклеотидной последовательности необходимо определить, содержит ли этот фрагмент ДЖ (по прямой или комплементарной нити) белок-кодирующие участки, и указать их точные границы. Кроме того, необходимо дать оценку надежности предсказания. Методы, алгоритмы и программы, предложенные для решения этой задачи, пока еще не достигли исчерпывающего уровня надежности, и полученные с их помощью варианты предсказания разметки нуклеотидного текста на кодирующие и некодирующие области требуют дополнительного анализа (Stormo,198 ). [c.82]

    Метод Фиккетта. Следующим шагом в развитии методов распознавания универсального типа явилась работа Фиккетта (Fi kett,1982), в которой был предложен способ вычисления количественного критерия для ответа на вопрос, являтся ли обнаруженная в нуклеотидном тексте ОРС истинной кодирующей областью. Здесь впервые были исследованы как выборки кодирующих, так и выборки некодирующих областей ДЖ различных организмов. Первая из них содержала 230 тыс. нуклеотидов, а вторая - 159 тыс. нуклеотидов. Основная идея близка к методу линейного дискриминантного анализа и заключается в поиске таких, достаточно простых, признаков рассматриваемых объектов (последовательностей ДЖ), разбитых на два [c.88]

    Модели двух классов объектов. В гл. 2 при обсуждении общей задачи статистического моделирования нуклеотидных последовательностей было отмечено, что генетический текст нестационарен и что не существует единой модели, одинаково хорошо описывающей первичную структуру генома на всем его протяжении. В связи с этим для описания кодирующих и некодирующих областей ДНК были предложены марковские модели разного типа. Представления, изложенные в гл.2, могут быть использованы в методе распознавания кодирующих областей. На первом этапе производится 1-граммный анализ выборок известных кодирующих и некодирующих областей (обучающих выборок). В результате этого анализа определяются переход-ные вероятности неоднородной и однородной цепей Маркова, которые служат моделями кодирующих и некодирующих областей соответственно. Далее эадача заключается в том, чтобы разметить предъявленный генетический текст на чередующиеся зоны, одни из которых статистически наиболее близки к модели кодирующей области, а другие модели некодирующей области. [c.100]


Смотреть страницы где упоминается термин Распознавание последовательное, метод: [c.25]    [c.169]    [c.169]    [c.172]    [c.179]    [c.186]    [c.186]    [c.191]    [c.248]    [c.239]    [c.149]    [c.150]    [c.133]    [c.142]    [c.102]    [c.74]    [c.117]    [c.90]   
Молекулярный масс спектральный анализ органических соединений (1983) -- [ c.47 ]




ПОИСК





Смотрите так же термины и статьи:

Распознавание



© 2025 chem21.info Реклама на сайте