Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Отбор признаков

    При построении процедуры предварительного выбора и последующего отбора признаков для распознавания обычно желательно свести к минимуму число распознающих признаков. Последнее объясняется ограниченными длинами обучающих последовательностей, наличием шумов от случайных признаков и т. п. Сокращение числа признаков проводят последовательно в два этапа сначала априорно, исходя из общих теоретических положений и существующих знаний о свойствах твердого тела, которые определяют его каталитическую активность затем, в ходе собственно процесса распознавания, с помощью соответствующим образом сконструированных алгоритмов распознавания. [c.82]


    VI,3.5. Выделение и отбор признаков [c.248]

    Этот критерий хорошо работает тогда, когда различия между классами в первую очередь определяются различиями в некоторых средних значениях. Если все средние значения одинаковы, т. е. Ф = О, возможность дискриминации все же имеется из-за отличия в моментах более высоких порядков. Это принципиальная трудность работы со всеми критериями для выявления и отбора признаков, которые основаны на ошибке классификации они могут давать максимальные значения в неоптимальных ситуациях и могут оказаться минимальными в полезных ситуациях. Критерием оценки важности /-Г0 признака для дискриминации классов I и V служит критерий Фишера [c.248]

    Критерий Фишера может быть также использован дЛя распределения признаков по рангам. Однако такой метод отбора признаков не отражает взаимосвязей между ними. Можно показать, что, в общем случае, К лучших признаков не есть лучшие К признаков [125]. Необходимо поэтому иметь многомерные критерии. Например, расстояние по Махаланобису [c.249]

    При их формировании варьировались различные характеристики, такие как объем и состав обучающих выборок, эвристические пороги отбора признаков в решающие наборы. [c.10]

    Существенно более сложной проблемой является предваритель-лый выбор и последующий отбор признаков для распознавания. [c.108]

    При разработке таксономической классификации сходство между объектами определяли в три этапа отбор признаков, вычисление сходства и образование групп. Не вдаваясь в подробности математических расчетов таксономических отношений, характеризующих степень сходства различных изделий и их элементов, воспользуемся результатами этих расчетов и классифицируем изделия по конструктивному признаку (рис. 29). [c.66]

    Для каждого из этих четырех преобразований проводили машинный просчет по программе отбора признаков. Главные моменты обычной процедуры отбора признаков заключались в том, что на каждом ее этапе осуществлялось обучение на двух весовых векторах (ВВ), компоненты которых во всех случаях считались первоначально равными либо +1 (ВВ = +1), либо —1 (ВВ = —1) затем знаки компонент весовых векторов сопоставлялись. На очередном этапе оставляли только те положения т/е, для которых компоненты весовых векторов имели одинаковый знак. Процедуру обучения проводили до тех пор, пока не достигалась полная ясность в отношении всех положений т/е. На этом программа обучения заканчивалась. [c.31]

    В табл. 4.13 приведены результаты обучения и данные о прогнозирующей способности, полученные при классификации по этим выборкам СЭ-полярограмм. В таблице отражены рассмотренные раньше пять этапов отбора признаков и процесса обучения. Ответ [c.73]


    Итерационным методом наименьших квадратов определяли присутствие кислорода в составе органических соединений небольшого молекулярного веса. При этом был проведен отбор признаков, в результате чего из 132 исходных признаков остался 31 признак. Доля верных предсказаний составила при полном распознавании 93,9%. [c.79]

    В табл. 4.14 приведены результаты определения присутствия кислорода как по 31 первоначальному пику, так и после дальнейшего отбора признаков. При почти полном распознавании прогнозирующая способность составляла 98% независимо от числа используемых признаков. [c.80]

    В табл. 4.15 приведены результаты определения присутствия азота как по 31 исходному пику, так и после дальнейшего отбора признаков. И здесь не наблюдалось снижения распознающей и прогнозирующей способностей. Доля верных предсказаний составила 96,7% для 31 признака и 98% для 21 признака. [c.80]

    ГЛАВА 5 ОТБОР ПРИЗНАКОВ [c.107]

    Во многих проблемах распознавания образов образы разных классов настолько перемешаны между собой, что для их разделения на категории приходится использовать нелинейные методы. Поэтому общую задачу классификации целесообразно разделить на две части, первая из которых сводится к такому упрощению общей задачи, которое позволяет решить вторую часть. Таким образом, первоочередная задача отбора признаков заключается в уменьшении размерности без ущерба для разделения. При надлежащем и эффективном отборе признаков размерность обрабатываемых данных снижается до такого уровня, на котором не так трудно брать ту или иную разделяющую функцию. [c.107]

    Обработку исходных данных для отбора признаков можно осуществлять в двух направлениях  [c.107]

    Поясним разницу между этими двумя направлениями на примере. Когда нас интересуют, скажем, органические соединения с молекулярным весом - 300, мы подбираем сведения о масс-спектрах для значений mie, лежащих приблизительно в диапазоне 12—300. Это дает 288 дескрипторов. Естественно, среди них будут и положения mie, которые не соответствуют пикам. Такие положения только увеличивают размерность пространства изображений и не несут никакой информации, поэтому при формировании векторов образов их отбрасывают. В этом заключается сущность первого направления отбора признаков. Второе направление реализуется в том случае, когда пытаются определить, какое подмножество положений mie коррелирует с интересующей химической особенностью рассматриваемых органических соединений. Поскольку в центре наших рассуждений находится бинарная классификация, [c.107]

    При отборе признаков по первому направлению используется информация, содержащаяся только в исходных данных, например статистические параметры, вычисленные из таких данных. Этот подход тесно связан с предварительной обработкой данных и с полным правом может считаться ее составной частью. Отбор признаков по второму направлению предполагает также использование в качестве критериев при отборе важных признаков результатов обучения разделению. [c.108]

    Главная теоретическая трудность при отборе признаков, как и при предварительной обработке исходных данных, заключается в том, что делать выводы о полученных результатах приходится по показаниям классифицирующего звена всей распознающей системы, т. е. использовать всю систему, что создает дополнительные затруднения. [c.108]

    Следует отметить, что единственным надежным способом выявления оптимального подмножества, состоящего из т признаков, из всей совокупности п признаков было бы расчетное определение вкладов в формирование образов для всех таких подмножеств, а их число, как известно, равно Ст = п /(п—m) ml. Перебрать же исчерпывающим образом все такие случаи не представляется возможным даже для совокупности данных умеренного объема. Поэтому приходится прибегать к помощи эвристических методов. Применительно к химическим данным, как правило, используют специальные методы отбора признаков, поскольку, как выяснилось, они дают положительный результат при решении задач отбора признаков по уже упоминавшимся двум направлениям. [c.108]

    В литературе по распознаванию образов описаны разнообразные способы отбора признаков [1— 5]. Однако только некоторые из них были применены к химическим данным. Прежде всего это объясняется тем, что распознавание образов в массиве химических данных по характеру рассматриваемой информации носит непараметрический характер. Известные методы отбора признаков пригодны в основном для обработки таких совокупностей данных, функции распределения для которых либо уже известны, либо поддаются расчету. Например, анализ главных компонент получил широкое распространение в области распознавания образов, однако применительно к химическим данным его не используют, поскольку он пред- [c.108]

    Ниже пойдет речь об исследовании методов отбора признаков применительно к химическим данным. [c.109]

    В задачу исследования входило обучение весового вектора определению числа атомов кислорода в молекуле для случаев, когда оно было равно О, 1 или 2. Настраивание весового вектора по методу наименьших квадратов позволило правильно классифицировать 123 из 130 спектров, что соответствовало распознающей способности 94,6%. (Поправка с учетом линии наилучшего совпадения сократила число ошибочных расчетов от девяти до семи.) Затем была исследована процедура отбора признаков. [c.109]


    Результаты обоих методов отбора признаков оказались сопоставимыми, хотя по некоторым показателям отбор по критерию R j был несколько лучше. Интересно отметить, что при отборе признаков по критерию R j исключение первых 45 положений с оставлением всего лишь 35 возможных положений (со спектром, содержа- [c.109]

Рис. 5.1. Распознающая способность как функция числа положений, исключенных при отборе признаков по Рис. 5.1. Распознающая способность как <a href="/info/767210">функция числа</a> положений, исключенных при отборе признаков по
    Эти же два метода отбора признаков — по весу и по критерию Н — рассматриваются в статье [7] применительно к бинарным классификаторам образов, корректируемым через обратную связь, а также в работе [8], посвященной распознаванию образов на основе данных из разных источников (результаты для этих данных были приведены в табл. 3.2). [c.111]

    ОТБОР ПРИЗНАКОВ ПО ЗНАКУ ВЕСОВЫХ ВЕКТОРОВ [9] [c.111]

    Рассмотренные выше методы отбора признаков носят алгоритмический характер причем число признаков, исключенных на каждом этапе, устанавливалось заранее. Эти алгоритмы не позволяют определить, когда же следует прекращать отбор признаков. Признаки исключались даже в тех случаях, когда их отбрасывание значительно ухудшало распознающую способность классификатора. Это обстоятельство стимулировало разработку динамического метода отбора признаков, итог которого зависит от условий, складывающихся в процессе такого динамического отбора. Иными словами, признаки отбрасываются до тех пор, пока не останется ни одного признака, который не давал бы существенного вклада в общее решение. На этой стадии отбор признаков прекращается. Динамический отбор успешно использовался при обработке масс-спектров, однако прежде чем приступить к изложению самого метода, следует описать массив исходных данных. [c.111]

    Масс-спектрометрические данные, состоящие из 119 признаков каждого образа, исследовали по программе отбора признаков, в основу которой был положен метод линейной обучающейся машины. При этом проводили следующие операции. Два весовых вектора обучали обнаруживать наличие и отсутствие кислорода. Все компоненты одного из них считались первоначально равными +1, тогда как всем компонентам другого приписывали значение —1. Затем эти два вектора обучали классифицировать объекты обучающей выборки. Оценив прогнозирующую способность каждого из них, исключали те положения mie, которые для классификации несущественны. Делалось это путем сравнения компонент двух весовых векторов, соответствовавших одному положению mle если обе компоненты имели одинаковый знак, то такую позицию признавали хорошо коррелирующей и сохраняли, причем отрицательный знак означал отсутствие кислорода, а положительный — его наличие. Те же положения mie, для которых компоненты двух весовых векторов имели разные знаки, считали неясными и исключали. Проверив таким образом все положения mie, процесс обучения начинали снова на спектрах уменьшенной размерности и повторяли его [c.112]

    В табл. 5.1 приведены результаты отбора признаков при классификации по наличию или отсутствию кислорода. Классификаторы [c.113]

    Обучение распознаванию присутствия кислорода с отбором признаков [c.113]

    Из 31 положения mie, выбранного в процессе отбора признаков, 14 имели положительные компоненты весового вектора, т. е. коррелировали с наличием кислорода. В табл. 5.3 эти значения mie перечислены вместе с соответствующими им структурными элементами (привязку проводили по сводке фрагментов, составленной из опуб- [c.115]

    Процедура, с помощью которой из пространства измерений отбираются наиболее информативные признаки, называется отбором признаков. Цель отбора признаков — добиться наибольшего эффекта распознавания при наименьшем числе признаков. Для этого используют такие методы, как максимизация кластери-зуемости, минимизация дивергенции, отбор наименьшего числа признаков при сохранении дисперсии распределения, просеивание — скрининг и др. [c.78]

    В отличпе от отбора, основанного на глубоком анализе физико-химической сущности объектов, формальные процедуры отбора признаков носят вспомогательный характер. Поэтому процедура отбора должна иметь диалоговую, итерационную природу интеллектуального общения ЛПР—ЭВМ. Например, существенной является оценка исследователем меры доверия для априорных данных из различных источников. В работе [461 кинетическим измерениям приписывался вес, равный 1, литературным данным по испытанию активности катализаторов — 0,75, а патентным — 0,5 (учитывалось, что патентные данные иногда искажаются). [c.83]

    В связи с предварительной обработкой исходных данных получили распространение следующие термины препроцессорная обработка, трансгенерирование или преобразование отбор признаков выделение признаков. Препроцессорная обработка и трансгенерирование относятся к изменению единичных компонент вектора образов. Хотя для преобразования этих компонент могут быть использованы разные функциональные зависимости, размерность пространства изображений остается при этом прежней. Следовательно, здесь речь идет о преобразованиях, которые не изменяют размерности пространства изображений. Отбор признаков означает выбор в исходных данных таких признаков, которые считаются более важными. Выделение признаков относится к сочетанию отдельных элементарных признаков в признаки более высокого уровня. Эти операции предполагают преобразования, при которых размерная [c.29]

    Чтобы оценить эффект комбинирования данных из разных источников, соединения классифицировали по наличию одной или нескольких двойных связей. Попытки осуществить такую классификацию исходя только из ИК Образов или только из масс-спектрометрических образов не принесли заметного успеха, о чем можно судить по данным, приведенным в первых двух разделах табл. 3.2. В каждом их этих двух случаев брали 125 исходных параметров (координат) и путем обычной процедуры отбора признаков отбрасывали те из них, которые из-за относительно малой величины соответствующих компонент весовых векторов считались сравнительно малозначащими. В случае ИК-спектров прогнозирующая способность, составлявшая 82%, начинала быстро убывать, когда оставалось менее 50 параметров. В случае масс-спектрометриче-ских данных прогнозирующая способность находилась на уровне 87% затем она медленно убывала с уменьшением числа параметров, пока оно не доходило до 20 после этого прогнозирующая способность быстро падала до уровня случайного угадывания. Масс-спектрометрические данные тоже не обеспечивали сходимости в пределах отведенного числа коррекций через обратную связь, когда оставалось менее 50 параметров. [c.37]

    Об одной из первых попыток отбора признаков для масс-спектров низкого разрешения сообш,ается в статье [6]. Эти данные и применявшийся способ обучения весовых векторов по методу наименьших квадратов были подробно описаны в гл. 4 настоящей книги. В использованных спектрах было закодировано по 80 положений т/е. [c.109]


Смотреть страницы где упоминается термин Отбор признаков: [c.245]    [c.8]    [c.33]    [c.108]    [c.109]    [c.111]    [c.113]    [c.113]    [c.113]    [c.114]    [c.114]    [c.115]    [c.115]   
Смотреть главы в:

Распознавание образом в химии -> Отбор признаков




ПОИСК





Смотрите так же термины и статьи:

Выделение и отбор признаков

Действие отбора на фенотипические признаки

Количественные признаки Методы искусственного отбора и их генетическое обоснование Семенов)

Количественный признак изменение при отборе

Отбор признаков по знаку весовых векторов

Отбор признаков при помощи метрики расстояний

Отбор у дрозофилы на некоторые внешние признаки

Отбор у дрозофилы на некоторые инвариантные признаки

Отбор у дрозофилы признаков по дисперсии



© 2025 chem21.info Реклама на сайте