Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English

Отбор признаков по знаку весовых векторов

    Методом отбора признаков по знаку весовых векторов пользовались и авторы работы [12] при исследовании вольт-амперных характеристик стационарного электрода (СЭ-полярограмм), которое было описано в гл. 4. Из массива исходных данных первоначально было отобрано 133 признака, затем это число сократили отбором по знаку весовых векторов до 57 практически без всякого ущерба для распознающей способности. Способность к разделению по таким СЭ-полярограммам одно- и двухкомпонентных соединений оказалась для обучающей выборки равной приблизительно 96%, причем число неясных случаев составляло / 5—6%. Дальнейшее сокращение числа признаков осуществлялось отбором по методу, изложенному в предыдущем разделе настоящей главы. [c.124]


    ОТБОР ПРИЗНАКОВ ПО ЗНАКУ ВЕСОВЫХ ВЕКТОРОВ [9] [c.111]

    Рассмотренные выше работы легли в основу другого исследования, целью которого было изучение возможностей итерационного обучения распознаванию образов по методу наименьших квадратов. Этот метод, подробно описанный в гл. 4, сочетался с отбором признаков по знаку весовых векторов, причем массив масс-спектрометрических данных был большего объема [11]. [c.118]

    Наконец, для сравнительной оценки на этой выборке данных был осуществлен отбор признаков по программе учета знаков весовых векторов. Программа предусматривала обучение двух весовых векторов всем компонентам одного из них приписывается первоначальное значение +1, а всем компонентам другого — значение —1. После обучения знаки отдельных компонент сопоставляют, отбрасывая те из них, которые имеют разные знаки. Обучение продолжают до тех пор, пока не прекращается исключение признаков. В рамках данной задачи это привело к отбрасыванию всего 12 из 50 признаков, но обеспечило высокую прогнозирующую способность — 97,8% при 38 оставшихся дескрипторах. [c.128]

    В третьей колонке табл. 7.3 приведено число дескрипторов, оставшихся после отбора признаков по знаку весового вектора, который проводился обучающейся машиной. Такие дескрипторы считались важными свидетельствами наличия того или иного пика в конкретном положении для данного уровня пороговой интенсивности, установленного для исследуемого массива данных. Несмотря на то обстоятельство, что, число оставшихся дескрипторов во многих случаях было весьма незначительным и составляло лишь небольшую долю от 61 исходного дескриптора, весовые векторы сохраняли ту же прогнозирующую способность, что и для всего числа исходных дескрипторов. [c.186]

    Для каждого из этих четырех преобразований проводили машинный просчет по программе отбора признаков. Главные моменты обычной процедуры отбора признаков заключались в том, что на каждом ее этапе осуществлялось обучение на двух весовых векторах (ВВ), компоненты которых во всех случаях считались первоначально равными либо +1 (ВВ = +1), либо —1 (ВВ = —1) затем знаки компонент весовых векторов сопоставлялись. На очередном этапе оставляли только те положения т/е, для которых компоненты весовых векторов имели одинаковый знак. Процедуру обучения проводили до тех пор, пока не достигалась полная ясность в отношении всех положений т/е. На этом программа обучения заканчивалась. [c.31]

    Масс-спектрометрические данные, состоящие из 119 признаков каждого образа, исследовали по программе отбора признаков, в основу которой был положен метод линейной обучающейся машины. При этом проводили следующие операции. Два весовых вектора обучали обнаруживать наличие и отсутствие кислорода. Все компоненты одного из них считались первоначально равными +1, тогда как всем компонентам другого приписывали значение —1. Затем эти два вектора обучали классифицировать объекты обучающей выборки. Оценив прогнозирующую способность каждого из них, исключали те положения mie, которые для классификации несущественны. Делалось это путем сравнения компонент двух весовых векторов, соответствовавших одному положению mle если обе компоненты имели одинаковый знак, то такую позицию признавали хорошо коррелирующей и сохраняли, причем отрицательный знак означал отсутствие кислорода, а положительный — его наличие. Те же положения mie, для которых компоненты двух весовых векторов имели разные знаки, считали неясными и исключали. Проверив таким образом все положения mie, процесс обучения начинали снова на спектрах уменьшенной размерности и повторяли его [c.112]


    Метод отбора признаков сводился к использованию двух разных исходных весовых векторов. Естественно, что обучающая выборка в этих случаях была одинаковой. После обучения сопоставляли знаки компонент весовых векторов. Если знаки оказывались одинаковыми, то соответствующее положение mie сохраняли, если же они были разными — соответствующее положение исключали. Отбор признаков по этому принципу не отразился ни на распознающей, ни на прогнозирующей способности классификатора. [c.121]

    Обнаруженные корреляции между дескрипторами и положениями mie можно разделить на два типа истинные корреляции между фрагментами структуры и положениями mie и случайные корреляции, или артефакты, обучающих выборок. Чтобы снести к минимуму число подобных артефактов, корреляции для трех обучающих выборок рассматривали как единое целое. После завершения обучения и отбора признаков по каждому положению mie оставалось по три пары весовых векторов и три набора дескрипторов для данного положения. Поскольку имелись три обучающие выборки, не все дескрипторы в трех перечнях были одинаковыми. Если какой-то дескриптор фигурирует во всех трех перечнях, то это должно указывать на сильную корреляцию. И, что еще важнее, когда компоненты каждой пары весовых векторов для таких дескрипторов имеют одинаковые знаки, корреляцию можно считать реальной. (Пара весовых векторов в случае одной и той же обучающей выборки имеет для каждого дескриптора одинаковые знаки, но не обязательно одинаковую величину это есть следствие метода отбора признаков для сокращения числа дескрипторов.) [c.188]

    В табл. 7.12 указаны результаты применения программы отбора признаков к совокупностям данных, сведения о которых были приведены в табл. 7.11. Программа отбора признаков пытается определить, какие дескрипторы молекулярной структуры важны при поиске решения конкретной химической задачи. Делается это следующим образом. Для данного масс-спектрометрического пика и исследуемого порога интенсивности независимо обучают два весовых вектора с разными исходными значениями. Затем в процессе отбора признаков исключаются те дескрипторы, которые ничего или почти ничего не дают для решения задачи. Осуществляется это путем сравнения знаков компонент двух весовых векторов. При этом сохраняют только такие дескрипторы, для которых компоненты обоих весовых векторов имеют одинаковые знаки. Следовательно, данная процедура приводит к сокращению размерности двух сохраняемых весовых векторов. Отбор признаков продолжают до тех пор, пока не останется малозначащих дескрипторов. [c.214]


Смотреть страницы где упоминается термин Отбор признаков по знаку весовых векторов: [c.144]    [c.146]   
Смотреть главы в:

Распознавание образом в химии -> Отбор признаков по знаку весовых векторов




ПОИСК





Смотрите так же термины и статьи:

Вектор

Вектор признаков

Отбор признаков



© 2025 chem21.info Реклама на сайте