Итерационное обучение по методу наименьших квадратов

из "Распознавание образом в химии"

Разработан другой полезный для химических приложений способ построения весовых векторов по методу наименьших квадратов [7]. Образы аппроксимируют при помощи невырожденной функции с линейными параметрами существуют разные способы такой аппроксимации. Авторами была использована линеаризация — разложение в ряд Тейлора [8]. Этот метод предполагает использование резу льтатов линеаризации по методу наименьших квадратов последовательными этапами. [c.75]
Величина К,- считается равной +1, если образ принадлежит первой категории, и —1, если образ принадлежит второй категории. Затем необходимо найти такой весовой вектор , чтобы разделяющая функция я(Хг) приобретала положительное значение, если ответ равен +1, и отрицательное, когда У—I. Компоненты вектора У определяют обычной линеаризацией по методу наименьших квадратов. [c.76]
Необходимо найти такой весовой вектор У, при котором функция Q становится минимальной. Как и раньше, N — число образов в обучающей выборке. [c.76]
Матрица А — действительная, симметричная, положительно определенная, следовательно, она не вырождена, так что система имеет единственное решение. Его можно найти любым методом решения системы линейных уравнений — прямым или итерационным. [c.77]
В рассматриваемом исследовании область задания F ограничена замкнутым интервалом (—2,5, +2,5) при этом значения функции F оказывались в интервале (—0,987, +0,987). Начальные значения весового вектора выбирали таким образом, чтобы удовлетворить условию Si 2,5. Когда это требование выполняется, скорость сходимости возрастает, поскольку в этом случае значения компонент мало изменяются и ошибки при вычислении W незначительны. [c.78]
Для решения системы линейных уравнений существует много прямых методов. В рассматриваемом исследовании исключение переменных осуществляли по методу Гаусса — Жордана с полной привязкой. Подпрограмма считала обратную матрицу, определитель и вектор решения. [c.78]
Из всего массива данных были составлены две выборки — обучающая и контрольная. Обучающая выборка обычно состояла из 150 выбранных случайно масс-спектров, которые использовались для построения весовых векторов. Контрольную выборку составляли нз некоторых или же из всех оставшихся образов. На такой выборке проверяли способность созданного классификатора распознавать неизвестные образы. [c.79]
Итерационным методом наименьших квадратов определяли присутствие кислорода в составе органических соединений небольшого молекулярного веса. При этом был проведен отбор признаков, в результате чего из 132 исходных признаков остался 31 признак. Доля верных предсказаний составила при полном распознавании 93,9%. [c.79]
В этой задаче F, считали равным +1, если г-й спектр свидетельствовал о присутствии кислорода, и —1 в противном случае. Начальные компоненты весовых векторов брали по такому правилу при Wj=p величину wj i считали равной —р. Значение Wi было равно либо -f0,01, либо —0,01. Эти начальные значения обеспечивали попадание скалярного произведения в диапазон (—2,5, +2,5). Как оказалось, минимизация расстояния между кластерами ускоряет сходимость. [c.79]
В табл. 4.14 приведены результаты определения присутствия кислорода как по 31 первоначальному пику, так и после дальнейшего отбора признаков. При почти полном распознавании прогнозирующая способность составляла 98% независимо от числа используемых признаков. [c.80]
Другой пробной задачей было определение присутствия или отсутствия атомов азота в составе органических соединений с небольшим молекулярным весом. Число признаков сократили от 132 до 43. Из этих 43 признаков оставили 31 признак с меньшими значениями отношения mie. Как и в случае кислорода, величину Y i считали равной +1, если спектр отражал содержание азота, и —1 в противном случае. Начальные значения весовых векторов выбирали в прежнем порядке. [c.80]
В табл. 4.15 приведены результаты определения присутствия азота как по 31 исходному пику, так и после дальнейшего отбора признаков. И здесь не наблюдалось снижения распознающей и прогнозирующей способностей. Доля верных предсказаний составила 96,7% для 31 признака и 98% для 21 признака. [c.80]

Вернуться к основной статье

Справочник химика 21

Химия и химическая технология