ПОИСК Статьи Рисунки Таблицы Дерево бинарных классификаторов образов из "Распознавание образом в химии" Другая работа по изучению возможности классификации на несколько категорий тоже проводилась на масс-спектрах низкого разрешения [12]. Массив исходных данных состоял из 600 масс-спектров низкого разрешения, заимствованных из таблиц Американского нефтяного института в записи на магнитной ленте. Это были спектры соединений с молекулярной формулой 3-ioH2-220o-4No 2. Их случайным образом разделили на 200 спектров обучающей выборки и 400 спектров контрольной выборки. Второй массив данных состоял из 600 спектров только углеводородов. Пять углеводородов с тремя атомами углерода пришлось исключить. Оставшиеся 372 соединения С4—Сю были случайным образом разделены на обучающуюся выборку из 200 соединений и контрольную из 172 соединений. При всех расчетах использовались одни и те же обучающие и контрольные выборки и поэтому результаты, даваемые разными классификационными схемами, можно было легко сравнивать. [c.88] Число существенных положений т е составляло 132, так что каждый спектр был представлен 132-мерным вектором образа. Исходные интенсивности пиков, нормированные по отношению к максимальному пику спектра, находились в диапазоне 0,01—99,99. Чтобы привести все спектры к единой шкале, интенсивности пришлось нормировать еще раз отнесением к полному ионному току или суммарной интенсивности для каждого спектра. Последующее логарифмическое преобразование перевело все интенсивности в диапазон 10—59. [c.88] В выборке для углеводородов 3,5% спектров не имели основного пика (интенсивность не превышала 0,001% полного ионного тока). [c.88] Бинарные классификаторы образов были расположены по ветвящейся схеме. Классификацию осуществляли по выборке спектров углеводородов. Каждый бинарный классификатор обучали разбиению векторов образов на две категории по схеме, изображенной на рис. 4.4. При построении шести классификаторов были использованы только те спектры, которые относились к соответствующей точке ветвления. Например, весовой вектор для точки 3 строили только для тех спектров полной обучающей выборки из 200 соединений, число атомов углерода в молекулах которых было равно 4 или 5. Прогнозирующую способность каждого весового вектора определяли аналогично на контрольной выборке из 172 векторов. Результаты такого обучения и данные о прогнозирующей способности приведены в табл. 4.17. Затем обученные весовые векторы были использованы для классификации по главной программе ветвящейся классификации. Доля правильных предсказаний составляла при этом 95,4%. [c.89] Ветвящуюся классификацию параллельными весовыми векторами проводили также на массиве из 600 спектров. Доля правильных классификаций составила 76,3%. Здесь понадобилось симметричное расположение семи бинарных классификаторов образов, чтобы разделить все углеводороды на 8 классов по числу атомов углерода в молекулах (от 3 до 10 включительно). [c.90] Вернуться к основной статье