Справочник химика 21

Химия и химическая технология

Статьи Рисунки Таблицы О сайте English
Третий способ классификации объектов на несколько категорий — метод наименьших квадратов [9].

ПОИСК





Классификация по методу наименьших квадратов

из "Распознавание образом в химии"

Третий способ классификации объектов на несколько категорий — метод наименьших квадратов [9]. [c.103]
Нормальные уравнения решают обычным путем, чтобы определить весовой вектор W, удовлетворяющий критерию наименьших квадратов. [c.103]
необходимое для расчетов по методу наименьших квадратов, пропорционально квадрату размерности задачи и по меньшей мере первой степени числа образов. Когда категорий мало, классификация по методу наименьших квадратов обычно требует больше времени, чем использование набора бинарных классификаторов. Тем не менее, поскольку объем вычислений по методу наименьших квадратов не зависит от числа категорий, его эффективность возрастает с увеличением их числа. Метод наименьших квадратов применим, впрочем, только в том случае, когда категории можно количественно упорядочить. [c.104]
Классификацию по методу наименьших квадратов проверяли в два этапа с разными объемами массивов данных, заимствованных из таблиц Американского нефтяного института. Рассматривались только интенсивности, превышающие 1% интенсивности максимального пика. Эго объясняется возможностями двух применявшихся вычислительных систем. Первый метод решал задачу максимизации распознавания, т. е. способности правильно классифицировать уже предъявлявшиеся классификатору образы. При этом обращалось внимание на уменьшение объема вычислений. Данные состояли из 130 масс-спектров низкого разрешения соединений с молекулярной формулой i 5Hi i20o 2No 2. Рассматривалось 79 положений т/е, так что вместе с (d+l)-u координатой размерность пространства была равна 80. [c.104]
В качестве примера рассматривалась задача классификации по числу атомов кислорода, которое могло быть равно О, 1 или 2. [c.104]
После каждого расчета проводилось нахождение лучшей линии. Во всех случаях, если это не оговаривалось особо, интенсивности нормировались таким образом, чтобы максимально они были равны 100 затем из них извлекали квадратный корень. [c.105]
Описанный выше метод наименьших квадратов позволил построить весовой вектор, правильно классифицировавший 123 из 130 спектров. Для категорий с О, 1 или 2 атомами кислорода успешное распознавание составило 94,6%. (Поправка за счет лучшей линии снизила число ошибочных классификаций с девяти до семи.) Ясно, что в случае трех категорий случайное угадывание дало бы прогнозирующую способность 33%. [c.105]
Если объем обучающей выборки т больше числа свободных параметров п+1, параметры могут быть найдены при помощи метода наименьших квадратов. Авторы этого исследования подчеркивают, что система уравнений является общей, и величины x j при желании можно брать из разных источников. Впрочем, данные, взятые в качестве Xij, должны быть аддитивными для смеси. В качестве у i может быть любое интересующее нас свойство смеси. Примерами служат процентный состав отдельных коАшонентов, процентное содержание группы соединений, например ароматических, или число метильных групп. Для каждого свойства, т. е. для каждого множества значений у i, необходимо вычислить коэффициенты Uj. Затем значения uj подставляют в уравнение для определения величины интересующего нас свойства данной смеси, для которой измерены значения xj. [c.105]


Вернуться к основной статье


© 2024 chem21.info Реклама на сайте