Поиск оптимума при известном аналитическом выражении градиента

из "Методы оптимизации в химической технологии издание 2"

Метод релаксации в этом смысле обладает определенными достоинствами, так как при спуске вдоль выбранного осевого направления не требует вычисления производных. Однако в данном случае движение происходит не в оптимальном направлении, поскольку градиент в общем случае не совпадает с осевым направлением. [c.494]
Сочетание основных идей методов релаксации и градиента дает метод наискорейшего спуска, который заключается в следующем. После того как в начальной точке найден градиент оптимизируемой функции и тем самым определено направление ее наибыстрейшего убывания в указанной точке, в данном направлении делается шаг спуска. Если значение функции в результате этого шага уменьшилось, производится очередной шаг в том же направлении, и так до тех пор, пока в этом направлении не будет найден минимум, после чего вычисляется градиент и определяется новое направление наибыстрейшего убывания целевой функции. [c.494]
В сопоставлении с методом градиента метод наискорейшего спуска оказывается более выгодным из-за сокращения объема вычислений. По существу метод наискорейшего спуска по вычислительным затратам эквивалентен методу релаксации, однако выгодно отличается от него тем, что по крайней мере первые шаги после определения градиента производятся в оптимальном направлении. Очевидно, что чем менее резко изменяется направление градиента целевой функции, тем выгоднее использовать метод наискорейшего спуска по сравнению с методом градиента, т. е. вдали от оптимума. Вблизи оптимума направление градиента меняется резко, поэтому указанный метод автоматически переходит в метод градиента, так как минимум по каждому направлению находится за небольшое число шагов. [c.494]
На рис. IX-13 показаны возможная траектория движения к оптимуму при применении метода наискорейшего спуска и траектория движения к оптимуму при использовании метода градиента. [c.494]
Важной особенностью метода наискорейшего спуска является то, что при его применении каждое новое направление движения к оптимуму ортогонально предшествующему. Это объясняется тем, что движение в одном направлении производится до тех пор, пока направление движения не окажется касательным к какой-либо линии постоянного уровня (рис. IX-13,а). Тем самым метод наискорейшего спуска имеет сходство с методом релаксации, для которого новое направление также ортогонально предшествующему однако в отличие от метода релаксации скорость сходимости к оптимуму не зависит от ориентации системы координат. [c.494]
Совместное применение условий (IX, 45) и (IX, 46) оправдано в тех случаях, когда оптимизируемая функция имеет резко выраженный минимум. [c.495]
Относительно выбора стратегии изменения шага остаются справедливыми все релаксации. Рассмотрим еще один метод выбора величины шага в заданном направлении, в котором используется информация, полученная на предыдущих шагах по этому же направлению. Сущность метода заключается в том, что в процессе движения вдоль заданного направления характер изменения целевой функции аппроксимируется по результатам трех последних шагов полиномом второго порядка. [c.495]
Полученное таким образом значение hmto применяется в качестве задаваемого следующего значения /Ц- Так как минимум R (h), вообще говоря, не совпадает с минимумом R(h), при определении следующего значения h используется новая аппроксимация для точек h2, hz, / 4,и т. д.. . [c.496]
Изложенный метод расчета величины шага в некоторых случаях значительно ускоряетх поиск оптимума. Его можно также применять и в методе релаксации при поиске минимума для осевого направления. [c.496]
Для интегрирования системы (IX, 51) могут быть использованы стандартные программы, имеющиеся для большинства цифровых вычислительных машин. Если же вид производных dR/dXj не слишком сложен, то для решения задачи отыскания оптимума функции R(x) можно с успехом применять и аналоговые вычислительные машины. [c.496]
Решение задачи оптимизации определяется интегрированием системы (IX, 51) как стационарная точка системы уравнений, т. е. совокупность значений переменных Xj, не изменяющихся в процессе продолжающегося интегрирования, при этом получается траектория x(t), приводящая к-оптимуму кратчайшим путем из заданного исходного состояния. Эта траектория при практическом решении задач оптимизации может иногда иметь самостоятельный интерес. [c.497]
Поскольку найденные значения Я и Яз отрицательны, легко видеть, что общее решение однородной системы уравнений (IX, 58) при t-t-oo стремится к нулю. Поэтому значения переменных в стационарной точке решения описываются частным решением неоднородной системы (IX, 53) и равны значениям (IX, 57), которые и определяют положение точки минимума функции (IX, 52). [c.498]
Одно из найденных значений корней характеристического уравнения имеет положительный знак, и следовательно, общее решение однородной системы (IX, 54) не будет стремиться к нулю при t- -oo. [c.498]
Таким образом, стационарной точки решения системы уравнений (IX, 63) не существует, поэтому у функции (IX, 62) отсутствует экстремальная точка, в которой данная функция имеет минимум. Можно также показать, что значения (IX, 64) определяют седло функции (IX, 62). [c.498]
Заметим, что в приведенных выше примерах вопрос о существовании экстремума целевой функции решался анализом устойчивости решения системы дифференциальных уравнений, в связи с чем представляет интерес рассмотреть связь этих условий с достаточными условиями экстремума. [c.498]
Корни уравнения (1Х,71) имеют отрицательные действительные части и система уравнений будет устойчивой (существует стационарная точка решения) лишь при положительных коэффициентах этого уравнения, т. е. [c.499]
Первое из условий (IX, 72) в точности совпадает с первым условием (IX, 69). Нетрудно показать, что и вторые условия в соотношениях (IX, 69) и (IX, 72) эквивалентны. Действительно, требование положительности величины ац в условии (IX, 69) требует также и положительности а22, так как иначе нарушается первое условие (IX, 69). Следовательно, из условия (IX, 69) вытекает, что сумма ац + a2z должна быть положительной. [c.499]
Обратно, второе условие (IX, 72) означает, что по крайней мере одна из величин ац или а22 должна быть положительной. Кроме того, из первого условия (IX, 72) следует, что а и а22 должны иметь один знак, т. е. обе величины а и а22 положительны, и, таким образом, условия (IX, 69) и (IX, 72) эквивалентны. [c.499]

Вернуться к основной статье

Справочник химика 21

Химия и химическая технология