Метод множителей лагранжа достаточное условие. Условная оптимизация

20.05.2019

При изложенном выше методе отыскания точек возможного условного экстремума мы нарушили симметрию в отношении переменных ут. Часть из этих переменных мы рассматривали как независимые, остальные - как функции этих переменных. В ряде случаев это приводит к усложнению выкладок. Лагранжем предложен метод, симметризирующий роль переменных. Изложению этого метода и посвящен настоящий пункт. Умножим равенства (13.47) соответственно на произвольные (и пока еще неопределенные) постоянные множители Полученные после умножения равенства сложим почленно с равенством (13.46). В результате получим следующее равенство:

где символом обозначена следующая функция:

Эту функцию мы в дальнейшем будем называть функцией Лагранжа. Считая, что для функций (13.41) выполнены условия,

сформулированные в предыдущем пункте, и что функция (13.40) дифференцируема, выберем множители так, чтобы выполнялись равенства

Это заведомо можно сделать, ибо равенства (13.52) приводят к линейной системе

определитель которой (якобиан отличен от нуля. В силу равенства (13.52) равенство (13.50) принимает вид

Поскольку при сделанных выше предположениях переменные являются независимыми, то из равенства (13.53) заключаем, что

Присоединяя к уравнениям (13.52) и (13.54) условия связи (13.41), мы получим систему уравнений

для определения координат точек возможного условного экстремума и множителей Хт. Практически при реализации этого метода поступают следующим образом. Составляют функцию Лагранжа (13.51) и для этой функции находят точки возможного безусловного экстремума. Для исключения множителей привлекают условия связи (13.41). Такой путь отыскания точек возможного условного экстремума является законным, ибо он приводит нас как раз к системе уравнений (13.55). Пример применения метода множителей Лагранжа будет рассмотрен в п. 4.

Описание метода

где .

Обоснование

Нижеприведенное обоснование метода множителей Лагранжа не является его строгим доказательством. Оно содержит эвристические рассуждения, помогающие понять геометрический смысл метода.

Двумерный случай

Линии уровня и кривая .

Пусть требуется найти экстремум некоторой функции двух переменных при условии, задаваемом уравнением . Мы будем считать, что все функции непрерывно дифференцируемы, и данное уравнение задает гладкую кривую S на плоскости . Тогда задача сводится к нахождению экстремума функции f на кривой S . Будем также считать, что S не проходит через точки, в которых градиент f обращается в 0 .

Нарисуем на плоскости линии уровня функции f (то есть кривые ). Из геометрических соображений видно, что экстремумом функции f на кривой S могут быть только точки, в которых касательные к S и соответствующей линии уровня совпадают. Действительно, если кривая S пересекает линию уровня f в точке трансверсально (то есть под некоторым ненулевым углом), то двигаясь по кривой S из точки мы можем попасть как на линии уровня, соответствующие большему значению f , так и меньшему. Следовательно, такая точка не может быть точкой экстремума.

Тем самым, необходимым условием экстремума в нашем случае будет совпадение касательных. Чтобы записать его в аналитической форме, заметим, что оно эквивалентно параллельности градиентов функций f и ψ в данной точке, поскольку вектор градиента перпендикулярен касательной к линии уровня. Это условие выражается в следующей форме:

где λ - некоторое число, отличное от нуля, и являющееся множителем Лагранжа.

Рассмотрим теперь функцию Лагранжа , зависящую от и λ :

Необходимым условием ее экстремума является равенство нулю градиента . В соответствии с правилами дифференцирования, оно записывается в виде

Мы получили систему, первые два уравнения которой эквивалентны необходимому условию локального экстремума (1), а третье - уравнению . Из нее можно найти . При этом , поскольку в противном случае градиент функции f обращается в нуль в точке , что противоречит нашим предположениям. Следует заметить, что найденные таким образом точки могут и не являться искомыми точками условного экстремума - рассмотренное условие носит необходимый, но не достаточный характер. Нахождение условного экстремума с помощью вспомогательной функции L и составляет основу метода множителей Лагранжа, примененного здесь для простейшего случая двух переменных. Оказывается, вышеприведенные рассуждения обобщаются на случай произвольного числа переменных и уравнений, задающих условия.

На основе метода множителей Лагранжа можно доказать и некоторые достаточные условия для условного экстремума, требующие анализа вторых производных функции Лагранжа.

Применение

Метод множителей Лагранжа применяется при решении задач нелинейного программирования, возникающих во многих областях (например, в экономике).
Основной метод решения задачи об оптимизации качества кодирования аудио и видео данных при заданном среднем битрейте (оптимизация искажений - англ. Rate-Distortion optimization ).

См. также

Ссылки

Зорич В. А. Математический анализ. Часть 1. - изд. 2-е, испр. и доп. - М.: ФАЗИС, 1997.

Wikimedia Foundation . 2010 .

Смотреть что такое "Множители Лагранжа" в других словарях:

Множители Лагранжа - дополнительные множители, преобразующие целевую функцию экстремальной задачи выпуклого программирования (в частности, линейного программирования) при ее решении одним из классических методов методом разрешающих множителей… … Экономико-математический словарь

множители Лагранжа - Дополнительные множители, преобразующие целевую функцию экстремальной задачи выпуклого программирования (в частности, линейного программирования) при ее решении одним из классических методов методом разрешающих множителей (методом Лагранжа).… … Справочник технического переводчика

Механики. 1) Лагранжа уравнения 1 го рода дифференциальные ур ния движения механич. системы, к рые даны в проекциях на прямоугольные координатные оси и содержат т. н. множители Лагранжа. Получены Ж. Лагранжем в 1788. Для голономной системы,… … Физическая энциклопедия

Механики обыкновенные дифференциальные уравнения 2 го порядка, описывающие движения механич. систем под действием приложенных к ним сил. Л. у. установлены Ж. Лаг ранжем в двух формах: Л. у. 1 го рода, или уравнения в декартовых координатах с… … Математическая энциклопедия

1) в гидромеханике ур ния движения жидкости (газа) в переменных Лагранжа, к рыми являются координаты ч ц среды. Получены франц. учёным Ж. Лагранжем (J. Lagrange; ок. 1780). Из Л. у. определяется закон движения ч ц среды в виде зависимостей… … Физическая энциклопедия

Метод множителей Лагранжа, метод нахождения условного экстремума функции f(x), где, относительно m ограничений, i меняется от единицы до m. Содержание 1 Описание метода … Википедия

Функция, используемая при решении задач на условный экстремум функций многих переменных и функционалов. С помощью Л. ф. записываются необходимые условия оптимальности в задачах на условный экстремум. При этом не требуется выражать одни переменные … Математическая энциклопедия

Метод решения задач на Условный экстремум; Л. м. м. заключается в сведении этих задач к задачам на безусловный экстремум вспомогательной функции т. н. функции Лагранжа. Для задачи об экстремуме функции f (х1, x2,..., xn) при… …

Переменные, с помощью к рых строится Лагранжа функция при исследовании задач на условный экстремум. Использование Л. м. и функции Лагранжа позволяет единообразным способом получать необходимые условия оптимальности в задачах на условный экстремум … Математическая энциклопедия

1) в гидромеханике уравнения движения жид кой среды, записанные в переменных Лагранжа, которыми являются координаты частиц среды. Из Л. у. определяется закон движения частиц среды в виде зависимостей координат от времени, а по ним… … Большая советская энциклопедия

Метод множителей Лагранжа.

Метод множителей Лагранжа является одним из методов, которые позволяют решать задачи нелинейного программирования.

Нелинейное программирование-это раздел математического программирования, изучающий методы решения экстремальных задач с нелинейной целевой функцией и областью допустимых решений, определенной нелинейными ограничениями. В экономике это соответствует тому, что результаты (эффективность) возрастают или убывают непропорционально изменению масштабов использования ресурсов (или, что то же самое, масштабов производства): напр., из-за деления издержек производства на предприятиях на переменные и условно-постоянные; из-за насыщения спроса на товары, когда каждую следующую единицу продать труднее, чем предыдущую и т. д.

Задача нелинейного программирования ставится как задача нахождения оптимума определенной целевой функции

F(x 1 ,…x n), F (x ) → max

при выполнении условий

g j (x 1 ,…x n)≥0, g (x ) ≤ b , x ≥ 0

где x -вектор искомых переменных;

F (x ) -целевая функция;

g (x ) - функция ограничений (непрерывно дифференцируемая);

b - вектор констант ограничений.

Решение задачи нелинейного программирования (глобальный максимум или минимум) может принадлежать либо границе, либо внутренней части допустимого множества.

В отличие от задачи линейного программирования, в задаче программирования нелинейного оптимум не обязательно лежит на границе области, определенной ограничениями. Иначе говоря, задача состоит в выборе таких неотрицательных значений переменных, подчиненных системе ограничений в форме неравенств, при которых достигается максимум (или минимум) данной функции. При этом не оговариваются формы ни целевой функции, ни неравенств. Могут быть разные случаи: целевая функция нелинейная, а ограничения линейны; целевая функция линейна, а ограничения (хотя бы одно из них) нелинейные; и целевая функция, и ограничения нелинейные.

Задача нелинейного программирования встречается в естественных науках, технике, экономике, математике, в сфере деловых отношений и в науке управления государством.

Нелинейное программирование, например, связано с основной экономической задачей. Так в задаче о распределении ограниченных ресурсов максимизируют либо эффективность, либо, если изучается потребитель, потребление при наличии ограничений, которые выражают условия недостатка ресурсов. В такой общей постановке математическая формулировка задачи может оказаться невозможной, но в конкретных применениях количественный вид всех функций может быть определен непосредственно. Например, промышленное предприятие производит изделия из пластмассы. Эффективность производства здесь оценивается прибылью, а ограничения интерпретируются как наличная рабочая сила, производственные площади, производительность оборудования и т.д.

Метод "затраты - эффективность" также укладывается в схему нелинейного программирования. Данный метод был разработан для использования при принятии решений в управлении государством. Общей функцией эффективности является благосостояние. Здесь возникают две задачи нелинейного программирования: первая - максимизация эффекта при ограниченных затратах, вторая - минимизация затрат при условии, чтобы эффект был выше некоторого минимального уровня. Обычно эта задача хорошо моделируется с помощью нелинейного программирования.

Результаты решения задачи нелинейного программирования являются подспорьем при принятии государственных решений. Полученное решение является, естественно, рекомендуемым, поэтому необходимо исследовать предположения и точность постановки задачи нелинейного программирования, прежде чем принять окончательное решение.

Нелинейные задачи сложны, часто их упрощают тем, что приводят к линейным. Для этого условно принимают, что на том или ином участке целевая функция возрастает или убывает пропорционально изменению независимых переменных. Такой подход называется методом кусочно-линейных приближений, он применим, однако, лишь к некоторым видам нелинейных задач.

Нелинейные задачи в определенных условиях решаются с помощью функции Лагранжа: найдя ее седловую точку, тем самым находят и решение задачи. Среди вычислительных алгоритмов Н. п. большое место занимают градиентные методы. Универсального же метода для нелинейных задач нет и, по-видимому, может не быть, поскольку они чрезвычайно разнообразны. Особенно трудно решаются многоэкстремальные задачи.

Одним из методов, которые позволяют свести задачу нелинейного программирования к решению системы уравнений, является метод неопределенных множителей Лагранжа.

С помощью метода множителей Лагранжа по существу устанавливаются необходимые условия, позволяющие идентифицировать точки оптимума в задачах оптимизации с ограничениями в виде равенств. При этом задача с ограничениями преобразуется в эквивалентную задачу безусловной оптимизации, в которой фигурируют некоторые неизвестные параметры, называемые множителями Лагранжа.

Метод множителей Лагранжа заключается в сведении задач на условный экстремум к задачам на безусловный экстремум вспомогательной функции - т. н. функции Лагранжа.

Для задачи об экстремуме функции f (х 1 , x 2 ,..., x n ) при условиях (уравнениях связи) φ i (x 1 , x 2 , ..., x n ) = 0, i = 1, 2,..., m , функция Лагранжа имеет вид

L(x 1, x 2… x n ,λ 1, λ 2 ,…λm)=f(x 1, x 2… x n)+∑ i -1 m λ i φ i (x 1, x 2… x n)

Множители λ 1 , λ 2 , ..., λm наз. множителями Лагранжа.

Если величины x 1 , x 2 , ..., x n , λ 1 , λ 2 , ..., λm суть решения уравнений, определяющих стационарные точки функции Лагранжа, а именно, для дифференцируемых функций являются решениями системы уравнений

то при достаточно общих предположениях x 1 , x 2 , ..., x n доставляют экстремум функции f.

Рассмотрим задачу минимизации функции n переменных с учетом одного ограничения в виде равенства:

Минимизировать f(x 1, x 2… x n) (1)

при ограничениях h 1 (x 1, x 2… x n)=0 (2)

В соответствии с методом множителей Лагранжа эта задача преобразуется в следующую задачу безусловной оптимизации:

минимизировать L(x,λ)=f(x)-λ*h(x) (3)

где Функция L(х;λ) называется функцией Лагранжа,

λ - неизвестная постоянная, которая носит название множителя Лагранжа. На знак λ никаких требований не накладывается.

Пусть при заданном значении λ=λ 0 безусловный минимум функции L(x,λ) по х достигается в точке x=x 0 и x 0 удовлетворяет уравнению h 1 (x 0)=0. Тогда, как нетрудно видеть, x 0 минимизирует (1) с учетом (2), поскольку для всех значений х, удовлетворяющих (2), h 1 (x)=0 и L(x,λ)=min f(x).

Разумеется, необходимо подобрать значение λ=λ 0 таким образом, чтобы координата точки безусловного минимума х 0 удовлетворяла равенству (2). Это можно сделать, если, рассматривая λ как переменную, найти безусловный минимум функции (3) в виде функции λ, а затем выбрать значение λ, при котором выполняется равенство (2). Проиллюстрируем это на конкретном примере.

Минимизировать f(x)=x 1 2 +x 2 2 =0

при ограничении h 1 (x)=2x 1 +x 2 -2=0=0

Соответствующая задача безусловной оптимизации записывается в следующем виде:

минимизировать L(x,λ)=x 1 2 +x 2 2 -λ(2x 1 +x 2 -2)

Решение. Приравняв две компоненты градиента L к нулю, получим

→ x 1 0 =λ

→ x 2 0 =λ/2

Для того чтобы проверить, соответствует ли стационарная точка х° минимуму, вычислим элементы матрицы Гессе функции L(х;u), рассматриваемой как функция х,

которая оказывается положительно определенной.

Это означает, что L(х,u) - выпуклая функция х. Следовательно, координаты x 1 0 =λ, x 2 0 =λ/2 определяют точку глобального минимума. Оптимальное значение λ находится путем подстановки значений x 1 0 и x 2 0 в уравнение2x 1 +x 2 =2, откуда 2λ+λ/2=2 или λ 0 =4/5. Таким образом, условный минимум достигается при x 1 0 =4/5 и x 2 0 =2/5 и равен min f(x)=4/5.

При решении задачи из примера мы рассматривали L(х;λ) как функцию двух переменных x 1 и x 2 и, кроме того, предполагали, что значение параметра λ выбрано так, чтобы выполнялось ограничение. Если же решение системы

J=1,2,3,…,n

в виде явных функций λ получить нельзя, то значения х и λ находятся путем решения следующей системы, состоящей из n+1 уравнений с n+1 неизвестными:

J=1,2,3,…,n., h 1 (x)=0

Для нахождения всех возможных решений данной системы можно использовать численные методы поиска (например, метод Ньютона). Для каждого из решений () следует вычислить элементы матрицы Гессе функции L, рассматриваемой как функция х, и выяснить, является ли эта матрица положительно определенной (локальный минимум) или отрицательно определенной (локальный максимум).

Метод множителей Лагранжа можно распространить на случай, когда задача имеет несколько ограничений в виде равенств. Рассмотрим общую задачу, в которой требуется

Минимизировать f(x)

при ограничениях h k =0, k=1, 2, ..., К.

Функция Лагранжа принимает следующий вид:

Здесь λ 1 , λ 2 , ..., λk -множители Лагранжа, т.е. неизвестные параметры, значения которых необходимо определить. Приравнивая частные производные L по х к нулю, получаем следующую систему n уравнении с n неизвестными:

Если найти решение приведенной выше системы в виде функций вектора λ оказывается затруднительным, то можно расширить систему путем включения в нее ограничений в виде равенств

Решение расширенной системы, состоящей из n+К уравнений с n+К неизвестными, определяет стационарную точку функции L. Затем реализуется процедура проверки на минимум или максимум, которая проводится на основе вычисления элементов матрицы Гессе функции L, рассматриваемой как функция х, подобно тому, как это было проделано в случае задачи с одним ограничением. Для некоторых задач расширенная система n+К уравнений с n+K неизвестными может не иметь решений, и метод множителей Лагранжа оказывается неприменимым. Следует, однако, отметить, что такие задачи на практике встречаются достаточно редко.

Рассмотрим частный случай общей задачи нелинейного программирования, предполагая, что система ограничений содержит только уравнения, отсутствуют условия неотрицательности переменных и и - функции непрерывные вместе со своими частными производными. Следовательно решив систему уравнений (7), получают все точки, в которых функция (6) может иметь экстремальные значения.

Алгоритм метода множителей Лагранжа

1.Составляем функцию Лагранжа.

2.Находим частные производные от функции Лагранжа по переменным x J ,λ i и приравниваем их нулю.

3.Решаем систему уравнений (7), находим точки, в которых целевая функция задачи может иметь экстремум.

4.Среди точек, подозрительных на экстремум, находим такие, в которых достигается экстремум, и вычисляем значения функции (6) в этих точках.

Пример.

Исходные данные: По плану производства продукции предприятию необходимо изготовить 180 изделий. Эти изделия могут быть изготовлены двумя технологическими способами. При производстве x 1 изделий 1 способом затраты равны 4x 1 +x 1 2 руб., а при изготовлении x 2 изделий 2 способом они составляют 8x 2 +x 2 2 руб. Определить сколько изделий каждым из способов следует изготовить, чтобы затраты на производство продукции были минимальными.

Целевая функция для поставленной задачи имеет вид
®min при условиях x 1 +x 2 =180, x 2 ≥0.
1.Составляем функцию Лагранжа
.
2. Вычисляем частные производные по x 1 , x 2, λ и приравниваем их нулю:

3. Решая полученную систему уравнений, находим x 1 =91,x 2 =89

4.Сделав замену в целевой функции x 2 =180-x 1 , получим функцию от одной переменной, а именно f 1 =4x 1 +x 1 2 +8(180-x 1)+(180-x 1) 2

Вычисляем или 4x 1 -364=0 ,

откуда имеем x 1 * =91, x 2 * =89.

Ответ: Количество изделий изготовленных первым способом равно х 1 =91, вторым способом х 2 =89 при этом значение целевой функции равно 17278 руб.

Применяется для решения задач с аналитическим выражением для критерия оптимальности и при наличии ограничений на независимые переменные типа равенств. Для получения аналитического решения требуется, чтобы ограничения имели аналитический вид. Применение неопределенных множителей Лагранжа позволяет свести задачу оптимизации с ограничениями к задаче, решаемой методами исследования функций классического анализа. В этом случае порядок системы уравнений, решаемой для нахождения экстремума критерия оптимизации, повышается на число ограничений. Применение метода эффективно при количестве переменных три и менее. Метод используется и при количестве переменных более трех, если процесс описывается конечными уравнениями.

Пусть требуется найти экстремум функции, которая зависит от n переменных, связанных в свою очередь отношениями. Достигаемый функцией экстремум с учетом выполнения условий называется относительным, или условным. Если же число переменных равно числу соотношений (), то искомые неизвестные находятся решением системы уравнений, описываемых соотношениями. Решение задачи оптимизации сводится к проверке найденным таким способом значений переменных на функции. Таким образом, экстремальную задачу можно решить простым перебором переменных, удовлетворяющих условиям.

Если m < n , то можно из уравнений связи найти зависимость m переменных от n - m остальных переменных, т.е.

Функцию можно получить подстановкой полученных переменных в функцию. Тогда будет зависеть только от переменных, не связанных дополнительными условиями. Следовательно, снимая ограничения удается и уменьшить размерность исходной задачи оптимизации. Часто аналитически таким способом задачу решить не удается. Поэтому для решения задач отыскания экстремума функции многих переменных обычно используется метод неопределенных множителей Лагранжа.

При введении новых переменных, носящих название неопределенных множителей Лагранжа появляется возможность ввести новую функцию

т.е. функцию m + n переменных, в которую ограничения, накладываемые системой функций входят как составная часть.

Экстремальное значение функции совпадает с экстремальным значением функции, если выполняется условие по ограничениям. Необходимым условием экстремума функции многих переменных является равенство нулю дифференциала этой функции в экстремальной точке, т.е.

Для того, чтобы это выражение выполнялось при любых значениях независимых дифференциалов, необходимо равенство нулю коэффициентов при этих дифференциалах, что дает систему уравнений

При этом новых независимых определяются из условия

Объединение систем (4.3.1) и (4.3.2) можно получить

Таким образом, задача в форме (4.3.3) сводится к задаче: найти

Отдельно следует отметить, что в общем случае метод множителей Лагранжа позволяет найти лишь необходимые условия существования условного экстремума для непрерывных функций, имеющих непрерывные производные. Однако из физического смысла решаемой задачи обычно известно, идет ли речь о максимуме или минимуме функции, кроме того, как правило, в проектных задачах функция на рассматриваемом отрезке является унимодальной. Поэтому в проектных задачах нет необходимости значения переменных, найденные при решении рассмотренных систем уравнений, проверять на экстремум с помощью анализа производных более высокого порядка.