Купить мужские часы наручные Подбор контактных линз - выбрать контактные линзы. Контактные линзы.
 
 
новогодние подарки медкнижка на курской
MyKod Все Методы оптимизации




Методы оптимизации
Лекции по методам оптимизации глава 3. Авторы Хворова Л.А. и Жариков А.В.
16.03.2009 17:36

Глава III

Классическое вариационное исчисление

В настоящее время в теории вариационного исчисления разработан мощный и универсальный математический аппарат, позволяющий решать экстремальные задачи в функциональных пространствах. Этот аппарат находит широкое применение при решении различного рода технических задач. В этой главе будут сформулированы и введены необходимые условия первого порядка для некоторых классов задач, рассматриваемых в классическом вариационном исчислении: задача Больца, простейшая задача классического вариационного исчисления, изопериметрическая задача и т. п.§3.1. Постановка общей задачи математическогопрограммированияПусть  – линейное пространство, на котором заданы функционалы  и оператор , принимающий значения в линейном пространстве . Общая задача математического программирования имеет следующий вид:                                                          (3.1)при ограничениях,                                        (3.2).                                                               (3.3)Если , то оператор  является векторным функционалом  и ограничение (3.3) в «покоординатной форме» записывается в виде равенств . В этом случае общая задача математического программирования отличается от задачи математического программирования (§1.6) с ограничениями в форме неравенств и равенств только тем, что в ней вместо функций рассматриваются функционалы.В класс общих задач математического программирования входят задачи, являющиеся предметом изучения вариационного исчисления и оптимального управления.В вариационном исчислении исследуются задачи с целевыми функционалами следующих трех типов.1) Интегральный функционал задается формулойгде  – -мерная вектор-функция вида , ,  – числовая функция  переменной. Функционал такого вида при  участвует в формулировке простейшей задачи вариационного исчисления.2) Терминальный функционал определяется равенством ,где  – числовая функция двух переменных.3) Смешанный функционал представляет собой сумму интегрального и терминального функционалов:.Если в вариационной задаче ограничения имеют вид системы функциональных равенств , где  – функционалы и , то ее называют изопериметрической задачей.В более сложных вариационных задачах встречаются дифференциальные ограничения (дифференциальные связи), имеющие вид,где  – числовые функции  переменной. В частности, при  дифференциальные ограничения могут иметь следующий вид:где  – числовые функции  переменной. Дифференциальные ограничения представляют частный случай общего ограничения (3.3). Действительно, обозначим через  функционал, который определён на рассматриваемом линейном пространстве векторных функций  формулой  Тогда дифференциальные равенства равносильны равенствам  которые, вводя векторный функционал , можно записать в виде (3.3).Во всех указанных выше вариационных задачах фигурируют только первые производные искомой функции. Задачи, в целевой функционал (а также ограничения, если они имеются) которых входят производные более высокого порядка, называют задачами высшего порядка. Эти задачи более трудны для исследования.В задаче оптимального управления имеется два типа переменных: переменные состояния  (– мерная вектор-функция) и переменные управления  (- мерная вектор-функция). Целевой функционал в общем случае может быть суммой интегрального и терминального членов,а дифференциальные ограничения, которые обязательно присутствуют в задаче, имеют видЗдесь  – функции  переменной. Кроме того, в задаче оптимального управления имеется ограничение на возможность выбора переменных управления:  при , где  обычно замкнутое ограниченное множество евклидова пространства. Подобных ограничений в классических вариационных задачах нет.Для иллюстрации области применения задач вариационного исчисления и задач оптимального управления, приведём примеры, которые стали уже классическими. Решение приведённых ниже примеров можно найти например в [2, 4, 11, 15]. Мы же ограничимся лишь формулировкой и формализацией. 1.     Задача определения траектории распространения света в среде с переменной плотностью.Пусть в плоской прозрачной неоднородной изотропной среде имеется точечный источник распространения света. Введём в этой среде прямоугольную декартову систему координат . Обозначим через  скорость распространения света в точке . Возьмём любую пару точек  и , удовлетворяющих условию , и расположим источник света в точке . Требуется определить форму кривой, вдоль которой свет распространяется от точки  до .Согласно принципу Ферма, свет распространяется по такой траектории, для перемещения вдоль которой требуется наименьшее возможное время. Пусть  – функция, график которой представляет искомую кривую, проходящую через точки  и . Обозначим через  длину пройденного светом пути, через  – время, тогда получим выражение для скорости распространения света:.Для нахождения времени распространения света  от точки  до  следует проинтегрировать данное выражение и сделать последующую замену переменной. Тогда получим следующее выражение для времени :.Таким образом, приходим к простейшей вариационной задаче минимизации функционалана множестве гладких функций, удовлетворяющих граничным условиям .2.     Задача определения формы подвешенной нити.В двух точках вертикальной плоскости закреплены концы однородной абсолютно гибкой нити длины (рис. 3.1). Требуется определить форму, которую нить примет под действием силы тяжести. Расположим в данной плоскости прямоугольную декартову систему координат  так, чтобы действие силы тяжести было направлено противоположно направлению оси ординат. Для простоты ограничимся случаем, когда точки  и , в которых закреплена нить, расположены на одной высоте: , . Пусть  – уравнение искомой кривой. Тогда выражение для потенциальной энергии нити имеет вид:

Рис. 3.1.

,                                      (3.4)

где  – линейная плотность,  – ускорение свободного падения. Длина нити постоянна и равна . Запишем это условие в виде ограничения-равенства

.                             (3.5)

Очевидно, что нить займет положение, в котором ее потенциальная энергия примет наименьшее возможное значение, и поэтому задача сводится к отысканию такой гладкой функции , на которой достигается минимум функционала (3.4) при ограничении (3.5) и удовлетворяющей граничным условиям: .

3.     Задача о брахистохроне.Слово «брахистохрона» образовано из двух слов, которые в переводе на русский язык означают «кратчайший» и «время». Эта задача, о которой упоминает ещё Галилей. После исследований И. Бернулли 1696 г., задача о брахистохроне послужила толчком к появлению методов решения широкого класса подобных задач, составивших впоследствии основу вариационного исчисления.

Рис. 3.2.

Пусть в вертикальной плоскости имеются две точки  и  (первая выше второй). Данные точки могут быть соединены различными плоскими кривыми (в частности, и прямой линией). Предположим, что в  помещена материальная точка массы , которая под действием силы тяжести может «скатываться» из точки  в  по различным кривым, соединяющим  и .Геометрически задача о брахистохроне заключается в отыскании такой кривой (если она существует), по которой материальная точка достигнет  за кратчайшее время. Эту кривую называют брахистохроной.Введем на рассматриваемой плоскости прямоугольную систему координат. Для удобства поместим ее начало в точку  и направим ось ординат вертикально вниз (рис. 3.2). Обозначим координаты точки  через . По условию, материальная точка начинает двигаться из  без начальной скорости, поэтому согласно закону сохранения энергии можно записать:,где  – скорость,  – ордината материальной точки,  – ускорение свободного падения. Отсюда находим, что . Будем считать, что искомая кривая имеет вид:  – уравнение кривой, по которой «скатывается» материальная точка. Если обозначить через  – длину пройденного точкой пути, а через  – время, то можно записать.Следовательно,.Интегрируя и делая замену переменных, получаем следующее выражение:,                                    (3.6)где  – время, в течение которого материальная точка движется вдоль кривой  из  в .Равенство (3.6) задает функционал , определенный на множестве кривых вида , подчиненных граничным условиям:.                                      (3.7)Из физических соображений ясно, что рассматриваемые кривые не должны иметь «изломов» («углов») и поэтому функции  можно считать гладкими (непрерывно дифференцируемыми): .Приведём математическую постановку задачи о брахистохроне: среди всех функций вида  пространства , которые удовлетворяют условиям (3.7), требуется найти функцию (если она существует), реализующую минимум функционала , определяемого формулой

.

4.     Задача определения критической нагрузки балки.

Рис. 3.3.

Пусть балка  длины , имеющая цилиндрическую форму, расположена вертикально. Ее нижний конец  жестко закреплен, а верхний под действием нагрузки  может перемещаться по вертикальной прямой таким образом, что касательная, проведенная к осевой линии балки в точке , все время проходит через отрезок  (рис. 3.3). Требуется определить критическую нагрузку , при которой вертикальное положение балки является положением устойчивого равновесия.Обозначим через  длину дуги осевой линии балки, отсчитываемую от точки , а через  меньший из углов, образованных отрезком  и касательной к осевой линии, проведенной в точке, которая расположена на расстоянии  от . Тогда потенциальная энергия изогнутой балки выражается формулой:,                    (3.8)где  – константа, зависящая от коэффициента упругости и момента инерции поперечного сечения. Состояние устойчивого равновесия характеризуется минимумом потенциальной энергии, поэтому задача сводится к определению таких значений , при которых функция  реализует наименьшее возможное значение функционала (3.8) на множестве функций вида .5.     Задача о мягкой посадке ракеты на Луну.Пусть в начальный момент времени  ракета, которую мы для простоты примем за материальную точку массы , находится на высоте  над поверхностью Луны и имеет скорость , направленную вертикально вниз. Задача заключается в выборе такого режима работы двигателя, чтобы в некоторый (не заданный заранее) момент времени  ракета достигла поверхности Луны и при этом ее скорость была равна нулю (мягкая посадка). Введём систему координат, связанную с поверхностью Луны (ось  направлена вертикально вверх). Тогда уравнение движения ракеты имеет следующий вид:,                                               (3.9)где  – расстояние от ракеты до поверхности Луны;  – ускорение свободного падения на Луне,  –  сила тяги двигателя. Понятно, что тяга двигателя не может быть сколь угодно большой; она ограничена техническими возможностями двигателя, т.е..                                (3.10)При этих условиях возможны несколько различных режимов работы двигателя, обеспечивающих мягкую посадку. Нужно выбрать тот, который с определенной точки зрения является наиболее выгодным. Примем в качестве критерия такой выгодности минимум расходуемого при посадке топлива. Обозначим расход топлива в единицу времени через . Учитывая, что сила  пропорциональна расходу топлива в единицу времени, можно записать: , где  – коэффициент пропорциональности. Тогда общий расход топлива за время  выражается интегралом , поэтому критерий выгодности (оптимальности) режима работы двигателя можно задать с помощью следующего функционала:.                                                (3.11)Теперь сформулируем задачу о мягкой посадке: найти кусочно-непрерывную функцию , подчиненную неравенствам (3.10), при которой решение  уравнения (3.9) удовлетворяет при  заданным начальным условиям:,а при некотором  – условиям,причем такое, что функционал (3.11) принимает минимальное возможное значение на множестве таких функций  (считаем, что класс кусочно-непрерывных функций является наиболее широким классом технически реализуемых функций ).Сформулированная задача является простейшей задачей оптимального управления. Управлением служит функция .§3.2. Задача БольцаЗадачей Больца называется следующая экстремальная задача без ограничений в пространстве непрерывно дифференцируемых функций :,            (3.12) – функция трёх переменных, называемая интегрантом; – функция двух переменных, называемая терминантом; – функционал Больца; – фиксированный и конечный отрезок .

Задача Больца – элементарная задача классического вариационного исчисления.

Будем считать, что функция  из (3.12) задана и по крайней мере непрерывна на некоторой области .Опишем множество  допустимых функций, на котором минимизируется функционал : при всех .

 

Рис. 3.4.

Здесь отсутствуют краевые условия множества . С геометрической точки зрения это означает, что минимальное значение функционала  ищется на классе гладких кривых вида , концы которых не фиксированы и могут быть произвольно расположены на прямых  и  (рис. 3.4). Решением задачи Больца является допустимая функция, реализующая на указанном множестве  наименьшее возможное значение функционала .Определение. Функция  доставляет (слабый) локальный минимум (максимум) задаче (3.12), то есть функционалу  в пространстве , если  для любой функции , для которой , выполнено неравенство     .Замечание. 1. Если , то .2. Наряду со слабым экстремумом в классическом вариационном исчислении рассматривается также сильный экстремум. При этом несколько расширяется класс функций, на которых рассматривается функционал . Экстремум в задаче ищется среди функций , принадлежащих , то есть кусочно-непрерывных дифференцируемых функций.Теорема 3.1 (необходимые условия экстремума). Пусть функция  доставляет слабый локальный экстремум в задаче Больца (3.12). Предположим, что интегрант  непрерывен вместе со своими частными производными по  и  в некоторой окрестности множества , а терминант  непрерывно дифференцируем в окрестности точки .Тогда    и выполнены:1)    уравнение Эйлера;2)    условия трансверсальности, ;.Необходимые условия для задачи Больца отличаются от соответствующих условий для простейшей вариационной задачи наличием условий трансверсальности вместо краевых условий. В записи условий трансверсальности фигурируют как значения функции в концевых точках, так и значения производных. Поэтому график оптимальной функции вблизи концевых точек (т.е. вблизи точек пересечения с прямыми  и ) не может быть произвольным, а подчиняется определённым требованиям. Наличие условий трансверсальности в задаче Больца связано с возможностью перемещения концов допустимых линий вдоль прямых  и .Доказательство теоремы разобьем на три этапа, т.к. они в той или иной форме будут встречаться при доказательстве других теорем классического вариационного исчисления и оптимального управления.I этап. Определение вариации по Лагранжу.Возьмем произвольную, но фиксированную функцию . Поскольку  (3.12), то функция одного переменногоимеет экстремум при .Обозначим через . Из условий гладкости, наложенных на , , следует, что функция дифференцируема в нуле. Действительно, функции  и  непрерывны в некотором прямоугольнике , и, значит, по известной теореме из анализа можно дифференцировать под знаком интеграла. Но тогда по теореме Ферма .Дифференцируя функцию  и полагая , получим                 (3.13).Таким образом, мы вычислили вариацию по Лагранжу функционала  (3.13) и показали, что необходимым условием слабого локального экстремума этого функционала на  – является равенство нулю его вариации по Лагранжу.II этап. Лемма Дюбуа-Реймона. Пусть на отрезке  функции  и  непрерывны и пусть для любой непрерывно дифференцируемой функции , для которой , выполнено равенство.Тогда функция  непрерывно дифференцируема и.Возьмем функцию , такую, что и .Тогда для любой функции , для которой , по условию леммы должно выполняться равенство.   (3.14)Выберем функцию  такую, что , .Тогда в силу выбора функции .Значит, для функции  должно выполняться равенство (3.14), т.е..Из этого соотношения следует, что , т.е.  и т.к. III этап. Равенство (3.13) выполняется для любой функции , а значит для всех функций.Следовательно, из (3.13) вытекает, что.По лемме Дюбуа-Реймона  и.                                          (3.15)Проинтегрируем по частям в равенстве (3.13) (оно стало возможным в силу доказанного включения ) и учитывая (3.15), получим.   (3.16)Подставим в (3.16) последовательно  и , придем к условиям трансверсальности: и .                           (3.17)Набор условий для нахождения слабого локального экстремума – полный. Действительно, уравнение Эйлера (3.15) – дифференциальное уравнение второго порядка. Его общее решение содержит две неизвестные константы. Для определения этих констант имеются два уравнения – условия трансверсальности (3.17).Замечание. Рассмотрели необходимое условие экстремума для одномерной задачи Больца. Рассмотрим векторный случай, т.е. , , .Тогда необходимые условия в векторной задаче Больца будут состоять из системы уравнений Эйлера,                                    (3.15')и условий трансверсальности, задающихся системой уравнений            Сформулируем правило решения задачи Больца.1.    Формализовать задачу, то есть привести её к виду (3.12).2.    Выписать необходимые условия:а) уравнение Эйлера.Решения уравнения Эйлера называются допустимыми экстремалями.б) условия трансверсальности; .3.    Найти допустимые экстремали, то есть решения уравнения Эйлера, удовлетворяющие на концах условиям трансверсальности.4.    Доказать, что решением является одна из допустимых экстремалей, или показать, что решения нет.Пример. .; .1) Составим уравнение Эйлера:.Решение дифференциального уравнения: .2) Условия трансверсальности:Решая систему, найдем допустимую экстремаль: .3)                Для того чтобы показать существование экстремума или его отсутствие, рассмотрим разность.=.Знак  не определен. Возьмем в качестве ... Следовательно, – не доставляет экстремума.Ответ: .§3.3. Простейшая задача классического вариационного исчисленияПростейшей задачей в классическом вариационном исчислении называется следующая экстремальная задача в пространстве :;          .      (3.18) – называется интегрантом. Экстремум в задаче (3.18) рассматривается среди функций , удовлетворяющих условиям на концах, или краевым условиям , , называемых допустимыми.Определение. Говорят, что допустимая функция  доставляет слабый локальный минимум (максимум) в задаче (3.18), то есть , если : для любой допустимой функции , для которой , выполняется неравенство:.Наряду со слабым экстремумом в классическом вариационном исчислении рассматривается сильный экстремум. При этом несколько расширяется класс функций, на которых рассматривается функционал . Экстремум в задаче ищется среди функций , принадлежащих классу , то есть среди кусочно-непрерывных дифференцируемых функций, удовлетворяющих условиям на концах.Определение. Говорят, что допустимая функция  доставляет сильный локальный минимум (максимум), если : для любой допустимой функции , для которой , выполняется неравенство: .Замечание. Если  доставляет сильный, то она доставляет и слабый экстремум. Поэтому для таких функций необходимое условие слабого экстремума является необходимым условием сильного, а достаточное условие сильного экстремума является достаточным условием слабого.Теорема 3.2 (Необходимое условие экстремума). Пусть доставляет слабый локальный экстремум в простейшей задаче классического вариационного исчисления, а интегрант  непрерывен вместе со своими частными производными по  и  в некоторой окрестности множества . Тогда  и выполнено уравнение Эйлера: .Доказательство аналогично доказательству теоремы для необходимых условий в задаче Больца.Возьмем произвольную, но фиксированную функцию . Тогда  – допустимая функция . Положим . Из условия (3.18) следует, что . Пользуясь дифференцируемостью функции  в нуле и выражением для вариации функционала, получаемИз леммы Дюбуа-Реймона следует, что  и выполнено уравнение Эйлера.Правило решения. 1.     Формализовать задачу, т.е. привести ее к виду (3.18).2.     Выписать необходимое условие – уравнение Эйлера:.3.     Найти допустимые экстремали, т.е. решения уравнения Эйлера, являющиеся допустимыми функциями.4.     Доказать, что решением является одна из допустимых экстремалей, или показать, что решения нет.Это правило находится в полном соответствии с принципом Лагранжа. Покажем это соответствие.1.     Функция Лагранжа задачи (3.18) имеет вид 2.     Необходимые условия экстремума в задаче  являются необходимыми условиями экстремума в задаче Больца и записываются следующим образом:3.     Если , то из условий трансверсальности следует, что .Это противоречит тому, что не все множители Лагранжа равны нулю. Полагаем  и приходим к уравнению Эйлера. Условия трансверсальности дают возможность только отыскать неизвестные множители Лагранжа  и , которые нам в принципе не нужны. Осталось найти допустимые экстремали и выбрать из них решение или показать, что решения нет.Набор условий для нахождения допустимой экстремали является полным. Уравнение Эйлера – дифференциальное уравнение 2-го порядка. Его общее решение содержит две неизвестные константы, для определения которых имеются два уравнения – условия на концах. Таким образом, чаще всего допустимая экстремаль единственна.Рассмотрели теорему для одномерной простейшей задачи классического вариационного исчисления. Запишем ее для векторного случая. Пусть в задаче (3.18)  – функция  переменных. Необходимые условия в простейшей векторной задаче состоят из системы уравнений Эйлера:.Пример. .Уравнение Эйлера:  (или ) или .Общее решение: . Единственная допустимая экстремаль:  – доставляет слабый локальный минимум.Действительно, пусть . Тогда.Воспользуемся оценкой ,.§3.4. Задачи с подвижными концамиПостановка задачи. Задачей с подвижными концами называется следующая задача в пространстве :;     (3.19), ,                                          (3.20)где  – заданный конечный отрезок, , ,  – функция трёх, а  – четырёх переменных.В отличие от задачи Больца и простейшей задачи классического вариационного исчисления, концы отрезка интегрирования являются подвижными. Значения функции  в точках  и  в общем случае могут быть и не заданы.Частным случаем задачи (3.19), (3.20) является задача, в которой один из концов  или  – подвижный, а другой закреплён.Определение. Тройка  называется допустимой в (3.19), если , ,  и выполняются условия (3.20) на концах.Определение. Допустимая тройка  доставляет слабый локальный минимум (максимум) в задаче (3.19), если существует : для любой другой допустимой тройки , для которой  и , выполняется неравенство:     .При этом пишут .

Теорема 3.3 (Необходимое условие экстремума).

Пусть тройка  доставляет слабый локальный экстремум в задаче с подвижными концами. При этом интегрант  и его частные производные по  и  непрерывны в некоторой окрестности множества , а функции , непрерывно дифференцируемы в окрестности точки . Тогда найдется ненулевой множитель Лагранжа , такой, что для функции Лагранжа ,где , выполняются условия:a) стационарности по  – уравнение Эйлера для интегранта  ;b) условия трансверсальности по :,   ,c) условия стационарности по , :,.

Правило решения.

1.     Составить функцию Лагранжа:. – множители Лагранжа.2.     Выписать необходимые условия:a)    уравнение Эйлера;b)    условия трансверсальности по :,   ,где ;c)     условия стационарности по , :,.Условия стационарности выписываются только для подвижных концов.3.    Найти допустимые экстремали, то есть решения уравнения Эйлера, являющиеся допустимыми функциями и удовлетворяющие условиям c), b) с вектором множителей Лагранжа , не равным нулю.  можно положить равным единице или любой другой, отличной от нуля константе.4.    Найти решение среди допустимых экстремалей или доказать, что решения нет.Пример 1. . .а) уравнение Эйлера:.б) условия трансверсальности:Если .Тогда Допустимая экстремаль . Докажем п.4 правила решения. Возьмем .  знак интеграла не определен.Возьмем в качестве , где  т.е. .Воспользуемся неравенством Пуанкаре: . Найдем :. Если  – неравенство Пуанкаре будет справедливо. Тогда .Пример 2. .1) Функция Лагранжа: .2)     Необходимые условия:а) уравнение Эйлера для интегранта :б) Условия трансверсальности:Если .в) Условие стационарности по :, так как  тогда,Тогда  – единственное допустимое решение.Рассмотрим Получили, что .Рассмотрим значение функционала , при подстановке различных значений параметра :т.е. при , близких к , значения функции  могут быть как меньше , так и больше . Следовательно, пара .§3.5. Изопериметрические задачиПостановка задачи. Изопериметрической задачей (с закреплёнными концами) в классическом вариационном исчислении в пространстве  называется следующая задача:;                                   (3.21), ,                         (3.22),                                                     (3.23)где  – заданные фиксированные числа., , – функции трёх переменных.Ограничения (3.22) называются изопериметрическими. Функции ,   называются интегрантами. Функции , удовлетворяющие изопериметрическим условиям (3.22) и условиям на концах (3.23), называются допустимыми.Определение. Говорят, что допустимая функция  доставляет в задаче (3.21) слабый локальный минимум (максимум), если  для любой допустимой функции , для которой , выполнено неравенство:и пишут .Теорема 3.3. (Необходимое условие экстремума). Пусть функция  доставляет слабый локальный экстремум в изопериметрической задаче (3.21). При этом функции , , и их частные производные по  и  непрерывны в некоторой окрестности множества  (условие гладкости). Тогда найдутся множители Лагранжа  не все равные нулю и такие, что для лагранжиана    и выполнено уравнение Эйлера .А) Вычисление вариации по Лагранжу функционалов.Напомним, что вариацией по Лагранжу (приводили в задаче Больца и простейшей задаче классического вариационного исчисления) функционала  в точке  называется функционал, определяемый по формуле.Выпишем вариации по Лагранжу функционалов , применяя для этого дифференцирование под знаком интеграла, аналогично тому, как это было сделано раньше:,                   (3.24).                                                                                                   Б) Построение конечномерного отображения и выделение вырожденного и невырожденного случаев.Рассмотрим следующее линейное отображение пространства  в пространство :.             (3.25)Возможны два случая:а)  – отображение на часть  (вырожденный случай);б)  – отображение на все , т.е. (невырожденный случай).В) Доказательство теоремы в вырожденном случае. Образ линейного пространства при линейном отображении является, как известно, подпространством. Значит, в вырожденном случае  есть собственное подпространство в . Но тогда найдутся числа , не все равные нулю и такие, что.Используя определение оператора (3.25) и выражение для  (3.24), получим.Из леммы Дюбуа-Реймона следует, что . Значит .Г) Невырожденный случай.Покажем, что если , то невырожденный случай невозможен. Тем самым теорема будет доказана.Выберем функции  так, чтобы , где  – канонический базис в , т.е..Рассмотрим отображение  окрестности нуля из  в , , действующее по формуле.Нетрудно проверить, что функция  непрерывно дифференцируема в некоторой окрестности нуля и .По теореме об обратной функции, существует обратное гладкое отображение  некоторой окрестности точки  и константа  такие, что  (при малых ).В частности, для достаточно малого по модулю  найдется такой вектор , т.е. и при этом .Получили, что в любой окрестности функции  в пространстве  существует допустимая функция (а именно  при достаточно малом ), для которой значение функционала как больше, так и меньше, чем . Пришли к противоречию с условием (3.21).

Правило решения.

1.     Составить лагранжиан:.2.     Выписать необходимое условие экстремума – уравнения Эйлера для лагранжиана :  .3.  Найти допустимые экстремали (допустимые решения уравнения Эйлера для Лагранжиана  при векторе множителей Лагранжа  не равном нулю). В общем случае можно положить  равным единице или другой, отличной от нуля константе.4.     Отыскать решение среди найденных допустимых экстремалей или доказать, что решения нет.  Пример. 1. Лагранжиан: .2. Необходимое условие – уравнение Эйлера.3. Если , то  – все множители Лагранжа равны нулю. В этом случае допустимых экстремалей нет. Положим . Тогда . Общее решение: . Неизвестные константы  находим из условий на концах и изопериметрических условий, , Таким образом, получили, что в задаче имеется единственная экстремаль . 4. Покажем, что  доставляет абсолютный минимум. Возьмём допустимую функцию , тогда  и . Рассмотрим разность   ,где , . Проинтегрируем по частям . Подставив полученное выражение в исходную разность, получимТаким образом, имеем, что . §3.6. Задачи со старшими производнымиПостановка задачи. Задачей со старшими производными (с закреплёнными концами) в классическом вариационном исчислении называется следующая задача в пространстве :;                       (3.26), .                                       (3.27)Здесь  – функция  переменных, называемая интегрантом.Функции , удовлетворяющие условиям (3.27) на концах отрезка , называются допустимыми.Определение. Говорят, что допустимая функция  доставляет в задаче (3.26) локальный минимум (максимум) в пространстве , если существует  такое, что для любой допустимой функции , для которой  выполнено неравенство:и пишут   .Теорема 3.4 (необходимое условие экстремума). Пусть функция  доставляет локальный экстремум в задаче со старшими производными (3.26). При этом интегрант  такой, что ,  (условие гладкости). Тогда на экстремали  выполняется уравнение Эйлера-Пуассона:.Распишем данное уравнение:. Определим вариацию по Лагранжу. Для этого продифференцируем под знаком интеграла в (3.26), придем к следующему соотношению:.Усиленная лемма Дюбуа-Реймона. Пусть ,  и для любой функции , , ,  выполняется равенство:.                                               (3.28)Тогда на отрезке  непрерывно дифференцируемы функции , и выполняется равенство:. Рассмотрим следующую систему из n линейных дифференциальных уравнений                                                          (3.29)Система (3.29) легко решается с помощью последовательного интегрирования уравнений, начиная с первого. При этом функция  определена с точностью до многочлена степени n–1. Подберем этот многочлен таким образом, чтобы для функции  выполнялись соотношения.                 (3.30)Рассмотрим функцию , определяемую по формуле.Из определения функции , вытекает, что и .В силу условий (3.30) , т.е. . Следовательно, для  выполняется соотношение (3.28). Таким образом,.Заменяя в последнем интеграле  на их выражения из системы (3.29), получим.Учитывая, что , из последнего соотношения следует, что.Поэтому  и, значит, .Из последнего уравнения системы (3.29) следует, что .

Аналогично, из (3.29) следует непрерывная дифференцируемость остальных, указанных в лемме функций и справедливость дифференциального уравнения.

Завершим доказательство теоремы. Мы предполагали, что  (3.26). Тогда из определения локального экстремума следует, что функция  имеет локальный экстремум в нуле и, значит, . В силу произвольности  получаем, что .Сопоставим вид первой вариации , выписанный в начале теоремы, с усиленной леммой Дюбуа-Реймона, получим утверждение теоремы.

Правило решения.

1.   Формализовать задачу, то есть привести её к виду (3.26)2.   Выписать необходимое условие – уравнение Эйлера-Пуассона.3.   Найти допустимые экстремали (решение уравнения Эйлера-Пуассона с заданными краевыми условиями). 
Обновлено 19.05.2009 13:05
 
Лекции (авт. Хворова Л.А. и Жариков А.В.)
Автор: Administrator   
15.03.2009 18:03
Методы оптимизации

Глава I

Предварительные сведения

Цель данной главы – напомнить понятия и основные сведения из курсов математического анализа, алгебры, геометрии, функционального анализа, которые будут использоваться при изложении основного материала.

§1.1. Элементы функционального анализа и дифференциального

исчисления

1.1.1. Понятие функции

Определение 1.1. Если каждому элементу  из множества  по некоторому правилу ставится в соответствие единственный элемент  из , то говорят, что на множестве  задано отображение (функция, оператор) , действующее из  в , при этом множество  называется областью определения отображения ,  называется образом ,  называется прообразом элемента  и записывается так: . Множество  называется областью значений функции.

Определение 1.2. Отображение , где – расширенная действительная (вещественная) прямая, то есть совокупность всех действительных чисел, дополненная значениями  и , называется функционалом.

Определение 1.3. Если , то  называется функцией, действующей из множества , если , то  определена на :  существует единственное . Если  существует единственное , то функция называется взаимнооднозначной. Если  определена на  и взаимнооднозначна на нем, то  называется биекцией.

Определение 1.4. Обратной функцией называется функция, ставящая в соответствие каждому  из области определения  из области значений, такое что . Обозначается .

Определение 1.5. Пусть , , . Тогда можно говорить о значении функции  от функции  на области определения функции :  на . Функция  называется сложной функцией, или суперпозицией функций  и .

Определение 1.6. Пусть – числовое множество. Тогда

1.     Если , то  – верхняя грань множества ;

2.     Если , то  – нижняя грань множества ;

3.     Если для множества  существуют ,  – нижняя и верхняя грани, то – ограничено, то есть .

Определение 1.7. Наименьшая верхняя грань множества называется точной верхней гранью и обозначается:  – супремум множества . Наибольшая нижняя грань множества называется точной нижней гранью и обозначается: – инфимум множества .

Определение 1.8. Супремум функции  на промежутке  равен : , если 1) ; 2)  . Инфимум функции  на промежутке  равен : , если 1) ; 2)  .

Определение 1.9. Функция , определенная на , называется непрерывной в точке , если .

По Коши:  непрерывна в точке , если  . Функция  называется непрерывной на промежутке , если  непрерывна. Функция  называется непрерывной на множестве , если  .

Теорема 1.1. Свойства функций, непрерывных в точке.

Если  и  непрерывны в точке , то

1.      непрерывна в точке ;

2.      непрерывна в точке ;

3.      непрерывна в точке .

Если  непрерывна в точке ,  непрерывна в точке , , то  непрерывна в точке .

Теорема 1.2. Вейерштрасса (упрощенный вариант).

Пусть  определена и непрерывна на . Тогда 1) функция ограничена на ; 2) достигает на нем своих точных граней, то есть  и , .

Определение 1.10. Функция  называется равномерно непрерывной на множестве , если  .

Теорема 1.3. (Теорема Кантора).

Если  определена и непрерывна на , функция равномерно непрерывна на .

Определение 1.11.  называется непрерывно дифференцируемой до -го порядка, если ее частные производные -го порядка непрерывны, а производная -го порядка существует.

 

§1.2. Нормированные и банаховы пространства

1.2.1. Основные определения и примеры пространств

Определение 1.12. Линейное пространство  называется нормированным, если на  определен функционал , называемый нормой и удовлетворяющий условиям:

1.      и ;

2.     ;

3.     .

Определение 1.13. Две нормы в   и  называются эквивалентными, если .

Определение 1.14. Нормированное пространство  называется метрическим, если  определено расстояние .

Определение 1.15. Нормированное пространство  называется полным, если всякая фундаментальная последовательность в нем сходится.

Определение 1.16. Полное пространство  с метрикой  называется банаховым.

Примеры банаховых пространств.

1. Конечномерное пространство , состоящее из векторов , с нормой .

2. Пространство  непрерывных вектор-функций , заданных на компакте (то есть замкнутом и ограниченном множестве) , с нормой .

3. Пространство   раз непрерывно дифференцируемых вектор-функций , заданных на конечном отрезке  с нормой .

4. Пространство , состоящее из последовательностей , для которых , с нормой .

Утверждение 1.1. Пусть , – нормированные пространства. Декартово произведение  также является нормированным пространством, если введена норма . Возможны и другие эквивалентные нормировки: , .

Утверждение 1.2. Декартово произведение  банаховых пространств является банаховым пространством.

 

1.2.2. Сопряженное пространство и сопряженный оператор

Определение 1.17. Совокупность  всех линейных непрерывных функционалов на  образует сопряженное к  пространство. Оно является банаховым пространством относительно нормы , где  означает действие на  функционала .

Замечание 1.1. Пространство, сопряженное к конечномерному пространству , изоморфно .

Определение 1.18. Скалярным произведением двух векторов  и  называется сумма . Ту же сумму будем обозначать , если , при этом следует считать  столбцом, – строкой (тогда – произведение матриц).

Определение 1.19. Пусть ,  – нормированные пространства и  – линейный непрерывный оператор из в . Тогда можно определить сопряженный оператор  такой, что .

Лемма 1.1. Всякий функционал  однозначно представим в виде , где .

Лемма 1.2. Все нормы в  эквивалентны.

Определение 1.20. Аннулятором  подмножества  линейного пространства  называется множество тех линейных функционалов  на , для которых .

Определение 1.25. – непрерывный линейный эпиморфизм банаховых пространств  на , если , .

Определение 1.26. Оператор, являющийся линейным непрерывным эпиморфизмом, называется регулярным.

 

§1.3. Некоторые теоремы из геометрии и функционального анализа

1.3.1. Теоремы Вейерштрасса о достижении экстремума

Теорема 1.4. (Теорема Вейерштрасса).

Непрерывная функция на непустом ограниченном замкнутом подмножестве конечномерного пространства достигает своих абсолютных максимума и минимума.

Следствие 1.1.. Если функция  непрерывна на  и  , то  достигает своего абсолютного минимума (максимума) на любом замкнутом подмножестве .

Определение 1.27. Функция , заданная на метрическом пространстве , называется полунепрерывной снизу (сверху), если для любого  множество   () замкнуто.

Теорема 1.5. (Обобщенная теорема Вейерштрасса).

Полунепрерывная снизу (сверху) функция , заданная на метрическом пространстве , достигает минимума (максимума) на всяком компакте, содержащемся в . В частности,  достигает своего минимума (максимума) на всем , если для некоторого  множество  () непусто и компактно.

1.3.2. Теоремы отделимости

Определение 1.28. Пусть , – некоторые подмножества нормированного пространства ,  – сопряженное к  пространство (пространство линейных непрерывных на  функционалов). Говорят, что функционал  разделяет множества  и , если . Функционал  строго разделяет множества  и , если . В первом случае множества  и  называют отделимыми, во втором – строго отделимыми.

Теорема 1.6. Первая теорема отделимости (конечномерный случай).

Пусть – непустое выпуклое множество в  (то есть из того, что  следует, что ), не содержащее точки . Тогда точку  можно отделить от множества .

Теорема 1.7. Вторая теорема отделимости (конечномерный случай).

Пусть – непустое замкнутое выпуклое множество в , не содержащее точки . Тогда точку  можно строго отделить от множества .

Теорема 1.8. (Теорема Хана-Банаха).

Пусть – векторное пространство над , функционал  определен на , – векторное подпространство , – линейный функционал на , . Тогда существует линейный функционал , определенный на : 1);  2).

Теорема 1.9. Первая теорема отделимости.

Пусть – нормированное пространство. Если множества ,  выпуклы, непусты, не пересекаются между собой и при этом – открыто, то существует ненулевой функционал , разделяющий множества  и .

Теорема 1.10. Вторая теорема отделимости.

Пусть – нормированное пространство, – непустое замкнутое выпуклое подмножество и – точка, не принадлежащая . Тогда найдется ненулевой функционал , строго разделяющий  и , то есть такой, что .

1.3.3. Необходимые леммы

Лемма 1.3. О нетривиальном аннуляторе.

Пусть – замкнутое подпространство нормированного пространства , причем . Тогда аннулятор  содержит ненулевой элемент.

Лемма 1.4. О правом обратном операторе.

Пусть , – банаховы пространства, – непрерывный линейный эпиморфизм  на  (). Тогда существуют отображение  (вообще говоря, нелинейное и разрывное) и константа , удовлетворяющие условиям: ,  для всех .

Лемма 1.5. О замкнутости образа.

Пусть , , – банаховы пространства, , – линейные непрерывные операторы. Равенство  определяет линейный непрерывный оператор . Если подпространство  замкнуто в , то подпространство  замкнуто в .

Лемма 1.6. Об аннуляторе ядра регулярного оператора.

Пусть , – банаховы пространства, – линейный непрерывный эпиморфизм. Тогда .

§1.4. Некоторые аспекты дифференциального исчисления

1.4.1. Производная первого порядка

Определение 1.29. Пусть – окрестность точки  в , , . Говорят, что отображение  дифференцируемо в точке , если существует матрица , , такая, что , где ,  , .

Замечание 1.2. Если функция  дифференцируема, то матрица  составлена из частных производных , . Ее обозначают  и называют матрицей Якоби. Если , то определитель матрицы Якоби называют якобианом отображения  в точке .

 

1.4.2. Производные высших порядков

Определение 1.30. Пусть – окрестность точки  в , – функция, определенная и непрерывно дифференцируемая на . Говорят, что функция  дважды дифференцируема в точке , если существует квадратичная форма  такая, что

,

где . Квадратичная форма определяется симметричной матрицей , , которая составлена из частных производных .

Замечание 1.3. Перейдем к бесконечному случаю. Пусть , – нормированные пространства, – открытое подмножество. Если отображение  дифференцируемо в каждой точке , то определено отображение  множества  в пространство . Так как  также является нормированным пространством, то можно ставить вопрос о существовании второй производной . Для . Возьмем , тогда определено . Таким образом, определено линейное по каждому аргументу отображение . Аналогично определяются производные высших порядков.

1.4.3. Основные теоремы

Теорема 1.11. О смешанных производных.

Если для отображения  существует вторая производная , то для всех  .

Теорема 1.12. О дифференцировании сложной функции.

Пусть  определена в некоторой окрестности точки  и дифференцируема в точке . Пусть  определена в некоторой окрестности точки  и дифференцируема в точке . Тогда  дифференцируема в точке  и .

Теорема 1.13. Формула Тейлора.

Если  существует, то

,

где  при .

Теорема 1.14. Конечномерная теорема об обратной функции.

Пусть – окрестность точки , – отображение класса , . Тогда, если Якобиан отображения  в точке  отличен от нуля, то существуют такие ,  и , что для любого  из шара  существует единственное  в шаре  такое, что  и при этом .

Замечание 1.4. Мы привели теорему об обратной функции в той форме, в которой она будет использоваться в курсе. Обычно доказывают больше, в частности, что гладкость обратного отображения будет такая же, как и гладкость прямого, и формулу .

Теорема 1.15. Конечномерная теорема о неявной функции.

Пусть – окрестность точки , , , – обратимая матрица. Тогда существуют ,  и такое отображение  класса , что , , .

Замечание 1.5. Из формулы для производной обратной функции следует, что .

Теорема 1.16. (Теорема Ферма).

Пусть – функция одного переменного, определенная в некотором интервале, содержащем точку , и дифференцируемая в точке . Тогда, если  есть точка локального экстремума функции , то .

Теорема 1.17. (Теорема Ферма для нормированных пространств).

Пусть – нормированное пространство, , ,  и функционал  имеет вариацию по Лагранжу в точке . Тогда, если , то вариация по Лагранжу.

Теорема 1.18. Существования и единственности решения задачи Коши для линейной неоднородной системы.

Рассмотрим задачу Коши , где – непрерывная и непрерывно дифференцируемая по  функция, , тогда, если – решение этой системы, график которого содержится в , определенное на отрезке , то найдутся такие  и окрестность  графика вектор-функции , что для любого  существует единственное решение  задачи Коши, определенное на , функция  непрерывно дифференцируема в области  и при этом

, ,

где – фундаментальная система решений уравнения:

, .

Неравенство Пуанкаре .

§1.5. Некоторые теоремы из курса линейной алгебры

Теорема 1.19. О ранге.

Для любой прямоугольной матрицы число линейно независимых строк, число линейно независимых столбцов и наивысший ненулевой порядок миноров равны между собой и называются рангом матрицы.

Теорема 1.20. Кронекера–Капелли.

Система линейных уравнений совместна тогда и только тогда, когда ранг ее матрицы совпадает с рангом расширенной матрицы.

Теорема 1.21. Критерий Сильвестра.

Матрица  является положительно (отрицательно) определенной тогда и только тогда, когда все ее главные миноры , где , , положительны .

§1.6. Математическое программирование

1.6.1. Классификация задач математического программирования

Задачи математического программирования классифицируются по типам множества  и виду функции . Различают следующие типы задач математического программирования.

1. Задача одномерной минимизации. Здесь  .

2. Задача линейного программирования. Эта задача минимизации линейной функции ,  на выпуклом и замкнутом множестве , заданном системой линейных равенств и неравенств:

.

Здесь  и  – матрицы размерности  и  соответственно, , , .

Множество такого вида называют многогранным или симплексным множеством. Выделение в условиях задачи ограничений типа равенств или неравенств довольно условно, поскольку одни сводятся к другим путем увеличения размерности вектора .

Различают задачу линейного программирования в стандартной (нормальной) форме:

,  - матрица, ,

и канонической:

,  - матрица, ,

3. Задача квадратичного программирования  – многогранное множество, целевая функция квадратичная: , ; – положительно определенная матрица.

4. Задача выпуклого программирования. Здесь целевая функция выпуклая на выпуклом множестве . Задачи квадратичного программирования представляют собой частный случай задач выпуклого программирования.

5. Задача на безусловный экстремум

, .

6. Задача на условный экстремум или задача с ограничениями типа равенств. Здесь ,  представляет собой множество, заданное системой равенств

.

7. Задача с ограничениями типа неравенств

,                                                       (1.1)

Если в задаче (1.1)  в , то задача (1.1) представляет собой задачу выпуклого программирования.

Утверждение 1.3. Любая точка локального минимума выпуклой функции на выпуклом множестве является точкой глобального минимума.

Утверждение 1.4. Строго выпуклая функция может достигать своего минимума не более, чем в одной точке выпуклого множества.

Утверждение 1.5. Пусть выпуклая функция  непрерывно дифференцируема на выпуклом множестве ,  для некоторой точки . Тогда  – точка глобального минимума функции  на рассматриваемом множестве.

Аналогичные свойства справедливы для задачи максимизации вогнутой функции на выпуклом множестве.

 

 
задача о брахистохроне
Автор: Administrator   
28.02.2009 16:05

Задача о брахистохроне.

Эта задача, о которой упоминает еще Галилей, после исследований И. Бернулли 1696 г. послужила толчком к появлению методов решения широкого класса подобных задач, составивших впоследствии основу вариационного исчисления.

 

Пусть в вертикальной плоскости имеются две точки и (первая выше второй). Данные точки могут быть соединены различными плоскими кривыми (в частности, и прямой линией). Предположим, что в помещена материальная точка массы , которая под действием силы тяжести может «скатываться» из точки в по различным кривым, соединяющим и . Геометрически задача о брахистохроне заключается в отыскании такой кривой (если она существует), по которой материальная точка достигнет за кратчайшее время. Эту кривую называют брахистохроной.

Для того, чтобы дать математическую формулировку задачи, введем на рассматриваемой плоскости прямоугольную систему координат. Поместим ее начало в точку и направим ось ординат вертикально вниз. Обозначим координаты точки через . По условию, материальная точка начинает двигаться из без начальной скорости, поэтому согласно закону сохранения энергии можно записать

Где ­ скорость, ­ ордината материальной точки ( ­ ускорение свободного падения). Отсюда находим . Будем считать, что ­ уравнение кривой, по которой «скатывается» материальная точка. Если обозначить через длину пройденного точкой пути, а через ­ время, то можно записать

Следовательно,

Интегрируя, получаем следующее выражение:

, (9.1)

где ­ время, в течение которого материальная точка движется вдоль кривой из в .

Равенство (9.1) задает функционал , определенный на множестве кривых (точнее функций) вида , подчиненных граничным условиям

(9.2)

Из физических соображений ясно, что рассматриваемые кривые не должны иметь «изломов» («углов») и поэтому функции можно считать гладкими (непрерывно дифференцируемыми): .

Математическая постановка задачи о брахистохроне такова: среди всех функций вида пространства , которые удовлетворяют условиям (9.2), требуется найти функцию (если она существует), реализующую минимум функционала ,определяемого формулой

(9.3)

Решение задачи: В задаче о брахистохроне

Здесь , поэтому можно воспользоваться уравнением (9.18), которое в данном случае имеет вид

Отсюда следует, что . Вводя новую константу , получаем

(9.21)

Далее придется дифференцировать уравнение (9.21), поэтому, прежде чем приступить к его решению, обоснуем возможность такого действия. Для этого убедимся в существовании второй производной , т. е. проверим, что первая производная является дифференцируемой на интервале функцией. Предположим, что решение задачи о брахистохроне существует. Тогда оно удовлетворяет уравнению (9.21), а значит . Поскольку ­ непрерывно дифференцируемая функция, согласно последнему равенству, функция также непрерывно дифференцируема. Далее, суперпозиция для двух непрерывно дифференцируемых функций , является непрерывно дифференцируемой функцией. Очевидно, что для всех . Остается показать, что , т. е. что

для всех (9.22)

Справедливость соотношения (9.22) проверим в три этапа.

1) Экстремаль не может быть постоянной ни на одном интервале . В самом деле, если , для всех , то, подставляя в левую часть уравнения Эйлера­Лагранжа (9.16)

2) Производная экстремали может обращаться в нуль не более чем в одной точке. Если это не так, то можно выбрать такие точки , что , причем при всех . Тогда в силу (9.20) верно равенство и, по теореме Ролля, производная обращается в нуль в некоторой внутренней точке интервала , что противоречит выбору и .

3) Производная экстремали может обратиться в нуль только при . Поскольку в выбранной системе координат ось направлена вниз , производная на не отрицательна. Значит, функция не убывает и, согласно равенству (9.21), в точке , в которой , она принимает наибольшее возможное значение. Следовательно, не может быть внутренней точкой и поэтому .

Решение у задачи о брахистохроне является экстремалью, а значит, для этого решения неравенство (9.22) выполняется. Тем самым двукратная непрерывная дифференцируемость оптимального решения доказана.

Используя двукратную непрерывную дифференцируемость решения задачи о брахистохроне, с помощью аналогичных рассуждений можно доказать трехкратную, а затем четырехкратную непрерывную дифференцируемость и т. д. Это означает, что решением задачи о брахистохроне является бесконечно дифференцируемая функция.

Решение уравнения (9.21) будем искать в параметрическом виде. Воспользовавшись подстановкой

(9.23)

запишем уравнение (9.21) в виде

или

(9.24)

Для того чтобы найти функцию , продифференцируем (9.24) по и воспользуемся подстановкой (9.23):

Отсюда имеем

а значит,

Итак, общее решение уравнения Эйлера­Лагранжа (9.21) в параметрической форме имеет вид

и задает на плоскости семейство циклоид, зависящих от двух произвольных постоянных и . Значения этих постоянных определяют из краевых условий , что приводит к решению следующей системы уравнений:

,

,

,

,

Можно доказать, что эта система уравнений относительно (при )всегда имеет единственное решение. Таким образом, для указанных краевых условий существует единственная экстремаль, соединяющая точки и . Только на основании выполнения необходимого условия оптимальности делать вывод о том, что экстремаль является решением задачи о брахистохроне, нельзя. Однако физический смысл данной задачи подсказывает, что оптимальное решение должно существовать; следовательно, им и является найденная экстремаль (циклоида).

Обновлено 14.09.2009 13:54
 


 

Авторизация