исчисление, математическая дисциплина, посвященная отысканию экстремальных (наибольших и наименьших) значений функционалов - переменных величин, зависящих от выбора одной или нескольких функций. В. и. является естественным развитием той главы математического анализа, которая посвящена задаче отыскания экстремумов функций. Возникновение и развитие В. и. тесно связано с задачами механики, физики и т.д.
Одной из первых задач В. и. была знаменитая задача о брахистохроне (И. Бернулли, 1696): определить форму кривой, лежащей в вертикальной плоскости, по которой тяжёлая материальная точка, двигаясь под действием только одной силы тяжести и не имеющая начальной скорости, перейдёт из верхнего положения А в нижнее положение В за минимум времени. Эта задача сводится к отысканию функции у ( х ) , доставляющей минимум функционалу
где а и b - абсциссы точек А и В.
Другой такой же 'исторической' задачей является задача об отыскании пути, вдоль которого распространяется свет, идущий от источника света (точка А )к некоторой точке В, в среде с переменной оптической плотностью (то есть в среде, где скорость распространения v есть функция координат). Для решения этой задачи может быть использован, так называемый, Ферма принцип , согласно которому из всех кривых, соединяющих точки А и В, луч света распространяется вдоль той, по которой свет приходит из A в B за кратчайшее время. В простейшем случае, когда свет распространяется в плоскости, задача сводится к отысканию кривой y ( x ) , доставляющей минимум функционалу
Из разрозненных задач подобного рода постепенно в 18 в. начало формироваться В. и. Но и после оформления В. и. в самостоятельную дисциплину она продолжала оставаться связанной с различными проблемами механики и физики. На протяжении 2-й половины 18 в. и всего 19 в. делались интенсивные попытки построить здание механики, опираясь на некоторые общие вариационные принципы (см. Вариационные принципы механики ) . Со 2-й половины 19 в. начинают разрабатываться различные вариационные принципы в механике сплошных сред, затем позднее в квантовой механике, электродинамике и т.д. Возникают вариационные принципы и в средах с диссипацией энергии. Исследования во всех подобных областях продолжают служить базой формирования новых задач В. и. и областью приложения её методов. Однако со временем появились и новые классы задач, далеко раздвинувших традиционные границы дисциплины и превративших В. и. в одну из наиболее обширных ветвей современной математики, включающей в себя, с одной стороны, самые абстрактные вопросы, относящиеся в равной степени к топологии и функциональному анализу, а с другой - разнообразные вычислительные методы решения технических или экономических задач.
Прямые методы . В. и. как самостоятельная научная дисциплина сформировалась в 18 в., главным образом благодаря работам Л. Эйлера .
Простейшей задачей В. и. называют задачу отыскания функции x ( t ) , доставляющей экстремум функционалу
где F - непрерывная и дифференцируемая функция своих аргументов. При этом функция x ( t ) должна удовлетворять следующим условиям:
а) она должна быть кусочно дифференцируемой,
б) при t to и t T она должна принимать значения
х (to) х0, х (Т) хт. (2)
Обе задачи, рассмотренные в начале статьи, являются частными случаями простейшей задачи В. и.
Первые вариационные задачи были задачами механики. Они были поставлены в 18 в. и, следуя традициям того времени, первый вопрос, на который надо было ответить, был вопрос о способе фактического отыскания функции x ( t ) , реализующей минимум функционала (1).
Эйлер создал численный метод решения задач В. и., который получил название Эйлера метода ломаных . Этот метод был первым среди большого класса, так называемых, прямых методов ; все они основаны на редукции задачи отыскания экстремума функционала к задаче отыскания экстремума функции многих переменных. Поскольку для получения решения с высокой точностью задачу приходится сводить к отысканию экстремума функции с большим числом переменных, она становится весьма сложной для ручного счёта. Поэтому долгое время прямые методы были вне основного русла, по которому направлялись усилия математиков, занимавшихся В. и.
В 20 в. интерес к прямым методам значительно усилился. Прежде всего были предложены новые способы редукции к задаче об экстремуме функции конечного числа переменных. Поясним эти идеи на простом примере. Рассмотрим снова задачу отыскания минимума функционала (1) при дополнит. условии
x (to) x (T) 0 (3)
и будем разыскивать решение задачи в форме
где jn (t) - некоторая система функций, удовлетворяющих условиям типа (3). Тогда функционал J (x) становится функцией коэффициентов ai:
J J (ai,..., aN),
и задача сводится к отысканию минимума этой функции N переменных. При известных условиях, наложенных на систему функций {jn} , решение этой задачи стремится при N - ¥ к решению задачи (1) (см. Ритца и Галёркина методы ) .
Другая причина усиления интереса к прямым методам - это систематическое изучение конечноразностных методов в задачах математической физики, начавшееся с 20-х гг. 20 в. Применение ЭВМ превращает постепенно прямые методы в основной инструмент решения вариационных задач.
Метод вариаций. Второе направление исследований - это изучение необходимых и достаточных условий, которым должна удовлетворять функция x ( t ) , реализующая экстремум функционала J (x). Его возникновение также связано с именем Эйлера. Предположим, что тем или иным способом построена функция x ( t ) . Как проверить, является ли эта функция решением задачи- Первый вариант ответа на этот вопрос был дан Эйлером в 1744. В приведённой ниже формулировке этого ответа употребляется введённое в 60-х гг. 18 в. Ж. Лагранжем понятие вариации (отсюда название - В. и.), являющееся обобщением понятия дифференциала на случай функционалов.
Пусть x ( t ) - функция, удовлетворяющая условию (2), a h (t) - произвольная гладкая функция, удовлетворяющая условию h (to) h (T) 0. Тогда величина
J (x + eh) J*(e),
где e - произвольное действительное число будет функцией e . Вариацией dJ функционала J называют производную
(dJ*/de)e 0.
Для простейшей задачи В. и.
Разлагая полученное выражение в ряд по степеням e, получим
где о (e) - члены более высокого порядка. Так как h ( to ) h ( T ) 0, то, проведя интегрирование по частям во втором интеграле, найдём
Пусть теперь x ( t ) реализует экстремум. Тогда функция J*(e) имеет экстремум при e 0 . Поэтому величина dJ должна обратиться в нуль. Отсюда следует: для того чтобы функция x ( t ) доставляла экстремум функционалу (1), необходимо, чтобы она удовлетворяла уравнению
называемому уравнением Эйлера.
Это - дифференциальное уравнение 2-го порядка относительно функции x ( t ) . Необходимое условие dJ 0 может быть применено в ряде случаев для эффективного отыскания решения вариационной задачи, поскольку функция x ( t ) необходимо должна быть решением краевой задачи x ( to ) xo, x ( T ) xT для уравнения (4). Если найдено это решение и оно единственно, то найдено тем самым и решение исходной вариационной задачи. Если краевая задача допускает несколько решений, то достаточно вычислить значение функционала для каждого из решений краевой задачи и выбрать из них то, которому отвечает наименьшее значение J ( x ) . Однако указанный путь обладает одним существенным недостатком: не существует универсальных способов решения краевых задач для обыкновенных (нелинейных) дифференциальных уравнений.
Уже во 2-й половине 18 в. круг задач, изучаемых В. и., значительно расширился. Прежде всего основные результаты, относящиеся к простейшей задаче В. и., были перенесены на общий случай интегральных функционалов вида
где x ( t ) - вектор-функция произвольной размерности, и на функционалы ещё более общего вида.
Условный экстремум. Задача Лагранжа. В конце 18 в. был сформулирован ряд задач на условный экстремум. Этим термином принято называть задачи отыскания функции x ( t ) , доставляющей экстремум функционалу J ( x ) при каких-либо дополнительных условиях, кроме условий на концах интервала (t0, T). Простейшей задачей подобного вида является класс так называемых изопериметрических задач . Своим названием этот класс задач обязан следующей: среди всех замкнутых кривых данной длины найти ту, которая ограничивает максимальную площадь.
Значительно более сложной задачей является та, в которой ограничения носят характер дифференциальных уравнений. Эту задачу называют задачей Лагранжа; особое значение она приобрела в середине 20 в. в связи с созданием теории оптимального управления . Поэтому её формулировка даётся ниже на языке этой теории, возникшем после работ Л. С. Понтрягина и его учеников.
Пусть x (t) и u (t) - вектор-функции размерностей n и m соответственно, причём функция x ( t ) , которую называют фазовым вектором, при t to и t T удовлетворяет граничным условиям:
x (t0) Î e0, x (T) Î eT(5)
где e0 и eT - некоторые множества. Простейшим примером условий типа (5) являются условия (2). Функция x ( t ) и функция u ( t ) , которую называют управлением, связаны условием
dx/dt f (x, u, t),(6)
где f - дифференцируемая вектор-функция своих аргументов. Рассматриваемая задача состоит в следующем: определить функции x ( t ) и u ( t ) , доставляющие экстремум функционалу
Заметим, что и простейшая задача В. и. и изопериметрическая задача являются частным случаем задачи Лагранжа.
Задача Лагранжа имеет огромное прикладное значение. Пусть, например, уравнение (6) описывает движение какого-либо динамического объекта, например космического корабля. Управление u - это вектор тяги его двигателя. Множества e0 и eT - это две орбиты разных радиусов. Функционал (7) описывает расход горючего на выполнение маневра. Следовательно, задачу Лагранжа, применительно к данной ситуации, можно сформулировать следующим образом: определить закон изменения тяги двигателя космического аппарата, совершающего переход с орбиты e0 на орбиту eT за заданное время так, чтобы расход топлива на этот маневр был минимальным. Важную роль в теории подобных задач играет функция Гамильтона
H (x, y, u) (f, y) - F.
Здесь y - вектор, называется множителем Лагранжа (или импульсом), (f, y) означает скалярное произведение векторов f и y . Необходимое условие в задаче Лагранжа формулируется следующим образом: для того чтобы функции и были решением задачи Лагранжа, необходимо, чтобы была стационарной точкой функции Гамильтона Н (х, y, u), то есть, чтобы при
было T H/ T u 0, где y - не равное тождественно нулю решение уравнения
Ty/t -TH/Tx j(x, y, u, t). (8)
Эта теорема имеет важное прикладное значение, так как она открывает известные возможности для фактического нахождения векторов x ( t ) и u ( t ) .
Развитие В. и. в 19 в. Основные усилия математиков в 19 в. были направлены на исследование условий, необходимых или достаточных для того, чтобы функция x ( t ) реализовала экстремум функционала J ( x ) . уравнение Эйлера было первым из таких условий; оно аналогично необходимому условию
которое устанавливается в теории функций конечного числа переменных. Однако в этой теории известны ещё и другие условия. Например, для того, чтобы функция f ( x ) имела в точке минимум, необходимо, чтобы в этой точке было
каков бы ни был произвольный вектор h. Естественно поставить вопрос: в какой степени эти результаты переносятся на случай функционалов- Для того чтобы представить себе сложность, которая здесь возникает, заметим, что функция может реализовать минимум среди функций одного класса и не давать минимум среди функций другого класса и т.д.
Подобные вопросы послужили источником разнообразных и глубоких исследований А. Лежандра , К. Якоби , М. В. Остроградского , У. Гамильтона , К. Вейерштрасса и многих других. Эти исследования не только обогатили математический анализ, но и сыграли большую роль в формировании идей аналитической механики и оказали серьезное влияние на развитие разнообразных отделов теоретической физики.
Развитие В. и. в 20 в. В 20 в. возник целый ряд новых направлений В. и., связанных с интенсивным развитием техники, смежных вопросов математики и вычислительной техники. Одно из основных направлений развития В. и. в 20 в. - рассмотрение неклассических задач В. и., приведшее к открытию принципа максимума Л. С. Понтрягина.
Рассмотрим снова задачу Лагранжа: определить минимум функционала
при условии
фазовый вектор x ( t ) должен удовлетворять ещё некоторым граничным условиям.
В своей классической постановке условия задачи Лагранжа не предусматривают никаких ограничений на управление u ( t ) . Выше (см. раздел Условный экстремум. Задача Лагранжа) подчёркивалась тесная связь между задачей Лагранжа и задачей управления. В рассмотренном там примере u ( t ) - тяга ракетного двигателя. Эта величина подчинена ограничениям: тяга двигателя не может превосходить некоторой величины, и угол поворота вектора тяги также ограничен. В данном конкретном примере компонента ui (i 1,2,3) вектора тяги двигателя подчинена ограничениям
где а-i и a+i - некоторые заданные числа. Подобных примеров можно привести много.
Таким образом, в технике появилось много задач, которые сводятся к задаче Лагранжа, но при дополнительных ограничениях типа (10), записываемых в форме u Î Gu, где Gu - некоторое множество, которое, в частности, может быть замкнутым. Такие задачи получили название задач оптимального управления. В задаче Лагранжа можно исключить управление u ( t ) при помощи уравнения (8) и получить систему уравнений, которая содержит только фазовую переменную х и множитель Лагранжа j . Для теории оптимального управления должен был быть разработан специальный аппарат. Эти исследования привели к открытию принципа максимума Л. С. Понтрягина. Он может быть сформулирован в форме следующей теоремы: для того чтобы функции и были решением задачи оптимального управления чтобы они доставляли минимум функционалу (9)], необходимо, чтобы u ( t ) доставляла максимум функции Гамильтона
где y - множитель Лагранжа (импульс), который является ненулевым решением векторного уравнения
Принцип максимума позволяет свести задачу оптимального управления к краевой задаче для системы обыкновенных дифференциальных уравнений порядка 2n ( n - размерность фазового вектора). Принцип максимума и в этом случае даёт более сильный результат, чем теорема Лагранжа, поскольку он требует, чтобы было не стационарным значением функции Гамильтона Н, а доставляло максимум Н.
Возможен и другой подход к тем же проблемам теории оптимального управления. Пусть s ( х, t ) - значение функционала (9) вдоль оптимального решения. Тогда для того чтобы функция была оптимальным управлением, необходимо (а в некоторых случаях и достаточно), чтобы функция s ( х, t ) удовлетворяла следующему дифференциальному уравнению с частными производными:
называемому уравнением Беллмана (см. Динамическое программирование ) .
Круг вопросов, которыми занимается В. и., непрерывно расширяется. В частности, всё большее и большее внимание уделяется изучению функционалов J ( x ) весьма общего вида, задаваемых на множествах Gx элементов из нормированных пространств. Для задач такого рода уже трудно использовать метод вариаций. Возникли новые методы, основанные на использовании понятия конуса в банаховых пространствах, опорных функционалов и т.д.
Уже в 19 в. была обнаружена глубокая связь между некоторыми проблемами теории уравнений с частными производными и вариационными задачами. П. Дирихле показал, что решение краевых задач для уравнения Лапласа эквивалентно решению некоторой вариационной задачи. Эта проблема привлекает к себе всё больше и больше внимания. Рассмотрим один пример.
Предположим, что имеется некоторое линейное операторное уравнение
Ax f, (11)
где х (x, h) - некоторая функция двух независимых переменных, обращающаяся в нуль на замкнутой кривой Г. При предположениях, естественных для некоторого класса задач физики, задача отыскания решения уравнения (11) эквивалентна отысканию минимума функционала
где W - область, ограниченная кривой Г.
уравнение (11) в этом случае является уравнением Эйлера для функционала (12). Редукция задачи (11) к (12) возможна, например, если А - самосопряжённый и положительно определённый оператор. Оператор Лапласа
удовлетворяет этим требованиям. Связь между проблемами для уравнений с частными производными и вариационными задачами имеет большое практическое значение. Она позволяет, в частности, устанавливать справедливость различных теорем существования и единственности и сыграла важную роль в кристаллизации понятия об обобщённом решении. Эта редукция очень важна также и для вычислит, математики, поскольку она позволяет использовать прямые методы вариационного исчисления.
В перечислении основных разделов современного В. и. нельзя не указать на глобальные задачи В. и., решение которых требует качественных методов. Искомое решение вариационной задачи удовлетворяет некоторому сложному нелинейному уравнению и краевым условиям. Естественно поставить вопрос о том, сколько решений допускает эта задача. Примером такой задачи является вопрос о количестве геодезических, которые можно провести между двумя точками на заданной поверхности. Проблема подобного рода относится уже к компетенции качественной теории дифференциальных уравнений и топологии. Последнее обстоятельство очень характерно. Методы, специфические для смежных дисциплин, топологии, функционального анализа и т.д., всё шире начинают применяться в В. и. В свою очередь, идеи В. и. проникают во всё новые области математики, и грань между В. и. и смежными областями математики теперь провести уже трудно.
Лит.: Лаврентьев М. А., Люстерник Л. А., Курс вариационного исчисления, 2 изд., М. - Л., 1950; Блисе Г. А., Лекции по вариационному исчислению, пер. с англ., М., 1950; Михлин С. Г., Вариационные методы в математической физике, М., 1957; Смирнов В. И., Курс высшей математики, 5 изд., т. 4, М., 1958; Гельфанд И. М., Фомин С. В., Вариационное исчисление, М., 1961; Математическая теория оптимальных процессов, М., 1969.
Н. Н. Моисеев.