WWW.MASH.DOBROTA.BIZ
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - онлайн публикации
 

«КУМКОВ Сергей Сергеевич ОСОБЕННОСТИ МНОЖЕСТВ УРОВНЯ ФУНКЦИИ ЦЕНЫ В ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ ...»

На правах рукописи

КУМКОВ Сергей Сергеевич

ОСОБЕННОСТИ МНОЖЕСТВ УРОВНЯ

ФУНКЦИИ ЦЕНЫ В ЛИНЕЙНЫХ

ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ

05.13.18 математическое моделирование,

численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата физико-математических наук

Екатеринбург 2007

Работа выполнена в отделе динамических систем Института математики и механики Уральского отделения РАН .

Научный руководитель: кандидат физико-математических наук Пацко Валерий Семенович

Официальные оппоненты: доктор физико-математических наук Гусев Михаил Иванович, кандидат физико-математических наук Петров Николай Никандрович

Ведущая организация: Московский государственный университет им. М.В. Ломоносова

Защита состоится 23 мая 2007 года в 1500 на заседании диссертационного совета К 212.286.01 по присуждению ученой степени кандидата физико-математических наук при Уральском государственном университете им. А.М.

Горького по адресу:

620083, г. Екатеринбург, пр. Ленина, 51 .

С диссертацией можно ознакомиться в Научной библиотеке Уральского государственного университета им. А.М. Горького .

Автореферат разослан 20 апреля 2007 г .

Ученый секретарь диссертационного совета, доктор физ.–мат. наук, профессор В.Г. Пименов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Диссертация посвящена численному исследованию особенностей множеств уровня функции цены в линейных дифференциальных играх с фиксированным моментом окончания. Предполагается, что непрерывная квазивыпуклая функция платы зависит от некоторых двух компонент фазового вектора в момент окончания игры. В рамках данной работы под особенностями понимаются: ситуации вырождения временных сечений (t-сечений) множеств уровня узкие шейки ; специфические соотношения, связывающие t-сечения различных множеств уровня; нарушения регулярной структуры полей оптимальных движений, идущих по границе множеств уровня (излом, расщепление, слияние и т.д.) .

Теория дифференциальных игр в настоящее время развитая математическая дисциплина. Первые отчеты Р.Айзекса по дифференциальным играм относятся к 1951 году. В 1965 году была опубликована его книга Дифференциальные игры, переведенная на русский язык в 1967 году1. В нашей стране динамические задачи конфликтного управления рассматриваются с начала 60-х годов прошлого века. Первыми были работы Л.С.Понтрягина и Н.Н.Красовского. В 1974 году опубликована книга Н.Н.Красовского и А.И.Субботина2. В ней, в частности, предложена позиционная формализация дифференциальных игр и доказана теорема об альтернативе, родственная теореме существования функции цены. Важные результаты были получены в работах Л.А.Петросяна и Б.Н.Пшеничного .

Среди работ зарубежных авторов конца 60-х – начала 70-х годов прошлого века отметим работы L.D.Berkovitz, A.Blaqui`re, J.V.Breakwell, e W.H.Fleming, A.Friedman, G.Leitmann, A.W.Merz. В них рассматривались теоремы существования функции цены в подходящем классе стратегий и развивался метод Р.Айзекса решения дифференциальных игр при помощи построения сингулярных поверхностей .





1 Айзекс Р. Дифференциальные игры. М.: Мир, 1967 .

2 Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры .

М.: Наука, 1974 .

Более поздние результаты, относящиеся к 1980-м годам, связаны с истолкованием функции цены игры как обобщенного решения уравнения Гамильтона–Якоби–Беллмана–Айзекса. Теория, опирающаяся на понятие минимаксного решения, была создана А.И.Субботиным. Полученные результаты отражены в книге 2003 года3. Близкое понятие вязкостного решения было введено в работах M.G.Crandall и P.L.Lions. В этом направлении интенсивно работают в настоящее время M.Bardi и I.Capuzzo-Dolcetta .

Параллельно с развитием теории разрабатывались и численные методы. Опыт создания первых универсальных алгоритмов решения некоторых классов дифференциальных игр отражен в сборнике4, опубликованном в 1984 г. в Екатеринбурге. Большую роль в создании алгоритмов и их обосновании сыграли работы Н.Л.Григоренко, М.С.Никольского, В.С.Пацко, Е.С.Половинкина, В.Н.Ушакова .

За рубежом численные методы интенсивно развиваются с начала 1990-х годов. В этой области проводят исследования итальянские математики M.Bardi, M.Falcone, P.Soravia; французские P.Cardaliaguet, M.Quincampoix, P.Saint-Pierre; немецкие M.H.Breitner, H.J.Pesch .

В настоящее время достижения вычислительной техники позволили по-иному взглянуть на возможность использования численных методов при решении дифференциальных игр. Актуальной становится разработка новых методов и алгоритмов .

Цель работы. Исследование особенностей множеств уровня функции цены в линейных дифференциальных играх с фиксированным моментом окончания. Разработка соответствующих алгоритмов и компьютерных программ .

Методы исследования. Аппарат выпуклого анализа, попятные конструкции теории дифференциальных игр, численные алгоритмы .

3 Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка: перспективы динамической оптимизации. М.; Ижевск: Ин-т компьютер .

исслед., 2003 .

4 Алгоритмы и программы решения линейных дифференциальных игр / Ред .

А.И. Субботин, В.С. Пацко. Свердловск, 1984 .

Научная новизна. На примере задачи о воздушном перехвате изучены причины, вызывающие вырождение двумерных t-сечений множеств уровня функции цены (максимальных стабильных мостов) появление узких шеек. Построены новые примеры дифференциальных игр, в которых имеются множества уровня с несколькими узкими шейками .

Сформулировано свойство уровневого выметания квазивыпуклой функции. Доказана теорема о наследовании свойства уровневого выметания функцией цены линейной дифференциальной игры. С помощью контрпримеров показана специфичность этого факта для ситуации, когда фазовый вектор игры имеет размерность 2 .

Разработаны алгоритмы глобального численного построения и классификации сингулярных поверхностей в линейных дифференциальных играх с фиксированным моментом окончания .

Результаты диссертационной работы являются новыми .

Теоретическая и практическая ценность работы. Разработанные автором программы построения множеств уровня функции цены (максимальных стабильных мостов) в линейных дифференциальных играх с фиксированным моментом окончания и непрерывной квазивыпуклой функцией платы в сочетании с имеющимися средствами научной визуализации являются удобным инструментом, существенно помогающим в изучении игр из этого класса. Представленные в работе алгоритмы глобального численного построения сингулярных поверхностей также могут быть полезными в качестве инструмента при анализе структуры решений дифференциальных игр и исследовании пучков оптимальных движений .

–  –  –

диссертации составляет 127 страниц. Библиографический список включает 83 наименования, в том числе 16 публикаций автора по теме диссертации. Список иллюстраций включает 77 позиций .

Апробация работы. Основные результаты диссертации докладывались автором и обсуждались на конференциях молодых ученых Института математики и механики УрО РАН (Екатеринбург, 2000, 2001 гг.);

28-й, 30-й, 31-й, 33-й региональных молодежных конференциях Проблемы теоретической и прикладной математики (Екатеринбург, 1997, 1999, 2000, 2002 гг.); на международных конференциях: the 8th International Colloquium on Dierential Equations, August 18–23, 1997, Plovdiv, Bulgaria; IFAC Workshop on Nonsmooth and Discontinuous Problems of Control and Optimization, Chelyabinsk, Russia, 17–20 June 1998; the 8th International Symposium on Dynamic Games and Applications, July 5–8, 1998, Chateau Vaalsbroek, Maastricht, the Netherlands; the 11th IFAC Workshop “Control Applications of Optimization” (CAO 2000), July 3–6, 2000, St.Petersburg, Russia; the 10th International Symposium on Dynamic Games and Applications, July 8–11, 2002, Saint-Petersburg, Russia; the 4th International ISDG Workshop, May 19–21, 2003, Goslar, Germany;

конференции Демидовские чтения на Урале, Екатеринбург, 1–3 марта 2006 г.; семинарах отдела динамических систем и отдела управляемых систем ИММ УрО РАН, семинаре лаборатории управляемых систем Института проблем механики РАН, семинарах кафедры оптимального управления факультета ВМиК МГУ и кaфедpы общих проблем упpaвления механико-мaтемaтического фaкультетa МГУ, семинаре кафедры кибернетики Московского института электроники и математики, семинаре кафедры дифференциальных уравнений Удмуртского госуниверситета, семинаре кафедры прикладной математики Челябинского госуниверситета .

Публикации. Основные результаты диссертации опубликованы в работах [1–16] .

СОДЕРЖАНИЕ РАБОТЫ

Во введении дается краткий обзор литературы по дифференциальным играм, определяется цель работы, излагаются основные результаты диссертации .

–  –  –

Алгоритм5 попятного построения максимального стабильного моста W для игры (2), вытягиваемого от выпуклого компактного терминального множества M (от множества уровня функции платы), реализует идею альтернированного интеграла Л.С.Понтрягина6. На выходе алгоритма получаем набор многоугольников W(t), приближающих tсечения W (t) моста W .

5 Исакова Е.А., Логунова Г.В., Пацко В.С. Построение стабильных мостов в линейной дифференциальной игре с фиксированным моментом окончания // Алгоритмы и программы решения линейных дифференциальных игр. Ред. А.И. Субботин, В.С. Пацко, Свердловск, 1984. C. 127–158 .

6 Понтрягин Л.С. Линейные дифференциальные игры, 2 // Докл. АН СССР, №4, Т.175, 1967. C. 764–766 .

Вводится сетка моментов времени {t0 t1... tN = T } с шагом. На этой сетке динамика игры (2) подменяется кусочнопостоянной. Множества P, Q, M подменяются выпуклыми многогранными аппроксимациями P, Q, M. Полагаем W(tN ) = M. Затем множество W(tN ) пересчитывается в множество W(tN 1 ), которое в свою очередь пересчитывается в множество W(tN 2 ), и т.д. Процедура пересчета использует опорную функцию предыдущего (в обратном времени) сечения W(ti+1 ) и опорные функции вектограмм первого P(ti ) = D(ti )P и второго Q(ti ) = E(ti )Q игроков. А именно, опорная функция нового сечения W(ti ) есть7 выпуклая оболочка функции

–  –  –

Процесс построений прекращается либо по достижении момента t0, либо когда выпуклая оболочка очередной функции (·, ti ) является несобственной функцией, т.е. W(ti ) = .

Имеет место сходимость численно построенных t-сечений приближенного моста W к сечениям идеального моста W в метрике Хаусдорфа .

Оценки погрешностей приведены в работе Н.Д. Боткина8 .

Первый из примеров, численно исследованных в диссертации при помощи программы, реализующей описанный алгоритм модельная игра9,10, связанная с задачей воздушного перехвата. Преследователем в 7 Пшеничный Б.Н., Сагайдак М.И. О дифференциальных играх с фиксированным временем // Кибернетика, №2, 1970. С. 54–63 .

8 Botkin N.D. Evaluation of numerical construction error in dierential game with xed terminal time // Problems of Control and Information Theory, Vol. 11, № 4, 1982 .

pp. 283–295 .

9 Shinar J., Medinah M., Biton M. Singular Surfaces in a Linear Pursuit-Evasion Game with Elliptical Vectograms // Journal of Optimization Theory and Optimization, Vol.43, No.3, 1984. pp. 431 458 .

10 Shinar J., Zarkh M. Pursuit of a Faster Evader a Linear Game with Elliptical Vectograms // Proceedings of the Seventh International Symposium on Dynamic Games, Yokosuka, Japan, 1996. pp. 855 868 .

этой задаче выступает ракета-перехватчик, убегающим маневрирующая воздушная цель (самолет или другая ракета). Естественной платой в такой игре является расстояние наименьшего сближения, т.е. промах, который минимизируется преследователем P и максимизируется убегающим E .

Векторы номинальных скоростей (VP )nom и (VE )nom являются постоянными и направленными так, что имеется точная встреча на номинальных траекториях. Управляющее ускорение каждого объекта перпендикулярно вектору его текущей скорости. Максимальные значения боковых ускорений ограничены константами aP и aE. Полагается, что aP aE. Убегающий непосредственно управляет своим ускорением, а догоняющий инерционно, с постоянной времени P. Возможности объектов по изменению направления вектора их скорости в процессе движения являются малыми (слабо маневрирующие объекты) .

Выбор координат производится следующим образом. Начало координат O совмещается с номинальным положением Pnom догоняющего в начальный момент. Ось OX направлена вдоль начальной номинальной линии визирования. Ось OY перпендикулярна OX и лежит в плоскости, определяемой векторами номинальных скоростей объектов (рис. 1) .

Ось OZ направлена перпендикулярно первым двум осям .

Поскольку отклонения скоростей VP (t) и VE (t) от их номиналь

<

Рис. 1: Система координат в задаче трехмерного преследования

ных значений (VP )nom и (VE )nom малы, относительное движение вдоль оси OX может рассматриваться как равномерное и промах можно просчитывать в момент номинальной встречи в виде расстояния между объектами в плоскости Y Z в этот момент. Стало быть, задача минимизации трехмерного промаха на заданном промежутке времени может быть сведена к минимизации расстояния в плоскости Y Z в фиксированный момент T номинальной встречи .

Производя линеаризацию динамики объектов относительно номинальных движений, приходим к следующей линейной дифференциальной игре:

<

–  –  –

Здесь x вектор положения первого (догоняющего) игрока, y вектор положения второго (убегающего) игрока, P постоянная времени, характеризующая инерционность отработки управления первого игрока.

Множества P и Q, ограничивающие управления первого и второго игроков, являются эллипсами:

–  –  –

Полуоси AP, BP, AE, BE параллельны координатным осям и вычисляются на основе ограничений aP, aE на ускорения игроков и косинусов углов (P )nom и (E )nom. Момент окончания T игры фиксирован. Платой является геометрическое расстояние между объектами в момент окончания. Первый игрок минимизирует функцию платы, второй максимизирует .

Структура задачи такова, что в ней появляются множества уровня функции цены, имеющие узкие шейки, строение которых принципиально разнится для случаев, когда скорость преследователя больше скорости убегающего и когда меньше. Для второго случая множества, близкие к критическому, имеют весьма сложное строение в районе узкой Рис. 2: Множество уровня с узкой шейкой, близкое к критическому (внутреннее красное), и большее множество уровня (внешнее желтое прозрачное) Рис. 3: Увеличенный фрагмент с узкой шейкой шейки. Здесь и далее критическим называем множество уровня функции цены с непустыми t-сечениями на [t0, T ], имеющее на (t0, T ) одно или более t-сечений с пустой внутренностью. На рис. 2 приведен вид двух множеств уровня: близкого к критическому и большего. Видно, что большее множество уровня имеет гладкую границу. Это означает, что именно около узкой шейки сосредоточены нерегулярности функции цены (рис. 3). Чтобы правильно отразить их, нужны очень аккуратные вычисления в районе узкой шейки. Кроме того, потребовались хорошие средства визуализации трехмерных максимальных стабильных мостов .

Соответствующие программы были разработаны в 1997-2000 гг. в секторе компьютерной визуализации отдела системного обеспечения ИММ УрО РАН В.Л.Авербухом, А.И.Зенковым, Д.А.Юртаевым .

Вычислительные качества программы проверялись и на других примерах, относящихся, как и система (5), к классу игр, которые называются обобщенный контрольный пример Л.С.Понтрягина 11,12.

Среди прочих был подобран и просчитан следующий пример:

–  –  –

Во второй главе диссертации обсуждаются свойства множеств уровня функции цены линейной дифференциальной игры, связанные с понятием полного выметания .

11 Никольский М.С. Первый прямой метод Л.С.Понтрягина в дифференциальных играх. М: Изд-во Моск. ун-та, 1984 .

12 Чикрий А.А. Конфликтно управляемые процессы. Киев: Наукова Думка, 1992 .

Рис.

4: Игра (6): общий вид множества уровня функции цены с двумя узкими шейками Геометрической разностью (разностью Минковского) множеств A и B называют13,14 совокупность элементов пространства, вдвигающих множество B в множество A при помощи алгебраической суммы:

–  –  –

Вообще говоря, если сложить геометрическую разность двух множеств с множеством-уменьшаемым, то получим лишь подмножество множестваХадвигер Г. Лекции об объеме, площади поверхности и изопереметрии .

М: Наука, 1966 .

14 Понтрягин Л.С. Линейные дифференциальные игры, 1 // Докл. АН СССР, №6, Т.174, 1967. C. 1278–1280 .

–  –  –

то говорят, что множество A полностью выметается множеством B (множество B полностью выметает множество A). Понятие полного выметания введено в работе П.Б. Гусятникова и М.С. Никольского15 .

Пусть f скалярная функция аргумента x и Mc = {x : f (x) c} ее множество уровня, соответствующее константе c. Будем говорить, что функция обладает свойством уровневого выметания, если для любой пары констант c1 c2 в случае непустоты множества уровня Mc1 этой функции оно полностью выметает множество уровня Mc2 .

Результатом второй главы является следующая

Теорема. Пусть непрерывная квазивыпуклая функция платы (·) дифференциальной игры (2) обладает свойством уровневого выметания:

для любых двух констант c1 c2 ее множество уровня Mc1 (если оно непусто) полностью выметает множество уровня Mc2 .

Тогда соответствующие множества уровня Wc1 и Wc2 функции цены V (·) игры (2) обладают аналогичным свойством: для каждого момента t [t0, T ] такого, что сечение меньшего множества уровня Wc1 (t ) непусто, сечение Wc1 (t ) полностью выметает сечение Wc2 (t ) большего множества уровня .

Обоснование теоремы базируется на рекуррентном правиле пересчета (3), (4), записанном на языке множеств:

–  –  –

Таким образом, для того, чтобы проверить наличие полного выметания сечения Wc2 (t ) сечением Wc1 (t ) множеств уровня в некоторый моГусятников П.Б., Никольский М.С. Об оптимальности времени преследования // Докл. АН СССР, Т. 168, № 3, 1969. С. 518–521 .

мент t, в предположении о полном выметании множества Mc2 множеством Mc1, следует проверить сохранение этого свойства при операциях алгебраической суммы, геометрической разности и при предельном переходе с измельчением шага сетки по времени .

Для обоснования теоремы доказываются несколько утверждений, в том числе следующие леммы:

Лемма (2.5.1). Пусть множества A и B таковы, что множество A полностью выметается множеством B, т.е. A = B + (A B). Тогда для любого множества P имеем

–  –  –

Отметим, что первая из этих лемм верна в пространстве любой размерности и для любых множеств A, B, P (от них не требуется ни выпуклость, ни замкнутость, ни ограниченность). Вторая же лемма специфична для пространства R2, что показывается соответствующими контрпримерами .

В третьей главе излагаются разработанные автором алгоритмы численного глобального построения и классификации сингулярных поверхностей в линейных дифференциальных играх с фиксированным моментом окончания и непрерывной квазивыпуклой функцией платы. Алгоритмы разработаны для двух подклассов: для задач со скалярными управлениями, ограниченными по модулю, и для случая строго выпуклых ограничений на управления игроков .

Типы сингулярных поверхностей описаны в книге Р.Айзекса Дифференциальные игры. Исходя из вариантов поведения оптимальных движений (другими словами, обобщенных характеристик уравнения Гамильтона–Якоби–Беллмана–Айзекса), выделяют следующие виды сингулярных поверхностей: рассеивающие, универсальные/фокальные, экивокальные, поверхности переключения. Необходимые условия, характеризующие тот или иной тип сингулярной поверхности, получены P. Bernhard16 и А.А. Меликяном17. В работах A.W. Merz, J. Lewin, J.G. Olsder, J. Shinar исследованы сингулярные поверхности, возникающие в конкретных задачах. Автору неизвестны работы, посвященные численным алгоритмам глобального построения сингулярных поверхностей в дифференциальных играх .

В диссертации предложена следующая схема построения сингулярных поверхностей. В процессе нахождения очередного сечения W(ti ) максимального стабильного моста W на границе W(ti ) выделяются сингулярные точки, которые классифицируются и связываются с точками на границе W(ti+1 ) ранее построенного в обратном времени сечения W(ti+1 ). В итоге после построения рассматриваемого стабильного моста имеем совокупность сингулярных линий на его границе. Сингулярные поверхности строятся на основе набора сингулярных линий, снятых с системы мостов (множеств уровня функции цены) .

Таким образом, первичными являются сингулярные линии на границе множеств уровня .

Классификация получаемых сингулярных точек базируется на рассмотрении поведения пучков оптимальных движений игры, аппроксимирующей эквивалентную игру (2). Оптимальное движение, начавшись на границе некоторого множества уровня функции цены, в дальнейшем идет по границе этого множества .

Для случая скалярных управлений сингулярными оказываются точки на границе сечения W(ti ), для которых конус внешних нормалей содержит нормали отрезков вектограмм P(ti ) и Q(ti ) игроков .

16 Bernhard P. Singular Surfaces in Dierential Games: an Introduction // Dierential Games and Applications. Springer-Verlag, Berlin, 1977. pp. 1–33 .

17 Melikyan A.A. Generalized Characteristics of the First Order PDEs: Applications in

–  –  –

Классификация типа сингулярности основана на анализе дополнительных меток, которые присваиваются векторам, описывающим строение положительно-однородной кусочно-линейной функции (·, ti ) (3), и затем проходят сквозь процесс построения выпуклой оболочки этой функции. Для выделения сингулярных точек некоторых типов дополнительно требуется анализ негладкости соответствующих вершин многоугольника W(ti ). Вершина называется гладкой, если ее конус внешних нормалей имеет раствор меньше заданного порога .

Для случая строго выпуклых ограничений обнаружение особых точек основано на поиске негладких вершин построенного сечения W(ti ). Найденные точки связываются с точками на предыдущем сечении W(ti+1 ). Точки считаются соответствующими, если их конусы внешних нормалей пересекаются. Классификация сингулярных точек основана на анализе развития конуса. Если в обратном времени конус раскрывается, точка помечается как рассеивающая. Если конус сужается, точка помечается как фокальная. Если конус поворачивается (необязательно сохраняя величину раствора), то точка помечается как экивокальная .

Приведем результаты построения сингулярных поверхностей в игре конфликтно-управляемый осциллятор :

–  –  –

Рисунок 5 показывает два ракурса системы сингулярных поверхностей для игры (7) в исходных координатах x1, x2. Сингулярные поверхности разного типа отмечены соответствующими цифровыми выносками. В пояснении к выноскам добавочные слова за первого игрока означают, что на соответствующей поверхности скачком меняется управление первого игрока. При этом оптимальное управление второго игрока одно и то же по разные стороны вблизи от поверхности. Добавочные слова за обоих игроков означают скачкообразное изменение оптимального управления каждого игрока .

Обратное время на рис. 5 идет справа налево. Вблизи начала обратРис. 5: Два ракурса системы сингулярных поверхностей для задачи конфликтно-управляемый осциллятор (7): 1 поверхность переключения за первого игрока, 2 поверхность рассеивания за второго игрока, 3 экивокальная поверхность, 4 поверхность рассеивания за обоих игроков ного времени видны огрехи восстановления рассеивающей поверхности .

На поверхностях нанесена сетка связей соответственных точек: одно семейство линий, вертикальное, показывает связи между точками, снятыми с разных мостов в один и тот же момент времени; другое семейство, продольное связи между точками, снятыми с одного моста .

Видно, как некоторые линии сетки, идущие вдоль мостов, сходятся к центру. Это объясняется тем, что отдельные мосты обрываются; при этом размеры их сечений уменьшаются .

Пустое место в центре около оси времени получается потому, что при взятом количестве множеств уровня и выбранном шаге по времени там недостаточно информации для восстановления: происходит разрежение сетки линий вследствие специфического поведения стабильных мостов перед обрывом. Были проведены расчеты, дающие плотность сингулярных точек, достаточную для аккуратного восстановления поверхности в этой области. Однако при этом плотность точек получилась избыточной в начале обратного времени, что не дало существующим алгоритмам визуализации восстановить и отобразить поверхности .

Вдали от оси времени с ростом значения цены происходит расщепление экивокальной поверхности на рассеивающую поверхность и поверхность переключения .

После проверки алгоритма построения и классификации сингулярных поверхностей на различных вариантах классических примеров материальная точка на прямой и конфликтно-управляемый осциллятор были исследованы сингулярные поверхности в других задачах .

Был, в частности, обнаружен пример, названный кнопка. Соответствующая дифференциальная игра описывается соотношениями

–  –  –

Общий вид характерного максимального стабильного моста в исходных координатах x1, x2 приведен на рис. 6. Стабильный мост просчитан для случая, когда множество Q было выбрано в виде отрезка {|v1 | 0.9, v2 = 0}. Значение платы было взято равным c = 7.0 .

Рис. 6: Общий вид характерного множества уровня функции цены для игры (8) Обрыв моста произошел в момент = 6.9 обратного времени .

Свое название пример получил за сходство внешнего вида стабильных мостов с канцелярской кнопкой .

Структура сингулярных поверхностей в этом примере типична: начальные лепестки рассеивающей поверхности за второго игрока и поверхности переключения за первого сливаются затем в экивокальную поверхность, которая в центре у оси времени переходит в рассеивающую поверхность за обоих игроков .

Рассматриваемый пример был использован для исследования зависимости строения сингулярных поверхностей от параметров игры. Для одного и того же интервала значений платы c [0.5, 7.0] было просчитано шесть вариантов игры с различным размером и ориентацией отрезка Q ограничения на управление второго игрока. Были взяты два размера отрезка Q: отрезок длины 1.8 случай сильного первого игрока и отрезок длины 2.2 случай слабого первого игрока. (В первом случае длина отрезка Q меньше длины отрезка P, а во втором больше.) Для каждого из этих случаев просчитывалось три варианта с различным положением отрезка Q.

Он брался с серединой в начале координат, но с разной ориентацией:

а) отрезок Q на горизонтальной оси v1 :

Q = {v2 = 0} {v1 + v2 l2 };

–  –  –

Здесь l половина длины отрезка Q, равная, соответственно, 0.9 или 1.1 .

Результаты построения системы сингулярных поверхностей в исходных координатах x1, x2 приведены на рис. 7 и 8. Обозначения подрисунков соответствуют вариантам ориентации отрезка Q. Цифровые выноски сохраняют тот же смысл, что и на рис. 5. Все рисунки сделаны в одинаковом масштабе .

На рисунках а) сингулярные поверхности имеют в целом сходную структуру с тем отличием, что на рис. 8 протяженность в обратном времени системы поверхностей меньше в силу бльших возможностей втоо рого игрока. На рисунках б) видны различия в изменении системы поверхностей: в случае сильного первого игрока увеличивается экивокальная поверхность, а в случае слабого первого игрока рассеивающая .

Наконец, в случае в), когда имеет место однотипность объектов и игра фактически сводится к задаче управления, остается единственный тип поверхности, соответствующий более сильному игроку. В случае сильного первого игрока это поверхность переключения (со скачкообразным изменением оптимального управления обоих игроков), а в случае слабого первого игрока рассеивающая сингулярная поверхность (на ней также скачком меняются оптимальные управления обоих игроков) .

Подчеркнем, что когда игра превращается в задачу управления, то полностью пропадает экивокальная поверхность. Она не может существовать в задачах управления .

Численные результаты, полученные при помощи алгоритмов численного глобального построения и классификации сингулярных поверхРис. 7: Изменение структуры син- Рис. 8: Изменение структуры сингулярных поверхностей в игре (8) гулярных поверхностей в игре (8) при сближении отрезков P и Q в при сближении отрезков P и Q в случае сильного первого игрока случае слабого первого игрока ностей, сравнивались с известными в литературе результатами аналитических исследований. Алгоритм для случая скалярных управлений был применен к задаче, исследованной в работе В.С. Пацко и С.И. Тарасовой18. Алгоритм для случая строго выпуклых ограничений 18 Пацко В.С., Тарасова С.И. Свойства сингулярной поверхности в игре сближения второго порядка // Исследования задач минимаксного управления, Ред .

А.И.Субботин, В.С.Пацко. Свердловск: УНЦ АН СССР, 1985. С. 48–65 .

на управления игроков тестировался на задаче воздушного перехвата, изучавшейся в упоминавшихся ранее статьях J.Shinar. Получено хорошее совпадение, что свидетельствует о разумности процедур, заложенных в алгоритмы .

В параграфе 3.3.9 для случая скалярных управлений описаны закономерности изменения типов сингулярных поверхностей с ростом значения функции цены. При обосновании соответствующей схемы использована теорема об уровневом выметании из второй главы .

Основные результаты, выносимые на защиту

1) исследование численными методами феномена узких шеек множеств уровня функции цены в линеаризованной задаче воздушного перехвата, а также в линейных дифференциальных играх типа обобщенный контрольный пример Л.С.Понтрягина ;

2) формулировка и доказательство теоремы о свойстве уровневого выметания функции цены;

3) разработка алгоритмов автоматического глобального построения сингулярных поверхностей для двух классов линейных дифференциальных игр .

Автор глубоко благодарен научному руководителю к.ф.-м.н. Пацко Валерию Семеновичу за постоянное внимание к работе .

Публикации по теме диссертации [1] Ганебный С.А., Кумков С.С., Пацко В.С. Построение управления в задачах с неизвестным уровнем динамической помехи // Прикл .

математика и механика. 2006. Т.70. Вып. 5. C. 753–770 .

[2] Kumkov S.S., Patsko V.S. Parallel algorithm for construction of singular surfaces in linear dierential games. Analysis of singular surfaces // Proceedings of the Eighth International Colloquium on Dierential Equations, August 18-23, Plovdiv, Bulgaria, 1997. Bainov D. (Ed.) .

Utrecht, the Netherlands, 1998. pp. 275–284 .

[3] Кумков С.С. О разработке параллельной программы решения линейных дифференциальных игр // Алгоритмы и программные средства параллельных вычислений, Вып. 3. Екатеринбург: УрО РАН,

1999. С. 145–164 .

[4] Kumkov S.S., Patsko V.S. Level sets of value function and singular surfaces in linear dierential games // A Proceedings Volume from the IFAC Workshop on Nonsmooth and Discontinuous Problems of Control and Optimization, Chelyabinsk, Russia, 17-20 June 1998 .

Batukhtin V.D., Kirillova F.M., Ukhobotov V.I. (Eds.). Pergamon Press, Great Britain, 1999. pp. 143–148 .

[5] Averbukh V.L., Kumkov S.S., Shilov E.A., Yurtaev D.A., and Zenkov, A.I. Specialized Scientic Visualization Systems for Optimal Control Application // A Proceedings Volume from the IFAC Workshop on Nonsmooth and Discontinuous Problems of Control and Optimization, Chelyabinsk, Russia, 17-20 June 1998. Batukhtin V.D., Kirillova F.M., and Ukhobotov, V.I. (Eds.). Pergamon Press, Great Britain,

1999. pp. 28–33 .

[6] Kumkov S.S., Patsko V.S. Backward procedures in linear dierential games of small dimension // Modern Applied Mathematics Techniques in Circuits, Systems and Control. Mastorakis N. (Ed.). World Scientic and Engineering Society Press, 1999. pp. 138–143 .

[7] Averbukh V.L., Kumkov S.S., Patsko V.S., Pykhteev O.A., and Yurtaev D.A. Specialized visualization systems for dierential games // Progress in Simulation, Modelling, Analysis and Synthesis of Modern Electrical and Electronic Devices and Systems. Mastorakis N .

(Ed.). World Scientic and Engineering Society Press, 1999 .

pp. 301–306 .

[8] Жаринов А.Н., Кумков С.С. Построение пучка оптимальных движений в линейной дифференциальной игре // Проблемы теоретической и прикладной математики, Труды 31-й Региональной молодежной конференции. Екатеринбург: УрО РАН, 2000. С. 87–88 .

[9] Кумков С.С., Пацко В.С. Максимальные стабильные мосты в контрольном примере Л.С.Понтрягина // Вестник Удмуртского Университета (Математика, Механика), Ижевск. 2000. № 1 .

C. 92–103 .

[10] Kumkov S.S., Patsko V.S., Shinar J. Level Sets of the Value Function in Linear Dierential Games with Elliptical Vectograms // Proceedings of the 11th IFAC Workshop Control Applications of Optimization (CAO 2000), (July 3-6, 2000, St.Petersburg, Russia), Vol. 2. Zakharov V .

(Ed.). Saint-Petersburg, 2000. pp. 579–584 .

[11] Averbukh V.L., Kumkov S.S., Pykhteev O.A., and Yurtaev D.A. Visualization of Level Sets and Singular Surfaces in Dierential Games // Proceedings of the 15th Conference on Scientic Computing ALGORITMY 2000, Vysoke Tatry Podbanske, Slovakia, September 10-15,

2000. Handlovicova A., Komornikova M., Mikula K., and Sevcovic D .

(Eds.). Slovak University of Technology, Bratislava Faculty of Civil Engineering Department of Mathematics and Descriptive Geometry,

2000. pp. 196–206 .

[12] Кумков С.С. О разработке параллельной программы решения линейных дифференциальных игр // Сборник трудов конференции Высокопроизводительные вычисления и их приложения, Черноголовка, 30 октября 2 ноября 2000 г. М: Изд-во МГУ, 2000 .

С. 268–271 .

[13] Kumkov S.S., Patsko V.S. Construction of Singular Surfaces in Linear Dierential Games // Annals of the International Society of Dynamic Games, Vol. 6. Altman E., Pourtallier O. (Eds.). Birkhauser, Boston, 2001. pp. 185–202 .

[14] Жаринов А.Н., Кумков С.С. Построение пучка оптимальных движений в линейной дифференциальной игре с эллиптическими вектограммами // Проблемы теоретической и прикладной математики:

Труды 33-й Региональной молодежной конференции. Екатеринбург: УрО РАН, 2002. С. 239–243 .

[15] Kumkov S.S., Patsko V.S., Shinar J. On level sets with narrow throats in linear dierential games // International Game Theory Review .

2005. Vol. 7. No. 3, September. pp. 285–312 .

[16] Kumkov S.S., Patsko V.S. Level Sweeping of the Value Function in Linear Dierential Games // Annals of the International Society on Dynamic Games, Vol.8. Haurie A., Raghavan T.E.S. (Eds.) .

Birkhauser, Boston, 2006. pp. 23–37 .

Кумков Сергей Сергеевич

ОСОБЕННОСТИ МНОЖЕСТВ УРОВНЯ

ФУНКЦИИ ЦЕНЫ В ЛИНЕЙНЫХ

ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ






Похожие работы:

«ГОСУДАРСТВЕННЫЕ СТАНДАРТЫ СОЮЗА ССР ЕДИНАЯ СИСТЕМА КОНСТРУКТОРСКОЙ ДОКУМЕНТАЦИИ ОБОЗНАЧЕНИЯ УС Л О В Н Ы Е Г Р А Ф И Ч Е С К И Е В СХЕМ АХ ГОСТ 2.752—71, ГОСТ 2.755—87, ГОСТ 2.756—76, ГОСТ 2....»

«Министерство образования и науки РФ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Томский государственный архитектурно-строительный университет ДИАЛЕКТИКА ИНЖЕНЕРНОГО ТВОРЧЕСТВА Методические указания к практической работе Соста...»

«LIBRARY определения функциональных блоков Файл: IU_M710P_A1_00_ALGORITHMS_01i00_RUS Версия программного обеспечения: S_M710P_A1_00 Актуализация: 19.05.2015 Изготовитель оставляет за собой право изменения проекта устройства, спецификации и других информации...»

«$J%/044& ­ №№ / I f 11 И/1 JMJ •J "J ШМПУЬЩ ГОСУДАРСТВЕННЫЙ КОМИТЕТ ПО ИСПОЛЬЗОВАНИЮ АТОМНОЙ ЭНЕРГИИ СССР ВСЕСОЮЗНЫЙ НАУЧНО­ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ РАДИАЦИОННОЙ ТЕХНИКИ ВОПРОСЫ АТОМНОЙ НАУКИ И ТЕХНИКИ РАДИАЦИОННАЯ ТЕХНИКА В...»

«Notice grany:granny 30/11/07 10:28 Page A1 GB RUS UA Notice grany:granny 30/11/07 10:28 Page A2 P A L B C M D N E F J G H O K I Notice grany:granny 30/11/07 10:28 Page A3 Notice grany:granny 30/11/07 10:28 Page A4 Notice grany:granny 30/11/...»

«СКУРИХИН Александр Аркадьевич ПОЛУЧЕНИЕ И ИССЛЕДОВАНИЕ ЭЛЕКТРОХИМИЧЕСКОГО ПОВЕДЕНИЯ МОДИФИЦИРОВАННЫХ МЕТАЛЛАМИ ОКИСЛЕННЫХ И ТЕРМОРАСШИРЕННЫХ ГРАФИТОВ Специальность 05.17.03 – Технология эле...»

«Nowa Polityka Wschodnia 2014, nr 1(6) ISSN 2084-3291 Х ат и ра М. и б ра г и М о в а Бакинский славянский университет Роль Гейдара Алиева в становлении религиозной толерантности в Азербайджане Abstract The articl...»

«ХАРЬКОВСКИЙ ОРДЕНА ЛЕНИНА Физика ТЕХНИЧЕСКИЙ ИНСТИТУТ АН УССР ХФТИ 78-31 Ю.А.БЕРЕЖНОЙ, Г.А.ХОМЕНКО НЕУПРУГОЕ ДИФРАКЦИОННОЕ РАССЕЯНИЕ ЧАСТИЦ ПРОМЕЖУТОЧНЫХ ЭНЕРГИЙ АТОМНЫМИ ЯДРАМИ Харьков 1978 ХАРЬКОВСКИЙ ОРДЕНА ЛЕНИНА ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ АН УССР ХФТИ 78-31 Ю.А.БЕРЕЖНОЙ, Г.А.ХОМ...»







 
2019 www.mash.dobrota.biz - «Бесплатная электронная библиотека - онлайн публикации»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.