ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Доказательство принципа максимума для линейной задачи быстродействия.
Введем понятие сферы достижимости. Пусть 0 > T – верхняя граница на длины интервалов, на которых будут рассматриваться управления. Будем говорить, что точка x принадлежит сфере достижимости, если на интервале [t0, t1] существует допустимое управление u(t) и соответствующая ему траектория x(t) такие, что x(t0) = , x(t1) = 0, t1 – t0 ≤ T. Лемма 1. Сфера достижимости VТ является выпуклым множеством. Доказательство. Пусть , VT. По определению это означает, что существует допустимое управление , t [t0, ], где ≤ t0 + T, которое переводит фазовую точку x из положения в точку 0. Аналогично, существует допустимое управление , t [t0, ], где ≤ t0 + T, которое переводит фазовую точку x из положения в точку 0. Можно считать, что = t0 + T. В противном случае решим систему = f(x, u(t)) с начальным условием () = 0, доопределив управление (t) как показано на рисунке.
Получим, что (t) = 0 на интервале [ t0 + T]. Аналогично, для (·) и (·) можно считать, что = t0 + T. Пусть y0 = λ + (1-λ) , 0≤λ≤1. Тогда управление u*(t)= λ (t) + (1-λ) (t), определенное на интервале [t0, t0 + T], является допустимым управлением. Ему соответствует траектория x*(t) = λ (t) + (1-λ) (t), по которой фазовая точка переходит из начального положения x*(t0) = λ + (1-λ) = y0 в конечное положение x*(t0 + T) = 0. Лемма 2. Если x0 – внутренняя точка VT, то из x0 можно перейти в точку 0 за время строго меньше T. Доказательство. Рассмотрим произвольную точку x0 IntVT. Из определения внутренней точки следует, что существует шар B(x0, r) VT. Так как из леммы 1 следует, что множество VT выпукло, то по лемме Каратеодори существуют (n+1) точки z1,…,zn+1, расположенные внутри шара и такие, что симплекс, образованный ими, содержит x0 строго внутри. Следовательно, в силу непрерывности расстояния найдутся достаточно малые окрестности точек zj из VT, такие, что симплекс, образованный этими точками из сферы достижимости, содержит x0. Тогда по определению множества VТ cуществуют допустимые управления us(t) на интервале [t0, t0 + T] такие, что xs(t0) = ys, xs(t0 + T) = 0, s=1,…,n+1. Так как функции xs(t) непрерывны, то существует ɛ > 0, для которого x0 IntCo{x1(t0 +ɛ),…,xn+1(t0 + ɛ)}. Но все точки xs(t0 + ɛ), s=1,…,n+1 лежат в сфере достижимости VT-ɛ. Это означает, что x0 VT-ɛ. Лемма 3. Пусть u(t) – допустимое управление на интервале [t0,t1], x(t) – соответствующее решение, P(t) – произвольное решение сопряженной системы = - PA на данном интервале. Тогда во всех точках непрерывности управления u(t) справедливы следующие равенства: P(t1)x(t1) – P(t0)x(t0) = . Доказательство. = (t)x(t) + P(t) (t) = -P(t)(Ax(t)+Bu(t)) = P(t)Bu(t). Перейдем к доказательству принципа максимума, то есть докажем, что оптимальное управление удовлетворяет P(τ)Bu*(τ) = , τ [to,t1]. Пусть u(t) – оптимально управление на интервале [t0, t1], x(t0) = x0, x(t1) = 0. Положим, T = t1 – t0. Из леммы 2 следует, что x0 – граничная точка сферы достижимости VT. Следовательно, по теореме отделимости существует вектор d ≠ 0, такой, что для всех векторов х из множества VT выполняется неравенство d(x-x0) ≥ 0. Пусть P – решение = - PA с начальным условием P(t0) = . Для него выполняется равенство P(t)Bu(t) = для всех t из интервала [t0, t1]. Действительное, допустим противное: пусть существует [to,t1] такое, что P()Bu()< . Это означает, что существует такое v U, что P()Bu()< P()Bv. Из непрерывности управления следует, что существует интервал [τ0, τ1] [t0, t1] такой, что P(τ)Bu(τ)<P(τ)Bv для всех τ [τ0, τ1]. Пусть u*(t) = Очевидно, что u* - допустимое управление. Пусть x*(t) – соответствующая ему траектория и x*(t1) = 0. Пусть x*0 = x*(t0). Имеем, что x*0 VT, и, следовательно, d(x*0 – x0) ≥0. Из леммы 3 имеем: d(x*0 – x0) = P(t0)(x*(t0)-x(t0))=(P(t1)x(t1)-P(t0)x(t0)) – (P(t1)x*(t1)-P(t0)x*(t0)) = = . Противоречие с неравенством, которое следует из теоремы отделимости.
Не нашли, что искали? Воспользуйтесь поиском:
|