Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Стационарные точки функции Лагранжа.




В этом пункте будет дано описаие стационарных точек функции Лагранжа (6.10) посредством фукции 0(xm+1,xm+2,…,xn), введенной в пункте 6.2 (см.(6.8)).Предварительно докажем одну простую лемму из линейной алгебры.

Пусть задана система линейных однородных уравнений

ai1x1+…+ ainxn=0 i=1,2,…,m (6.16)

и еще одно линейное однродное уравнение

b1x1+…+ bnxn=0 (6.17)

Cистему уравнений, полученную присоединением к системе (6.16) уравнения (6.17), будем называть расширенной системой (6.16)-(6.17).

Лемма: Для того чтобы расширенная система (6.16)-(6.17) была равносильна основной системе (6.16) необходимо и достаточно, чтобы уравнение (6.17) являлось линейной комбинацией уравнений системы (6.16).

Следствие:Для того чтобы уравнение (6.17) было линейной комбинацией уранений (6.16) или, что то же самое, чтобы вектор

b==(b1,…,bn) (6.18)

был линейной комбинацией векторов

ai ==(ai1,…,ain) i=1,2,…,m (6.19)

необходимо и достаточно, чтобы каждое решение системы (6.16) являлось решением уравнения (6.17).

Доказательство леммы. Пусть ранг матрицы (aij) коэффициентов системы (6.16) равен m0. Очевидно, что m0<m. Если m0<m, то уравнений системы (6.16) являются линейными комбинациями остальных. Отбросив те m-m0 линейных уравнений, которые являются линейными комбинациями оставшихся, получили систему из m0 линейно независимых уравнений. равносильную системе (6.16), причем уравнение (6.17) является линейной комбинацией уравнений системы (6.16) тогда и только тогда, когда оно является линейной комбинацией указанной системы из оставшихся m0 уравнений. Поэтому будем с самого начала считать, что, m0=m т.е. что ранг матрицы (aij) коэффициентов системы (6.16) равен m– числу уравнений этой системы.

Пусть система (6.16) и (6.16)-(6.17) равносильны. Это означает, что пространства их решений совпадают.Поскольку все уравнения основной системы (6.16) входят в расширенную систему (6.16)-(6.17), то каждое решение расширенной системы является и решением основной системы, т.е. пространство решений расширенной системы содержится в пространстве решений основной системы. Следовательно, слвпадение этих пространств равносильно равенству их размерностей.

Размерность s пространства решений системы линейных днородных уравнений равны, как известно, числу неизвестных n этой системы, из которого вычтем ранг r матрицы коэффициентов системы: s=n-r.Отсюда следует, что равносильность систем (6.16) и (6.16)-(6.17) означает равенство рангов их матриц.Ранг матрицы коэффициентов системы (6.16) по условию равен m, т.е. векторы (6.19) линейно независимы.

Ранг матрицы коэффициентов расширенной системы (6.16)-(6.17) согласно сказанному в наших условиях также равен m.Поэтому векторы (см.(6.18) и (6.19))

b, a1,…, am (6.20)

линейно зависимы.А это означает, что b является линейной комбинацией векторов a1,…, am.

В самом деле, линейная зависимость векторов (6.20) означает, что существуют такие числа 0, 1,…, m, не все равные нулю. что

0b+ 1a1+…+ mam=0 (6.21)

Здесь заведамо 0=0, так как в противном случае векторы a1,…, am оказались бы линейно зависимыми. Поделив равенство (6.21) на 0, получим, что b является линейной комбинацией векторов a1,…, am.

Обратно, если b является линейной комбинацией векторов (6.19), то в системах векторов (6.19) и (6.20) имеется в точности по m линейно независимых векторов, т.е. ранги матриц коэффициентов систем уравнений (6.16) и (6.16)-(6.17) равны.

Итак, условие, что вектор b является линейной комбинацией векторов (6.19):

1a1+…+ mam=b

эквивалентно равенству рангов матриц коэффициентов рассматриваемых основной и расширенной системв уравнений, следовательно, эквивалентно их равносильности.

ч.т.д.

Доказательство следствия сразу следует из леммы, поскольку системы (6.16) и (6.16)-(6.17) очевидно равносильны тогда и только тогда, когда каждое решение системы (6.16) является и решением уравнения (6.17) – остальные уравнения систем просто совпадают.

ч.т.д.

Замечание 1: доказанная лемма и ее следствие имеют простую геометрическую интерпритацию в n–мерном евклидовом векторном пространстве Rn, т.е. в n–мерном пространстве со скалярным произведением.Используя обозначение скалярного произведения, систему (6.16) можно записать в виде

(ai,x)=0 i=1,2,…,m (6.22)

а уравнение (6.17) в виде

(b,x)=0 (6.23)

где векторы a1,…, am и определены в (6.18) и (6.19), а x=(x1,x2,…,xm+1)

Множество всевозможных линейных комбинаций векторов a1,…, am образуют подпространство пространства Rn и называется подпространством, натянутым на эти векторы.Обозначим его через Z=(a1,…, am).

Множество решений системы (6.22) состоит из всех векторов х, ортоганальных подпространству Z=(a1,…, am) Обозначим это множество решений через Т.Оно также является подпространством пространства Rn.

Подпространства L==Z(a1,…, am) и Т называются ортоганальными дополнениями друг друга в пространстве Rn.

Поскольку L=Z(a1,…, am), то представимость вектора b в виде линейной комбинации векторов a1,…, am равносильна его принадлежности подпространству L пространства Rn:b L.Это условие в свою очередь, равносильно ортоганальности вектора b подпространству Т:b _Т, которая означает, что для всех x Т имеет место равенство (b,x)=0,т.е.что любое реение х системы (6.22) является решением уравнения (6.23).Это и является утверждением следствия леммы.

Замечание 2: напомним метод, которым можно получить все решения однородной системы линейных уравнений.Пусть система (6.16) состоит из линейно независимых уравнений.Тогда ранг матрицы его коэффициентов равен m.Это означает, что существует минор этой матрицы порядка m, не равный нулю.Пусть для определенности

a11… a1m

am1… amm (6.24)

 

В этом случае все решения системы (6.16) можно получить, задавая произвольно последние n-m координаты вектора (x1,x2,…,xn). Остальные координаты однозначно находятся из системы уравнений (6.16).В самом деле, возьмем произвольное решение (x1(0),x2(0),…,xn(0)) системы (6.16).После подстановки xm+1= x(0) m+1,…, xn= xn(0) в (6.16) получится система из m линейных уравнений (с m неизвестными x1,x2,…,xn), матрицы коэффициентов которой в силу условия (6.24) невырожденная.Поэтому существуют единственные значения x1,x2,…,xn, удовлетворяющие получившейся системе.Поскольку (x(0)1,x(0)2,…,x(0)n). также было решением системы (6.16), то x1=x(0)1, x2=x(0)2,…, xm=x(0)m .

Перейдем теперь к анализу стационарных точек функции Лагранжа.

Теорема 6.2: Пусть функции f0, f1, f2,…, fm непрерывно дифференцируема в области G Rn, x(0) G

fi(x)=0, i=1,2,3,…,n

а ранг матрицы Якоби функций f1, f2,…, fm в точке x(0) равен m.Для того чтобы в точке x(0)=(x(0)1,x(0)2,…,x(0)n) градиент f0 являлся линейной комбинацией градиентов f1, f2,…, fm необходимо и достаточно, чтобы точка x(0)=(x(0)1,x(0)2,…,x(0)n) была стационарной точкой для функции.

g(x)=g(xm+1,…,xn)

Напомним,что если в точке x(0) градиент f0 является линейной комбинацией

f0= 1f1+ 2f2+…+ mfm (6.25)

градиентов f1, f2,…, fm, то это равносильно тому, что существует функция Лагранжа

F= f0- 1f1- 2f2-…- mfm (6.26)

для которой точка x(0) является стационарной:

F(x(0))

xi i=1,2,…,n (6.27)

Это просто координатная запись (6.25),ибо в силу (6.26)

F(x(0)) f0 f1 f2 fm

xi xi xi xi xi i=1,2,…,m

Доказательство: По условию ранг матрицы Якоби системы функций f1, f2,…, fm в точке x(0) равен m.Будем считать для определенности, как и в пункте 6.2,что

(f1, f2,…, fm)

(x1,x2,…,xm) x(0) (6.28)

Подставим в уравнение связи (6.3) функции (6.5), являющиеся решением этих уравнений, и продеффиренцируем получившееся относительно переменных xm+1,…,xn тождества.Получим для точки x(0) равенства dfi(x(0))=0, i=1,2,…,m, справедливые для любых приращений dxm+1,…,dxn независимых переменных xm+1,…,xn (напомним, что дифференциал являетсся линейной функцией, определенной на всем пространстве)Использовав инвариантность формы первого дифференциала относительно выбора переменных, получим, что в точке выполняется равенство

fi fi fi fi i=1,2,…,m

x1 xm xm+1 xn (6.29)

где xm+1,…,xn произвольные, а x1,…,xm находятся изформул (6.5). Таким образом вектор dx=(dx1,…,dxm,dxm+1,…,dxn) является решением линейной однородной системы (6.29).

Отметим, что в силу условия (6.28) значения dx1,…,dxm при заданных dxm+1,…,dxn однозначно находятся и из системы (6.29). Из замечания 2 следует также, что указанным способом получаются все решения системы (6.29).

Стационарность точки x(0) для функции g(x)=g(xm+1,…,xn)

означает, что dg(x(0)).Это равенство, в силу инвариантности формы первого дифференциала, можно более подробно записать в виде

f0 f0 f0 f0

x1 xm xm+1 xn (6.31)

где dxm+1,…,dxn можно задавать произвольно, а dx1,…,dxm следует находить из формул (6.5) или, что дает тотже результат из формул (6.29). Инач говоря, любое решение системы уравнений (6.29) является и решением уравнения (6.31). Согласно следствию из леммы это возможно тогда и тoлько тогда, когда уравнение (6.31) является линейной комбинацией уравнений системы (6.29), т.е. когда существуют такие числа, что

f0= 1f1+ 2f2+…+ mfm

ч.т.д.

Замечание 3: Согласно замечанию 2 совокупность всех решений систеиы уравнений (6.29) образуют подпространство Т пространства Rn, являющееся ортогональным дополнением к подпространству L=Z(f1, f2,…, fm). Любой вектор y T ортогонален каждому градиенту fi , а поэтому его естественно назвать касательным вектором в точке x(0) к гиперповерхности fi(x)=0, являющиеся множеством уровня функций fi,i=1,2,…,m.

Таким образом, пространство решений Т системы (6.29) состоит из векторов, касательных одновременно ко всем гиперповерхностям fi(x)=0,i=1,2,…,m, и потому его называют касательным пространством персечений всех гиперповерхностей fi(x)=0,i=1,2,…,m. Напомним, что векторы касательноо пространства Т,т.е. решения системы (6.29), были обознаены через dx (см.(6.30)).

Поскольку в точке условного экстремума согласно теореме 2 имеет место включение

f0 L=Z(f1, f2,…, fm)

то

f0 T

Иначе говоря, градиент f0 одновременно ортогонален всем касательным dx к гиперповерхностям fi(x)=0,i=1,2,…,m:

(f0,dx)=0

(это другая запись уравнения (6.31)), т.е. градиент f0 перпендикулярен касательному пространству Т в точке x(0).Но множество всех векторов, ортогональных к f0, образуют (n-1)– мерное пространство Т0, называемое касательным пространством к гиперповерхности f0(x)= f0(x(0)).В силу сказанного выше, каждый вектор из Т, будучи ортогонален градиенту f0, принадлежит к Т0, т.е. Т Т0.

Итак, если x(0) – точка условного экстремума, то. Т Т0, т.е. касательное пространство в точке x(0) пересечения всех гиперповерхностей, задаваемых уравнениями связи, содержится в касательном пространстве в той же точке гиперповерхности.

Замечание 4: Из теоремы 2 еще раз вытекает следствие теоремы 1.В самом деле, если x(0) является точкой условногo экстремума, то является x(0) точкой обычного экстремума для функции () и, следовательно, ее стационаоной точкой. Поэтому согласно теореме 2 точка x(0) является стационарной точкой для функции Лагранжа, т.е.выполняется условие.

 






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2025 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных