ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
И ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ. НЕОБХОДИМЫЕ Рассмотрим общую математическую постановку экстремальных задач, сформулируем условия существования и признаки оптимальности их решений. Предварительно напомним, что латинское слово extremum означает «крайнее». Оно в математике имеет два конкретных значения: maximum (сокращенно max) — наибольшее и minimum (сокращенно min) — наименьшее. В таком понимании extremum имеет более узкий смысл, чем optimum, переводимый с латинского как «наилучшее». Пусть дана функция f: Х→ R1, где Х Rn. Говорят, что в точке х* X достигается максимальное (минимальное) значение функции f, если выполнено неравенство f (х*) ≥ f (х) (f (х*) ≤ f (х)) для всех х X. Точка х*, в которой достигается максимум (минимум), называется точкой максимума (минимума) функции f. Задача нахождения максимального или минимального значения заданной функции на заданном множестве называется экстремальной задачей. Как видим, имеется два вида экстремальных задач — задача на максимум и задача на минимум. Символически они записываются так: . (2.5) В (2.5) функция f называется целевой функцией, а X— множеством допустимых решений. Оптимальным решением задач (2.5) называется пара (x*,f (x*)), где х * — точка максимума (минимума), а f (х *) — значение функции f в этой точке, т. е. ее максимальное (минимальное) значение на множестве X. Решить задачи (2.5) это значит либо найти оптимальное решение, либо убедиться, что оптимального решения не существует. Решение задач (2.5) требует разрешения трех проблем: 1) проблемы существования оптимального решения; 2) проблемы установления необходимых и достаточных признаков оптимальности (т. е. характерных свойств, присущих точкам максимума и минимума); 3) проблемы численного вычисления оптимальных решений. В экономической практике встречаются случаи, когда поставленная цель не может быть достигнута ввиду тех или иных объективных причин. Подобно этому, оптимальные решения задач (2.5) существуют не всегда. Сформулируем условия, при которых такие решения существуют. В задачах (2.5) применяются экстремальные точки двух видов: локальный максимум (минимум) и глобальный максимум (минимум). Точка х0 X называется точкой локального максимума (минимума), если f (х °) ≥ f (х) (f (х °) ≤ f (х) для всех х Oε (х °), где Оε (х °) — ε-окрестность точки х°. Точка х0 X называется точкой глобального максимума (минимума), если эти неравенства выполняются для всех х X. Достаточное условие существования оптимальных решений задач (2.5) содержится в следующем утверждении. Теорема (Вейерштрасса). Для того чтобы в задачах (2.5) существовала точка глобального максимума (минимума), достаточно, чтобы допустимое множество Х было компактно в Rn, а целевая функция f непрерывна на X. Ввиду сложности проверки ограниченности множества X на практике часто применяется следствие из этой теоремы. Следствие (теоремы Вейерштрасса). Если функция f непрерывна на Rn и то f достигает своего глобального минимума (максимума) в любом замкнутом подмножестве X пространства Rn. Необходимые и достаточные признаки оптимальности играют важную роль в решении задач (2.5). Необходимые признаки всегда «сопровождают» оптимальное решение, потому с их помощью можно вычислить точки, подозрительные на экстремум. Выполнение достаточных признаков для какой-либо допустимой точки х X гарантирует оптимальность этой точки. Поэтому достаточные признаки можно использовать для нахождения оптимального решения из совокупности допустимых точек, удовлетворяющих необходимым признакам. Признаки оптимальности приведем в случае, когда в (2.5) Х≡ Rn. В этом случае задачи (2.5) принимают вид (2.6) и называются задачами безусловной оптимизации. Для того чтобы точка х 0 Rn была точкой локального экстремума в задачах (2.6), необходимо, чтобы . (2.7) Это есть необходимый признак оптимизации I порядка. Все точки х °, удовлетворяющие условию (2.7), называются стационарными точками (точки, подозрительные на экстремум). Среди стационарных могут быть точки, не являющиеся точками экстремума. Пример 2.4. f (х) = х3 → max (min), х R1 Уравнение (2.7) имеет вид 3 х 2 = 0. Отсюда получим стационарную точку х ° = 0. Построив график функции f, можно убедиться, что точка х ° = 0 не является точкой экстремума (это есть точка перегиба графика f). Следующие примеры показывают, что с помощью условия (2.7) можно показать и отсутствие решения в задачах (2.6). Пример 2.5. f (х) = х 12 + х 22 – 2 х 1 х 2 + х 1 → max (min), х R 2. Уравнение (2.7) имеет вид 2 х 1 – 2 х 2 +1 = 0, –2 x 1 + 2 x 2 =0. Эта система несовместна, т. е. нет ни одной стационарной точки, и наша задача не имеет решения. Пример 2.6. f (х) = х 12 – х 22 – 2 х 1 х 2 + х 1 → min, х R 2. Стационарной является единственная точка х 0 = (—1/4, —1/4). Однако она не является точкой минимума, так как, например, для точки = (0, 1) имеем f (х 0) = –1/8 >–1 = . Условие (2.7) выполняется как для точки максимума, так и для точки минимума. Поэтому для выяснения характера экстремума стационарных точек к ним применяют более сложные необходимые признаки оптимальности II Порядка. Пусть в (2.6) функция дважды дифференцируема в точке х 0. Для того чтобы х 0 была точкой локального максимума (минимума) в задаче (2.6), необходимо, чтобы и , (2.8) для всех α Rn. Здесь — матрица Гессе функции f в точке х 0, а — скалярное произведение. Однако при выполнении условий (2.8) точка х 0 не обязательно будет точкой локального экстремума. Для этого нужно, чтобы она удовлетворяла и достаточным признакам. Для того чтобы х 0 была точкой локального максимума (минимума) в задаче (2.6), достаточно, чтобы и , (2.9) для всех α Rn. Условия (2.8) и (2.9) связаны с вогнутостью и выпуклостью функции f. Известно, что дважды дифференцируемая на выпуклом множестве X функция f вогнута (выпукла) тогда и только тогда, когда для любых векторов х 0 Rn и α Rn справедливо условие (2.8). В случае же выполнения условия (2.9) говорят о строгой вогнутости (выпуклости) функции f. С другой стороны, условие (2.8) является признаком отрицательной (положительной) полуопределенности матрицы Гессе. Напомним, что матрица будет отрицательно полуопределенной в точке х 0, если , (2.10) для всех k =1,..., п. Здесь символом обозначен минор k- гопорядка матрицы : где |.| — определитель порядка k х k, вычисляемый в точке х 0. Условие (2.10) означает, что знаки миноров чередуются, причем первый минор . Матрица будет положительно полуопределена тогда и только тогда, когда все миноры матрицы Гессе будут неотрицательны . (2.11) Если в (2.10) и (2.11) неравенства строгие, то получаем необходимое и достаточное условие отрицательной (2.10) и положительной (2.11) определенности матрицы Гессе в точке х 0. Условия (2.10) и (2.11) называется критерием Сильвестра для знакоопределенных матриц. Известно, что если матрица Гессе в точке х 0 положительно определена, то точка х 0 является точкой локального минимума. Если же матрица Гессе в точке х 0 отрицательно определена, то точка х 0 является точкой локального максимума. Поскольку условия (2.8) и (2.9) трудно проверяемы, то при проверке необходимых условий оптимальности в задачах (2.6) применяют критерий Сильвестра. Следовательно, при помощи условий (2.7)—(2.9) можно предложить следующий алгоритм решения задач (2.6): 1) вычислить все стационарные точки (найти все решения уравнения (2.7)); 2) выяснить характер экстремума стационарных точек (с использованием условий (2.8), (2.9)), для чего применить критерий Сильвестра; 3) среди всех точек локального максимума (минимума) найти точки глобального максимума (минимума), сравнивая значения функции/в этих точках. Пример 2.7. f(х) = х14 + х24 -(х1 + х2)2 → max(min), x R2. 1. Уравнение (2.7) имеет вид Решая эту систему (третьего порядка), находим (три) стационарные точки: х 0= (0, 0), х 00 = (1, 1), х 000 = (–1, –1). 2. Выясним характер экстремума, для чего сначала вычислим все главные миноры матрицы Гессе: , . Для точки х 0= (0, 0) имеем , Видно, что критерий для локального минимума не выполнен. Однако , k = 1, 2, т. е. матрица отрицательна, полуопределена и, следовательно, для точки х 0выполнено необходимое условие локального максимума. Так как это лишь необходимое условие, в точке х 0 может и не быть локального максимума. Нужно ее дополнительно исследовать. Рассматривая знак производной функции f вблизи х 0, т. е. в точках х 0 – ε и х 0 + ε, ε > 0, можно убедиться в том, что х 0 не является точкой (локального) максимума.h Для точки х 00 = (1,1) имеем , Следовательно, матрица положительно определена, т. е. для точки х 00выполнено достаточное условие локального минимума. Легко установить, что , k =1,2, т. е. х 000 = (–1, –1) также является точкой локального минимума. 3. Найдем точки глобального минимума: f (x 00) = –2, f (x 000) = –2, то есть точки x 00 и x 000 являются точками глобального минимума (поскольку было установлено, что минимум целевой функции существует). Не нашли, что искали? Воспользуйтесь поиском:
|