Пусть имеется некоторый склад вместимостью , в котором нужно создать запас некоторого однородного продукта. Пусть спрос
на продукт случаен с функцией распределения
. Обозначим планируемый объем запаса через
единиц. Рассмотрим функцию затрат
(8.4.1)
где – удельные затраты по хранению единицы запасов;
– удельный штраф вследствие дефицита. Требуется найти такой уровень запасов
, при котором
. (8.4.2)
Поскольку функция – недифференцируема при
, то в общем случае
– тоже недифференцируема. Очевидно,
, (8.4.3)
то есть имеем частный случай минимаксной задачи.
Находим стохастический квазиградиент
(8.4.4)
и рекуррентный процесс определения оптимального объема запасов выглядит следующим образом:
или
. (8.4.5)
Задачи этого типа возникают при выборе оптимальных решений в условиях неопределенности и риска, когда имеется первый игрок – ЛПР и второй игрок – противодействующая среда. Предположим, что все факторы можно разбить на три группы:
факторы, контролируемые первым игроком;
факторы, контролируемые вторым игроком;
- состояние природы (случайные факторы).
Пусть первый игрок принимает (выбирает) решение x из допустимого множества решений , второй игрок принимает решение y,
, где
– допустимое множество решений второго игрока,
– элементарное событие некоторого вероятностного пространства
.
Предположим, что второй игрок делает свой выбор после первого, ему известно решение первого игрока и состояние природы
. Обозначим через
сумму, которую первый игрок платит второму, если природа находится в состоянии
.
Тогда ожидаемый проигрыш первого игрока равен
(8.4.6)
и надо найти такой , для которого
. (8.4.7)
Итак, приходим к минимаксной задаче, которая является задачей стохастического программирования.
Ее сложность состоит в том, что только в исключительных случаях можно найти в аналитическом виде, и, кроме того,
не будет неперервно дифференцируемой даже при гладкой функции
. Пусть множество
выпукло и замкнуто, и при каждом x и
существует такой
, что
,
причем – непрерывная и выпуклая функция в области
, а
– ее обобщенный градиент по x при фиксированном y и
. Применим для решения задачи (8.4.7) метод СКГ, в котором
– стохастический квазиградиент, где
– результаты независимых наблюдений за состоянием природы
.
Чтобы убедиться в этом, покажем, что для любой точки выполняется неравенство
, (8.4.8)
другими словами, что . Очевидно,
.
В силу сделанных предположений относительно функции имеем
(8.4.9)
и поэтому
. (8.4.10)
Беря операцию условного математического ожидания от обеих частей (8.4.10) при фиксированных и
, получим условие (8.4.8).
Задачу вида:
минимизировать , (8.4.11)
где ,
, называют стохастическим аналогом задачи Чебышева [18]. В этом случае вектор
, определяемый как
, будет иметь вид
(8.4.12)
В разделе 8.2 была рассмотрена двухэтапная задача стохастического программирования:
минимизировать
(8.4.13)
при ограничениях
(8.4.14)
. (8.4.15)
Функция в общем случае не имеет непрерывных производных. В наиболее общем виде предварительный план
и план-компенсация
вместо (8.4.14) имеют при всех
удовлетворять ограничениям
,
. (8.4.16)
Далее, пусть затраты, связанные с реализацией плана и его коррекцией
в состоянии
, равны
.
Обозначим через план-компенсацию, который минимизирует
при условиях (8.4.16), (8.4.15) и фиксированных
,
. Тогда ожидаемые затраты на реализацию плана
и его коррекцию
составляют
, (8.4.17)
и необходимо найти такой , для которого
при условиях (8.4.15), (8.4.16). Предположим, что и
при каждом
выпуклы вниз при всех
, и существует седловая точка
функции Лагранжа:
(8.4.18)
при и
.
Пусть ,
– обобщенные градиенты функций
,
по
при фиксированном
.
Тогда для решения задачи (8.4.13) методом СКГ при условиях (8.4.15), (8.4.16) на выпуклом и замкнутом множестве следует положить
(8.4.19)
, (8.4.20)
или
. (8.4.21)
Можно показать [17], что для функции и вектора
, задаваемого в (8.4.19),
, то есть
– субградиент функции
.
Рассмотрим двухэтапную задачу стохастического программирования с линейными ограничениями и функцией затрат
(8.4.22)
при ограничениях
(8.4.23)
. (8.4.24)
Вектор минимизирует
(8.4.25)
при ограничениях
(8.4.26)
то есть является решением задачи ЛП (8.4.25), (8.4.26).
Обозначим через – двойственные переменные, отвечающие
. В этом случае вектор
в методе СКГ вычисляется так: после
-й итерации получаем
, наблюдаем
(например, моделируя некоторые сценарии на ЭВМ), находим
и вычисляем
, где
– транспонированная матрица к
.
Запишем задачу, двойственную к (8.4.25), (8.4.26):
|
при ограничении
.
Поскольку , то двухэтапной задаче (8.4.22)–(8.4.24) соответствует следующая эквивалентная задача
минимизировать , (8.4.28)
а так как , то
.
Соответствующая процедура для поиска оптимального решения записывается так:
– для задачи без ограничений;
– для задачи с ограничениями.
В математической статистике довольно распространенной оказывается задача оценки параметров распределения случайных величин и процессов, которая формулируется следующим образом.
Имеется случайная величина (или вектор) , распределение которой известно с точностью до параметров
, и известны реализации
случайной величины
при
. Требуется по этим наблюдениям определить
.
Обычно стремятся отыскать такую оценку , которая была бы несмещенной и эффективной. Покажем, что многие задачи оценки
сводятся к решению соответствующих задач стохастического программирования.
Оценка среднего значения. Пусть – случайный вектор с неизвестным средним
, а
– независимые наблюдения вектора
, по которым необходимо оценить
. Рассмотрим функцию
. Минимум этой функции достигается при
=
. Кроме того, для
имеем
. Тогда в соответствии с общим алгоритмом СКГ (8.3.2), (8.3.3) получим следующую процедуру оценивания[17]:
(8.4.29)
Если , а
, то процедура (8.4.29) примет вид
, (8.4.30)
то есть получим классическую формулу оценки среднего.
Оценка моментов. Пусть в постановке задачи предыдущего раздела (оценка среднего) требуется оценить моменты . Предположим, что эти моменты принадлежат некоторому множеству
.
Аналогично предыдущей задаче искомые моменты являются точками минимума функций
, (8.4.31)
,
соответственно.
Применяя стохастический квазиградиентный метод для первых двух случаев в процедуре (8.4.30), положим
, соответственно. Тогда приходим к процедуре
. (8.4.32)
При этом для соответствующей функции имеем
Для задачи минимизации функции
в процедуре (8.3.2) или (8.3.3) в качестве вектора можно взять :
. (8.4.33)
Тогда соответствующая рекуррентная процедура поиска оценки центрального момента -го порядка примет вид :
. (8.4.34)
Можно легко показать, что при этом . Действительно, в силу независимости
и
от
имеем
(8.4.35)