![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
||
![]() |
![]() |
|||||||
![]() |
Eng | Rus | Ukr | ![]() |
![]() |
|||||
![]() |
||||||||
![]() |
![]() |
|||||||
![]() |
![]() |
![]() |
||||||
![]() |
Исследование операций
|
28.09.2004
|
![]() |
![]() |
||||
8.4. ПРИМЕНЕНИЕ МЕТОДА СТОХАСТИЧескИХ КВАЗиГРАДиеНТоВ К ЗАДАЧАМ СТОХАСТИЧескОГО ПРОГРАММИРОВАНИЯПростейшая задача управления запасамиПусть имеется некоторый склад вместимостью где
Поскольку функция
то есть имеем частный случай минимаксной задачи. Находим стохастический квазиградиент
и рекуррентный процесс определения оптимального объема запасов
Игровая стохастическая задачаЗадачи этого типа возникают при выборе оптимальных решений в условиях неопределенности и риска, когда имеется первый игрок - ЛПР и второй игрок - противодействующая среда. Предположим, что все факторы можно разбить на три группы: факторы, контролируемые первым игроком; факторы, контролируемые вторым игроком;
Пусть первый игрок принимает (выбирает) решение x из допустимого множества решений Предположим, что второй игрок делает свой выбор после первого, ему известно решение первого игрока Тогда ожидаемый проигрыш первого игрока равен
и надо найти такой
Итак, приходим к минимаксной задаче, которая является задачей стохастического программирования. Ее сложность состоит в том, что только в исключительных случаях можно найти
причем Чтобы убедиться в этом, покажем, что для любой точки
другими словами, что
В силу сделанных предположений относительно функции
и поэтому Беря операцию условного математического ожидания от обеих частей (8.4.10) при фиксированных Стохастическая задача о наилучшем приближении
|
|
при ограничении
.
Поскольку , то двухэтапной задаче (8.4.22)-(8.4.24) соответствует следующая эквивалентная задача
минимизировать , (8.4.28)
а так как , то
.
Соответствующая процедура для поиска оптимального решения записывается так:
- для задачи без ограничений;
- для задачи с ограничениями.
В математической статистике довольно распространенной оказывается задача оценки параметров распределения случайных величин и процессов, которая формулируется следующим образом.
Имеется случайная величина (или вектор) , распределение которой известно с точностью до параметров
, и известны реализации
случайной величины
при
. Требуется по этим наблюдениям определить
.
Обычно стремятся отыскать такую оценку , которая была бы несмещенной и эффективной. Покажем, что многие задачи оценки
сводятся к решению соответствующих задач стохастического программирования.
Оценка среднего значения. Пусть - случайный вектор с неизвестным средним
, а
- независимые наблюдения вектора
, по которым необходимо оценить
. Рассмотрим функцию
. Минимум этой функции достигается при
=
. Кроме того, для
имеем
. Тогда в соответствии с общим алгоритмом СКГ (8.3.2), (8.3.3) получим следующую процедуру оценивания[17]:
(8.4.29)
Если , а
, то процедура (8.4.29) примет вид
, (8.4.30)
то есть получим классическую формулу оценки среднего.
Оценка моментов. Пусть в постановке задачи предыдущего раздела (оценка среднего) требуется оценить моменты . Предположим, что эти моменты принадлежат некоторому множеству
.
Аналогично предыдущей задаче искомые моменты являются точками минимума функций
, (8.4.31)
,
соответственно.
Применяя стохастический квазиградиентный метод для первых двух случаев в процедуре (8.4.30), положим
, соответственно. Тогда приходим к процедуре
. (8.4.32)
При этом для соответствующей функции имеем
Для задачи минимизации функции
в процедуре (8.3.2) или (8.3.3) в качестве вектора можно взять :
. (8.4.33)
Тогда соответствующая рекуррентная процедура поиска оценки центрального момента -го порядка примет вид :
. (8.4.34)
Можно легко показать, что при этом . Действительно, в силу независимости
и
от
имеем
(8.4.35)