Eng | Rus | Ukr
Исследование операций
24.12.2008

<< prev | ^up^ | next >>

1.3. НЕКОТОРЫЕ ПРИНЦИПЫ И ПРОБЛЕМЫ ПРИНЯТИЯ РЕШЕНИЙ в ЗАДАЧАХ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ

Как отмечалось (п. 1.2), принятие решений служит фундаментом исследования операций.

В процессе принятия решений возникают такие трудности.

Наличие большого числа критериев, которые не всегда согласованы между собой. Например, при проектировании нового прибора, устанавливаемого на летательном аппарате выдвигаются требования минимальной массы, максимальной надежности и минимальной стоимости. Эти критерии противоречивые, и потому возникает задача поиска компромисса между ними.

Высокая степень неопределенности, обусловленная недостаточной информацией для обоснованого принятия решений.

Элементы задач принятия решений
  и классификация задач

Любая задача принятия решений характеризуется следующими элементами.

Лицо, принимающее решение (ЛПР), которое должно нести ответственность за последствия этих решений.

Множество переменных, значение которых выбираются лицом, принимающим решение. Будем называть их управляющими воздействиями или стратегиями.

Множество переменных, значения которых зависят от выбора стратегий. Их будем называть выходными переменными (характеристиками принятия  решений или исходами решений).

Множество переменных, значение которых не регулируются ЛПР. Эти переменные могут оставаться определенными при решении той или другой задачи, и тогда их называют параметрами задачи. В других случаях они могут изменяться независимо от ЛПР и тогда они являются возмущениями (внешней средой).

Задан интервал времени Т, на котором принимается решение в данной задаче (ситуации).

Математическая модель задачи принятия решений, которая представляет собой множество соотношений, связывающих стратегии (управляющие воздействия) и параметры задачи с выходными переменными.

Ограничения, отображающие требования, накладываемые ситуацией принятия решений на выходные переменные и стратегии задачи.

Целевая функция (критерий оптимальности), которая дает возможность оценивать свойства выбираемого решения. При этом целевая функция может зависеть от стратегий согласно  математической модели задачи принятия решений.

Произведем формализацию задачи принятия решений.

Обозначим для представленной задачи через  множество векторов стратегий;  - множество векторов параметров задачи;  - множество векторов внешних возмущений (состояний внешней среды); - множество векторов выходных переменных. Тогда математическая модель задачи принятия решений описывается отображением  y вида:

                                   (1.3.1)

В зависимости от вида отображения существуют различные типы моделей. Так, в зависимости от степени изменчивости параметров и внешних возмущений, модели могут быть статическими или динамическими. Если параметры  и внешние возмущения  остаются неизмеными во времени, то математическая модель будет статической. В противном случае, имеем динамическую модель ситуации принятия решений. Отображение y,  описывающее динамическую модель, может быть задано различными классами дифференциальных и разностных уравнений.

Математические модели различаются также видом внешних возмущений, которые могут быть как детерминированными ,так и случайными.

Если возмущения неслучайные, то их можно отнести к параметрам  задачи, и тогда детерминированная модель будет описываться отображением вида

                                    (1.3.2)

Если же возмущения являются случайными, то имеем стохастическую модель задачи принятия решений, которая описывается общим отображением (1.3.1). В этом случае выходные переменные будут также случайными, их распределения при заданных параметрах  будут определяться распределениями внешних возмущений.

В зависимости от условий внешней среды и степени информированности лица, принимающего решение, существует такая классификация задач принятия решений: а) в условиях определенности; б) в условиях риска; в) в условиях неопределенности; г) в условиях конфликтных ситуаций или противодействий (активного противника).

Принятие решений в условиях определенности

Принятие решений в условиях определенности характеризуется однозначной или детерминированной связью между принятым решением и его результатом. Главная трудность - это наличие нескольких критериев, по которым следует сравнивать результаты. Тогда возникает проблема принятия решений при так называемом векторном критерии оптимальности [33; 9]. Эта проблема будет рассмотрена далее.

Рассмотрим проблему выбора наилучших решений. Она возникает тогда, когда существует некоторое счетное или несчетное множество допустимых стратегий, удовлетворяющих ограничениям, входящим в математическую модель задачи.

Будем называть совокупность стратегий (управляющих воздействий), удовлетворяющих ограничениям задачи, множеством допустимых альтернатив А, из которых осуществляется выбор. В дальнейшем будем обозначать альтернативы через  и при необходимости будем указывать ограничения, которые их определяют.

Для сравнения различных альтернатив и выбора наилучшей из них сначала выбирают некоторое свойство (или совокупность свойств) оцениваемых альтернатив и строят ее количественную меру (оценку), по значениям которой можно сравнивать альтернативы между собой и выбрать наилучшую. Такая мера носит название функции полезности. Созданы соответствующие правила принятия решений на основе теории полезности, разработанной Дж. Фон Нейманом и О. Моргенштерном [36].

Эта теория основывается на системе аксиом, в которых утверждается, что существует некоторая мера ценности, которая носит название функции полезности (результатов) и дает возможность упорядочить альтернативы.

Практическое использование теории полезности базируется на следующихих аксиомах, которые определяют свойства функции полезности [36; 47].

 1.Результат (альтернатива)  оказывается предпочтительнее  альтернативы  (что записывается как ), тогда и только тогда, если , где ,  - полезности альтернатив  и  соответственно.

 2.Транзитивность: если , а , то   и

                                    (1.3.3)

3.Линейность: если некоторый результат  можно представить в виде , где

 , то               (1.3.4)

4. Адитивность: если  - полезность от достижения одновременно результатов  и , то свойство адитивности функции  записывается как

5. Аналогично, если имеем n результатов , достигаемых одновременно, то

 .                             (1.3.5)

Определим в терминах функции полезности  следующие отношения на множестве альтернатив: отношение слабого предпочтения- 'не хуже', обозначаемое знаком ; отношение строгого предпочтения, обозначаемое знаком и отношение эквивалентности (равноценности), обозначаемое знаком ~.

Для двух альтернатив  будем говорить, что

       f

 x1x2 тогда и только тогда, когда ,   (1.3.6)

 тогда и только тогда, когда , (1.3.7)

 тогда и только тогда, когда . (1.3.8)

Знаки  при сравнении значений целевых функций для различных альтернатив берутся в зависимости от того, считается ли альтернатива лучшей при большем или меньшем значении целевой функции.

Для определения функции полезности возможных результатов создана методика, которая предложена в [1]. Рассмотрим несколько вариантов методики определения полезности для различных случаев.

I. Случай, когда имеем только 2 результата. Соответствующая методика определения полезности включает такие шаги:

Определяем, какой результат более предпотителен для лица, принимающего решение. Пусть .

Определяем такую вероятность , при которой достижение результата  будет эквивалентно результату , получаемому с вероятностью 1.

Оцениваем соотношение между полезностями результатов  и . Для этого примем полезность , тогда ; .

ІІ. Случай, когда имеются n возможных результатов , между которыми установлено отношение предпочтения: . Для этого случая методика определения полезности результатов следующая.

Определяем величину  из условия .

Аналогично определяем , .

Положив полезность наименее предпочтительного результата  равной 1, находим: ;

;

;

.,

 .

ІІІ. Случай, когда отдельные критерии являются качественными. Здесь используется методика определения полезности, предложенная

Р. Акофом и Р. Черчменом [1;53].

Предположим, что имеется n результатов . Методика состоит из следующих этапов.

Упорядочивают все результаты по  убыванию предпочтительности. Пусть  - наилучший,  - наихудший результат.

Составляют таблицу возможных комбинаций результатов, а затем устанавливают их предпочтение относительно отдельных результатов  (табл. 1.3).

Эту информацию о предпочтительности результатов получают от экспертов.

Приписывают начальные оценки полезностям отдельных результатов . Подставляют начальные оценки в последнее соотношение табл. 1.3. Если оно удовлетворяется, то оценки не изменяют. В противном случае производят коррекцию полезностей так, чтобы это соотношение удовлетворялось.

После этого переходят к следующему соотношению. Процесс коррекции продолжается до тех пор, пока не образуется система оценок , которая будет удовлетворять всем указанным в табл. 1.3 соотношениям. Коррекцию следует производить таким образом, чтобы изменять оценки для минимального числа результатов.

Таблица 1.3

1

 или

 или

2

 или

 или

3

 или

 или

 

.

 

.

 или

 или

Пример 1.1. Пусть эксперт упорядочивает пять результатов , приписав им следующие оценки:

Рассмотрев возможные варианты выбора, он высказал следующие суждения относительно ценности тех или других комбинаций результатов:

                                                         1) ;

                                                         2) ;

                                                         3) ;

                                                         4) ;

                                                         5)  ;

                                                         6) ;

                                                7) .

Нужно произвести оценку полезности результатов так, чтобы удовлетворить всем неравенствам.

Подставим начальные оценки в неравенство 7):

 .

Следовательно, неравенство 7) не удовлетворяется. Изменяем полезность результата  и проверяем неравенство 6):

 .

Это неравенство также не удовлетворяется.

Положим . При этом неравенство 5) удовлетворяется.

Проверим неравенство 4)

 .

Оно не выполняется. Поэтому возьмем . Теперь неравенства 1), 2), 3) удовлетворяются.

Проверим еще раз неравенства 6) и 7) при измененных значениях полезностей: . Оба неравенства выполняются.

Запишем окончательные оценки полезности результатов:

Такая методика определения полезности применима, когда количество результатов n ограничено, .

В случаях, когда , Р. Черчмен , Р. Акоф предложили модифицированный способ коррекции оценок [1].

Множество результатов разбивают на подмножества, состоящие из 5-7 результатов и имеющие один общий результат, например, .

Затем приписывают начальные значения полезностям для всех результатов, причем полезность общего результата  одинакова во всех подмножествах. Дале применяют способ коррекци оценок полезности независимо в каждом из подмножеств при ограничении, что . В результате получают систему оценок полезности с единой мерой для всех подмножеств .

После того как в соответствии с описанной методикой функция полезности всех альтернатив определена, правило (процедура) выбора наилучшей из них в условиях определенности записывается так:

      найти такой , что

 .

 

 

 
Очевидно, что целевая функция (полезность), на основе которой производится выбор наилучшей альтернативы, может быть построена разными способами. Целевые функции  и ,  характеризующие одно и то же свойство выбираемого решения и определенные на одном множестве альтернатив, будем называть эквивалентными, если они определяют на нем одно и то же отношение слабого предпочтения , то есть если для двух произвольных альтернатив  и  из  следует, что , и наоборот. Здесь индекс  над знаками слабого предпочтения  указывает на функцию, с помощью которой задается это отношение. Из данного определения следует, что эквивалентные целевые функции определяют на множествах А те же самые отношения строгого предпочтения и эквивалентности.

Какие свойства должны удовлетворять эквивалентные целевые функции устанавливает такая простая теорема (33).

ТЕОРЕМА 1.1.  Для того чтобы целевые функции  и  были эквивалентными, достаточно, чтобы существовало такое монотонное преобразование , переводящее область значений функции  в область значений функции  так, что  для всего множества допустимых альтернатив. При этом, если обе целевые функции максимизируются, то преобразование  должно быть монотонно возрастающей функцией, а если нет, то монотонно убывающей функцией.

 

 

 

 
Доказательство. Рассмотрим случай, когда критерии максимизируются и  - монотонно возрастающее преобразование (так как другие случаи доказываются аналогично). Тогда, если , то есть , то , а значит, . Утверждение  следует из  в силу монотонности обратного преобразования.

Приведем примеры эквивалентных целевых функций:

 , где ,

 при .

Принятие решений в условиях риска

Эта задача возникает в том случае, когда с каждой стратегией  связано целое множество возможных результатов  с известными вероятностями . Формально модель задачи можно представить в виде следующей матрицы (табл. 1.4).

 ,

где  - полезность результата  при использовании решения .

 
Таблица 1.4
 

.

.

.

.

           

.

.

             

.

.

Пусть заданы условные вероятности .

Введем ожидаемую полезность для каждой стратегии:

 , .                         (1.3.9)

Правило для определения оптимальной стратегии записывается так:

                             (1.3.10)

Принятие решений в условиях неопределенности

Одним из определяющих факторов в таких задачах является внешняя среда (или природа), которая может находиться в одном из к состояний , неизвестных лицу, принимающему решение (ЛПР).

Тогда математическую модель задачи принятия решений в условиях неопределенности можно сформулировать следующим образом .

Имеется некоторая матрица U размерностью  (табл.1.4). Элемент этой матрицы  можно рассматривать как полезность результата  при использовании стратегии :

 .

В зависимости от состояния природы  результат  достигается с вероятностью . Кроме того, ЛПР неизвестны априорные вероятности . Лицо, принимающее решение, может высказывать определенные гипотезы, относительно состояния природы. Его предположения о возможном состоянии природы называют субъективными вероятностями:

 .

Если бы величина  была известна лицу, принимающему решение, то мы бы имели задачу принятия решений в условиях риска. В этом случае правило принятия решений определяется следующим образом:

 .          (1.3.11)

На самом деле текущее состояние природы неизвестно ЛПР, неизвестно также распределение вероятностей . Как выбрать при этом оптимальную стратегию?

Существует несколько критериев для выбора оптимальной стратегии.

Критерий Вальда (критерий осторожного наблюдателя). Этот критерий оптимизирует полезность в предположении, что природа (внешняя среда) находится в самом невыгодном для наблюдателя состоянии. По данному критерию правило принятия решений имеет следующий вид:

 ,

 где                             (1.3.12)

По критерию Вальда выбирают стратегию, которая дает гарантированный выигрыш при наихудшем варианте состояния природы.

Критерий Гурвица основан на следующих двух предположениях: природа может находиться в самом невыгодном состоянии с вероятностью  и в самом выгодном - с вероятностью , где  - коэффициент доверия.

Тогда правило принятия решений записывается так:

 .   (1.3.13)

Если , то получим критерий Вальда. Если , то имеем правило вида , - которое имеет название стратегии оптимиста, который верит в свою удачу.

Критерий Лапласа. Если состояния природы (среды) неизвестны, то все они считаются равновероятными:

 .

В результате правило принятия решений определяется соотношением (1.3.11).

Критерий Сэвиджа (критерий минимизации сожалений). Сожаление - это величина,  равная изменению полезности решения (результата) при данном текущем состоянии среды относительно наилучшего возможного состояния (для данного решения). Чтобы определить сожаление, выполняют следующие процедуры.

Вычисляют матрицу , где  . В каждом столбце этой матрицы находят максимальный элемент:

 .                      (1.3.14)

Его вычитают от всех элементов столбца. Затем строят матрицу сожалений: , где . Правило выбора оптимальной стратегии в соответствии с критерием Сэвиджа записывается так:

 .                         (1.3.15)

Рассмотрим использования упомянутых критериев в условиях неопределенности в такой практической ситуации.

Пример 1.2. Судовая компания планирует организацию перевозок пассажиров на летний сезон. Число пароходов (лайнеров) которые должны быть зафрахтованы, а также число экипажей, которые надо нанять и подготовить к следующей весенне-летней навигации, является величиной переменной и определяется фактическими потребностями в пасажироперевозках в данный сезон. Предположим, что оно может приобретать значения 10, 20, 30, 40 и 50 судов. Фактическая потребность в пасажироперевозках является величиной случайной, зависящей от множества неизвестных факторов. Пусть судовая компания составила смету эксплуатационных затрат и определила величину ожидаемого дохода от выполнения плана перевозок в зависимости от числа зафрахтованных пароходов  и фактической потребности в них для полного удовлетворения потребностей пассажиров в перевозках S. Пусть рассчитанные значения ожидаемого дохода для всех возможных значений  и  приведены в табл. 1.5.

 
Таблица 1.5

Sk

Xi

10

20

30

40

50

10

60

60

60

60

60

20

10

110

110

110

110

30

-48

30

160

160

160

40

-100

-50

200

240

240

50

-150

-100

50

200

340

Требуется определить оптимальное число зафрахтованных пароходов ,  максимизирующее ожидаемый доход. Рассчитаем эту величину, пользуясь вышеприведенными критериями.

Критерий Вальда. Согласно этому критерию .

Критерий Лапласа. По этому критерию

 .

Критерий Гурвица. В соответствии с этим критерием оптимальное решение определяется из условия

 .

Построим таблицу ожидаемых прибылей по критерию Гурвица (табл. 1.6):

 .

 
Таблица 1.6

a

Xi

0,1

0,2

0,5

0,8

0,9

10

60

60

60

60

60

20

20

30

60

90

100

30

-27,2

-6,4

56

118,4

139,2

40

-661

-32

70

172

206

50

-101

-52

95

242

291

Тогда оптимальное количество пароходов в зависимости от  определяется  табл. 1.7.

Таблица 1.7

0,1

0,2

0,5

0,8

0,9

20

20

20

50

50

Критерий Сэвиджа. Строим матрицу сожалений , а результаты заносим в табл. 1.8.

 
Таблица 1.8

Sk

Xi

10

20

30

40

50

10

0

-50

-140

-180

-280

20

-50

0

-90

-130

-230

30

-108

-80

-40

-80

-80

40

-160

-160

0

0

-100

50

-210

-210

-150

-40

0

Вычисляем:

 .

Откуда .

Таким образом, нужно сделать выбор между следующими решениями: по критерию Вальда следует зафрахтовать 10 пароходов, по критерию Гурвица - 20 пароходов, если руководство компании является пессимистами, или 50 пароходов, если они оптимисты; по критерию Сэвиджа следует зафрахтовать 30 пароходов. Которому же из возможных решений следует дать предпочтение? Это зависит от выбора соответствующего критерия в условиях неопределенности.

Выбор критерия принятия решений есть наиболее сложным и ответственным этапом в исследовании операций. При этом не существует каких-либо общих рекомендаций. Выбор критерия должен производить заказчик операционного исследования на самом высоком уровне иерархии и в максимальной степени согласовывать его со спецификой конкретной задачи и своими целями. В частности, если принимается очень ответственное решение и даже минимальный риск недопустим, то следует использовать критерий Вальда - гарантированного результата. Наоборот, если определенный риск допустим и руководство фирмы (заказчик) готово вложить в намечаемую операцию столько средств, сколько нужно, чтобы потом не сожалеть за утраченной выгодой, то выбирают критерий Сэвиджа.

При отсутствии достаточной информации для выбора того или иного критерия возможен альтернативный подход, связаный с вычислением вероятностей (шансов) успеха и неудачи на основе прошлого опыта.

<< prev | ^up^ | next >>

 
     
  Copyright © 2002-2004