4.5. Нечеткий метод группового учета аргументов.
Принципы самоорганизации метода группового учета аргументов
Построение систем самоорганизации по методу группового учета аргументов (МГУА) базируется на следующих принципах:
Самоорганизация относится к эмпирическим методам моделирования. Эти методы в своей области применения имеют некоторые преимущества по сравнению с теоретическими и полуэмпирическими методами построения моделей. В тех случаях, когда мы наблюдаем параметры исследуемого объекта, но не знаем структуры и механизма взаимодействия между элементами сложной системы, поведение которой определяет значения параметров, подход самоорганизации оказывается единственным надежным средством построения моделей прогноза. С помощью самоорганизации решение можно определить, даже если другими способами получить результаты невозможно. Модели, полученные с помощью самоорганизации, имеют специфическую область применения и особенно эффективны для долгосрочного прогноза. Физические модели, полученные на основе математической теории наблюдаемых объектов, могут преследовать только полностью определенные опознавательные цели (идентификация и долгосрочный прогноз). Поэтому построение моделей в соответствии с новыми объективными методами самоорганизации делает возможным вместо допущений и грубых ошибок предложить модели, которые основываются на надежной информации и получены с помощью самоорганизации.
Постановка задачи
Задано множество исходных данных , где n – количество переменных, а M – количество точек наблюдения. Необходимо с помощью нечеткого МГУА (НМГУА) синтезировать уравнение регрессии
, адекватное исходному множеству данных, причем полученная модель должна быть наименьшей сложности.
В качестве экспериментальных данных для вычисления инфляционных процессов были взяты следующие макроэкономические показатели на период с января 1995 года по февраль 1997 года:
В результате выполнения работы необходимо построить адекватную модель, определяющую зависимость показателя ИПЦ от других макроэкономических показателей, которая имеет наименьшую сложность и используется для прогнозирования инфляционных процессов.
Основная идея метода группового учета аргументов
Метод группового учета аргументов (МГУА) базируется на задании правил усложнения модели, системе опорных функций, селекции и методах регуляризации по внешним критериям. ЭВМ проводит генерацию моделей-претендентов, селекцию в соответствии с внешними критериями и отсев моделей, которые не прошли селекцию. В связи с этим основную структуру алгоритмов самоорганизации можно привести в таком виде [1]:
Основная идея МГУА состоит в следующем [2]: утверждается, что для задачи однократного прогноза целесообразно снизить точность определения оценок коэффициентов уравнения регрессии, но за счет этого увеличить его регулярность. Поэтому нашей целью в этой задаче является не минимизация ошибок на уже известных узлах интерполяции, а минимизация ошибок на новых точках, которых в момент синтеза уравнения регрессии еще не существовало.
Рассмотрим полиномиальные алгоритмы МГУА [2,3]. Последовательность исходных данных делится на обучающую и проверочную. Как определено выше – М – количество узлов интерполяции; m – количество членов полного полинома регрессии. При решение можно получить только с помощью МГУА.
Пусть полное описание объекта задается некоторой зависимостью . Заменим это выражение несколькими рядами частичных описаний. Первый ряд селекции:
Второй ряд селекции:
Разнообразные алгоритмы МГУА различаются по виду функции . В нашем случае эта функция имеет следующий вид:
,
где – нечеткое число, которое задается парой
– центром и шириной интервала, которому принадлежит нечеткое число.
Из одного в другой ряд селекции с помощью пороговых отборов передается только некоторое количество самых регулярных или несмещенных переменных. Обычно это количество одинаково на всех радах селекции и равно F.
Правило остановки селекции: ряды селекции наращиваются до тех пор, пока критерий несмещенности решений уменьшается, такое количество называется свободой выбора. Для предотвращения индуцита необходимо остановить селекцию при достижении минимума.
Внешние критерии оптимальности
Реализация выборки делится на реализацию начальной выборки
, с помощью которой оцениваются параметры модели, о реализацию проверочной выборки
, с помощью которой осуществляется выбор подходящей модели. Критерий регулярности определяет среднеквадратичное отклонение модели на проверочной последовательности:
Если исходить из того, что при постоянном комплексе условий качественная аппроксимация в прошлом гарантирует качественную аппроксимацию в ближайшем будущем, то критерий регулярности можно рекомендовать для краткосрочного прогноза, потому что решение, полученное по новым реализациям дает только небольшое отклонение от исходных данных. При этом в процессе селекции можно потерять важные переменные, влияние которых будет учтено косвенно, через другие переменные.
Очень важным оказывается критерий несмещенности (непротиворечивости) модели. Довольно часто аналитики с большим опытом работы в предметной области даже не подозревают, что они оперируют, по сути, с противоречивой системой уравнений. В основе критерия непротиворечивости лежит довольно простой факт, что для одного объекта исследования по разным выборкам данных, полученных от него при прочих равных условиях, должны быть получены близкие модели, которые определяют поведение объекта.
Критерий можно записать следующим образом:
,
где – размеры первой и второй подвыборок данных соответственно;
– значения прогноза первой и второй модели относительно всех точек выборок. Критерий смещения обращается в нуль на истинной модели. Но бывают случаи, когда этот критерий принимает нулевое значение и на неистинных моделях. В этом случае выборку следует разбить на три, четыре и более подвыборок, пока не останется только одна несмещенная модель – она и будет истинной.
В данной работе для отсева моделей на итерации селекции использовался критерий, который представляет собой выпуклую комбинацию критерия непротиворечивости и критерия регулярности в следующем виде:
,
где – весовой коэффициент.
Построение частичной модели НМГУА
Для построения частичной модели НМГУА использовалась линейная интервальная регрессионная модель [4], которая задается следующим образом:
,
где – некоторые известные переменные,
– интервалы, которые можно задать треугольными нечеткими числами и записать следующим образом в виде центра
и ширины
:
.
Исходя из этого, Y можно рассчитать следующим образом:
Отношение вложенности двух интервалов и
(
) можно задать следующими неравенствами:
В нашем случае переменные связаны с переменными
и
для соответствующей частичной модели НМГУА таким образом:
Рассмотрим метод оценивания линейной интервальной регрессионной модели. Пусть имеется М наблюдений n+1 переменной, причем n из них – независимые величины, а (n+1)-ая зависит от остальных, и эту зависимость мы пытаемся определить. При этом
и
- исходные вектора точек наблюдения. Тогда оценочная линейная интервальная модель для частичной модели НМГУА:
Построение производится с учетом следующих требований:
Эти требования можно свести к задаче линейного программирования в следующем виде (для k-той точки наблюдения):
Исходя из этого, при известных значениях переменных и величины y, полученных в результате М измерений, мы приходим к задаче поиска коэффициентов модели (для всех точек наблюдения) в таком виде:
где k - номер измерения, данные из которого используются.
Задача состоит в том, чтобы минимизировать область изменения исходных значений Y за счет отыскания таких значений ширины интервалов искомых коэффициентов и таких значений центров интервалов
,
, которые обеспечивали бы минимальное рассеивание величины Y одновременно с выполнением условия, что измерянные значения искомой величины находятся в этом интервале. Эта задача является задачей линейного программирования. Для ее решения перейдем к двойственной задаче. Она запишется следующим образом:
Это задача линейного программирования. Решив двойственную задачу симпликс-методом и получив оптимальные значения двойственных переменных, мы сможем найти и оптимальные значения искомых переменных и
,
, а вместе с этим и определить искомую модель математической зависимости.
Описание ряда селекции
Чтобы получить модели второго ряда необходимо задать опорную функцию, аргументами которой являются функции-модели, полученные на предыдущем ряде.
В нашем случае опорная функция задавалась также полиномом второй (r-той) степени от двух переменных, то есть , где k – номер ряда.
На каждом ряде после генерации всех возможных моделей по комплексному критерию в плоскости критериев отбирались F лучших моделей, которые принимают участие в дальнейшей генерации. Критерием останова процесса генерации является близость среднего критерия моделей ряда на двух соседних рядах работы метода, то есть:
При генерации моделей может возникнуть явление индуцита, которое связано с тем, что после ряда итераций F моделей k-го ряда будут почти неразличимы между собой (станут колиниерными). Для борьбы с этим явлением вид опорной функции не изменяют, а вместо одного из аргументов берут модель предыдущего ряда, то есть .
Общее описание алгоритма