4.7. Применение нечеткого МГУА в задачах прогнозирования. Экспериментальное исследование.

Описание проведенного эксперимента.

В данной работе была поставлена задача разработки программного продукта, реализующего нечеткий метод группового учета аргументов, при помощи которого осуществлялось прогнозирование макроэкономических показателей. При этом был получен прогноз значения ИПЦ по известным макроэкономическим показателям экономики Украины.

В качестве существенных переменных, влияющих на величину прогноза, по результатам регрессионного анализа были отобраны следующие:

В приложении 1 приведены результаты проведенных экспериментов. Рассмотрим их в порядке следования.

    1. Результаты структурной идентификации на окне прогнозирования размером в 15 точек, из которых 8 было выделено на обучающую и 7 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО: 0,453832.

    2. Результаты структурной идентификации на окне прогнозирования размером в 15 точек, из которых 8 было выделено на обучающую и 7 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 5 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО: 0,634184.

    3. Результаты структурной идентификации на окне прогнозирования размером в 15 точек, из которых 10 было выделено на обучающую и 5 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО: 0,2988849.

    4. Результаты структурной идентификации на окне прогнозирования размером в 15 точек, из которых 10 было выделено на обучающую и 5 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО: 0,7119462.

    5. Результаты структурной идентификации на окне прогнозирования размером в 17 точек, из которых 10 было выделено на обучающую и 7 - на проверочную выборку. Последние 6 точек, представленные на графике, спрогнозированы в пошаговом режиме без адаптации коэффициентов модели. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО (на выборке, состоящей из обучающих и спрогнозированных точек): 0,5023905.

    6. Результаты структурной идентификации на окне прогнозирования размером в 12 точек, из которых 7 было выделено на обучающую и 5 - на проверочную выборку. Последние 3 точки, представленные на графике, спрогнозированы в пошаговом режиме без адаптации коэффициентов модели. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО (на выборке, состоящей из обучающих и спрогнозированных точек): 0,249623.

    7. Результаты структурной идентификации на окне прогнозирования размером в 12 точек, из которых 7 было выделено на обучающую и 5 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

       

      Величина СКО: 0,116168.

    8. Результаты структурной идентификации на окне прогнозирования размером в 12 точек, из которых 7 было выделено на обучающую и 5 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО: 0,7151176.

    9. Результаты структурной идентификации на окне прогнозирования размером в 12 точек, из которых 7 было выделено на обучающую и 5 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО: 0,78367866.

    10. Результаты структурной идентификации на окне прогнозирования размером в 15 точек, из которых 10 было выделено на обучающую и 5 - на проверочную выборку. При идентификации на следующий этап синтеза передавалось 10 лучших моделей текущего этапа.

      Используемое частичное описание:

      Величина СКО: 0,23924261.

       

    11. Прогноз 10 точек при помощи модели, синтезируемой единственный раз, без пошаговой адаптации коэффициентов.

      Частичное описание, используемое при синтезе прогнозирующей модели:

      Величина СКО на спрогнозированных точках: 0,990959.

    12. Прогноз тех же 10 точек, что и в пункте 11, при помощи пошаговой адаптации коэффициентов прогнозирующей модели (адаптация использовалась в случае выхода реального значения прогнозируемой переменной за спрогнозированную полосу).

      Частичное описание, используемое при синтезе прогнозирующей модели:

      Величина СКО на спрогнозированных точках: 0,813633824.

    13. Прогноз 11 точек при помощи пошаговой адаптации коэффициентов прогнозирующей модели (адаптация использовалась в случае выхода реального значения прогнозируемой переменной за спрогнозированную полосу).

      Частичное описание, используемое при синтезе прогнозирующей модели:

      Величина СКО на спрогнозированных точках: 0,88312.

    14. Прогноз тех же 11 точек, что и в пункте 13, при помощи модели, синтезируемой единственный раз, без пошаговой адаптации коэффициентов.

Частичное описание, используемое при синтезе прогнозирующей модели:

Величина СКО на спрогнозированных точках: 1,16648.

Анализ полученных результатов.

Как видно из приведенных графиков (приложение 1), идентификация структуры модели при помощи нечеткого МГУА приводит к хорошим результатам: даже для моделей, использующих линейные частичные описания, СКО не превышает значения 0.72, для описаний вида

СКО не превышает значения 0,3.

Наилучшие результаты структурной идентификации и прогнозирования получены при окне прогнозирования размером в 12 точек (т.е. при размерах окна, полученных при помощи регрессионного анализа) при использовании квадратичных частичных описаний и максимально возможной в данной программной реализации свободе выбора (на каждом этапе синтеза отбиралось 10 наилучших моделей). Это свидетельствует о необходимости применения регрессионного анализа статистических данных в задачах прогнозирования с целью определения периода, в течение которого зависимость между входными переменными и прогнозируемой величиной остается неизменной, а также для отбора наиболее существенных переменных, влияющих на прогнозируемую величину, а также о необходимости организации как можно более широкой свободы выбора для алгоритма поиска модели оптимальной сложности, т.к. большая свобода выбора приводит к лучшим результатам (с другой стороны, некоторые ограничения свободы выбора все-таки необходимы из тех соображений, что перебор огромного числа частичных описаний займет немало времени).

Долгосрочные прогнозы величины ИПЦ, полученные в результате эксперимента, описанного выше, имеют достаточно неплохое качество (как для моделей с пошаговой адаптацией коэффициентов, так и без нее), что свидетельствует о возможности успешного применения моделей, полученных при помощи нечеткого МГУА, в задачах долгосрочного прогнозирования макроэкономических показателей для экономик переходного периода. Особый интерес представляло сравнение результатов прогноза адаптируемых и неадаптируемых моделей - в обоих случаях качество прогноза при помощи моделей с адаптируемыми коэффициентами оказалось несколько выше:

При прогнозе 10 точек (с 09.1998 по 06.1999) СКО неадаптируемой и адаптируемой моделей составило 0,99096 и 0,813634, соответственно.

При прогнозе 11 точек (с 02.1998 по 12.1998) - 1,16648 и 0,88312.

 

Полученные результаты свидетельствуют о возможности успешного применения подобного подхода в задачах прогнозирования, поскольку процедура адаптации решает проблему корректировки параметров модели в соответствии с вновь поступающими данными и при этом позволяет избежать большого объема вычислений, повторяющихся всякий раз при появлении новой точки обучающей последовательности. Следует, однако, отметить, что в условиях экономики переходного периода зависимость между входными и выходными параметрами модели может существенно изменяться на незначительном отрезке времени, и адаптация коэффициентов существующей модели может не дать желаемого эффекта, поскольку модель, используемая для прогнозирования, может потерять актуальность, и необходим синтез новой модели, более достоверно описывающей новую функциональную зависимость. Поэтому для получения более высокого качества прогноза необходимо определить некоторый баланс между адаптацией коэффициентов существующей модели и синтезом новой модели, которая более качественно опишет функциональную зависимость между входными и выходными параметрами. В частности, существенные (в несколько раз) различия между актуальным и спрогнозированным значением прогнозируемой величины свидетельствуют, скорее, о необходимости синтеза новой модели, т.к. существующая уже не отражает сущности процесса, и адаптация коэффициентов вряд ли поможет.

 

Результаты структурной идентификации

Пример 1.

Предсказанное значение

Точное значение

Отклонение

Квадрат отклонения

0,9

1,604352604

2,308705208

0,9

0,704352604

0,49611259

0,9

1,683372527

2,466745053

0,9

0,783372527

0,613672516

0,399332556

0,899666278

1,4

1,4

0,500333722

0,250333834

-0,140998471

0,579500764

1,3

1,3

0,720499236

0,519119149

0,2

0,200492314

0,200984627

0,2

4,92314E-04

2,42373E-07

0,031525546

0,115762773

0,2

0,2

0,084237227

0,00709591

0,158173714

0,729086857

1,3

1,3

0,570913143

0,325941817

0

0,175240715

0,35048143

0

0,175240715

0,030709308

-0,560506011

-0,343878538

-0,127251064

0

0,343878538

0,118252449

-0,372243786

-0,155616313

0,06101116

-0,9

0,744383687

0,554107073

0,190289693

0,406917167

0,62354464

0,2

0,206917167

0,042814714

3,232674495

3,449301968

3,665929441

3,8

0,350698032

0,12298911

6,000232601

6,216860075

6,433487548

6,2

0,016860075

2,84262E-04

2,697337584

2,913965057

3,130592531

3

0,086034943

0,007402011

3,108348306

3,324975779

3,541603253

3,3

0,024975779

6,23790E-04

СКО :

0,453832478

Размер скользящего окна: 15 точек

Размер обучающей выборки: 8 точек

Размер проверочной выборки: 7 точек

Частичное описание, используемое при синтезе моделей:

Пример 2.

Предсказанное значение

Точное значение

Отклонение

Квадрат отклонения

0,9

1,132601887

1,365203774

0,9

0,232601887

0,054103638

1,096395704

1,248197852

1,4

1,4

0,151802148

0,023043892

0,519241748

0,909620874

1,3

1,3

0,390379126

0,152395862

0,121243588

0,160621794

0,2

0,2

0,039378206

0,001550643

-0,626198626

-0,213099313

0,2

0,2

0,413099313

0,170651042

0,96998599

1,134992995

1,3

1,3

0,165007005

0,027227312

0

0,49568051

0,991361021

0

0,49568051

0,245699168

-0,767647454

-0,383823727

0

0

0,383823727

0,147320654

-0,9

-0,344436821

0,211126358

-0,9

0,555563179

0,308650446

0,2

0,488081674

0,776163349

0,2

0,288081674

0,082991051

3,636494065

3,718247032

3,8

3,8

0,081752968

0,006683548

5,793113219

6,23755004

6,681986861

6,2

0,03755004

0,001410005

2,29037948

2,734816301

3,179253122

3

0,265183699

0,070322394

3,061104165

3,505540986

3,949977807

3,3

0,205540986

0,042247097

1,130971084

1,575407905

2,019844726

1,5

0,075407905

0,005686352

СКО :

0,298884939

Размер скользящего окна: 15 точек

Размер обучающей выборки: 10 точек

Размер проверочной выборки: 5 точек

Частичное описание, используемое при синтезе моделей:

Пример 3.

Предсказанное значение

Точное значение

Отклонение

Квадрат отклонения

0,2

0,327077336

0,454154672

0,2

0,127077336

0,016148649

0,2

0,675265528

1,150531056

0,2

0,475265528

0,225877322

-0,851086198

0,224456901

1,3

1,3

1,075543099

1,156792958

0

0,163480365

0,326960729

0

0,163480365

0,02672583

-1,235403558

-0,617701779

0

0

0,617701779

0,381555488

-0,9

-0,161799073

0,576401853

-0,9

0,738200927

0,544940608

0,2

0,824575383

1,449150767

0,2

0,624575383

0,39009441

0,818261

2,3091305

3,8

3,8

1,4908695

2,222691865

5,450485327

6,250485327

7,050485327

6,2

0,050485327

0,002548768

2,761812569

3,479704697

4,197596824

3

0,479704697

0,230116596

1,849615509

2,574807755

3,3

3,3

0,725192245

0,525903793

1,438327597

1,826953058

2,215578519

1,5

0,326953058

0,106898302

1,388998157

1,767353057

2,145707958

1

0,767353057

0,588830715

1,454532824

1,843509488

2,232486152

1

0,843509488

0,711508256

1,247893386

1,612701458

1,97750953

2,3

0,687298542

0,472379286

СКО :

0,711946292

Размер скользящего окна: 15 точек

Размер обучающей выборки: 10 точек

Размер проверочной выборки: 5 точек

Частичное описание, используемое при синтезе моделей:

Пример 4.

Предсказанное значение

Точное значение

Отклонение

Квадрат отклонения

-0,53722196

-0,098627941

0,339966077

0

0,098627941

0,009727471

0,829243012

1,267837031

1,70643105

1,2

0,067837031

0,004601863

0,751614352

1,19020837

1,628802389

0,9

0,29020837

0,084220898

0,605627406

1,044221425

1,482815444

0,9

0,144221425

0,020799819

0,540008112

0,97860213

1,417196149

1,4

0,42139787

0,177576164

0,177188037

0,738594019

1,3

1,3

0,561405981

0,315176676

-0,007019976

0,431574042

0,870168061

0,2

0,231574042

0,053626537

-0,554785551

-0,116191533

0,322402486

0,2

0,316191533

0,099977085

0,847198903

1,285792922

1,724386941

1,3

0,014207078

0,000201841

-0,23758945

0,201004569

0,639598587

0

0,201004569

0,040402837

-0,151796964

0,286797055

0,725391073

0

0,286797055

0,082252551

-1,352722255

-0,914128236

-0,475534218

-0,9

0,014128236

0,000199607

-0,030902591

0,407691428

0,846285446

0,2

0,207691428

0,043135729

3,396947499

3,835541518

4,274135536

3,8

0,035541518

0,001263199

5,722489177

6,161083196

6,599677214

6,2

0,038916804

0,001514518

СКО :

0,249623289

Размер скользящего окна: 12 точек

Размер обучающей выборки: 7 точек

Размер проверочной выборки: 5 точек

Последние 3 точки спрогнозированы

Частичное описание, используемое при синтезе моделей:

Пример 5.

Предсказанное значение

Точное значение

Отклонение

Квадрат отклонения

0,741907027

0,820953513

0,9

0,9

0,079046487

0,006248347

1,4

1,530499329

1,660998657

1,4

0,130499329

0,017030075

0,852220261

1,07611013

1,3

1,3

0,22388987

0,050126674

0,2

0,276785899

0,353571799

0,2

0,076785899

0,005896074

0,2

0,284920755

0,36984151

0,2

0,084920755

0,007211535

1,104810941

1,202405471

1,3

1,3

0,097594529

0,009524692

0

0,135304494

0,270608989

0

0,135304494

0,018307306

-0,879510732

-0,103400602

0,672709528

0

0,103400602

0,010691684

-1,76330477

-0,987194639

-0,211084509

-0,9

0,087194639

0,007602905

-0,406016651

0,370093479

1,14620361

0,2

0,170093479

0,028931792

3,007468704

3,783578834

4,559688965

3,8

0,016421166

0,000269655

5,433833205

6,209943335

6,986053466

6,2

0,009943335

9,88699E-05

СКО :

0,116167841

Размер скользящего окна: 12 точек

Размер обучающей выборки: 7 точек

Размер проверочной выборки: 5 точек

Частичное описание, используемое при синтезе моделей:

Пример 6.

Предсказанное значение

Точное значение

Отклонение

Квадрат отклонения

3,96

4,4

4,84

6,2

1,8

3,24

2,36

2,8

3,24

3

0,2

0,04

2,51

2,95

3,39

3,3

0,35

0,1225

1,61

2,05

2,49

1,5

0,55

0,3025

1,36

1,8

2,24

1

0,8

0,64

1,36

1,8

2,24

1

0,8

0,64

2,01

2,45

2,89

2,3

0,15

0,0225

2,06

2,5

2,94

2,4

0,1

0,01

0,91

1,35

1,79

0,1

1,25

1,5625

-1,24

-0,8

-0,36

-1

0,2

0,04

СКО :

0,813633824

Прогноз 10 точек был получен путем прогнозирования следующей точки при помощи модели с адаптируемыми на каждом шаге коэффициентами

Размер скользящего окна: 12 точек

Размер обучающей выборки: 7 точек

Размер проверочной выборки: 5 точек

Частичное описание, используемое при синтезе моделей:

Количество описаний, передаваемых на следующий этап синтеза : 10

Пример 7.

Предсказанное значение

Точное значение

Отклонение

Квадрат отклонения

0,447247747

1,376050257

2,304852767

0,2

1,176050257

1,383094207

0,35431648

1,297410503

2,240504527

1,3

0,002589497

6,70549E-06

-0,82637542

0,102427091

1,031229601

0

0,102427091

0,010491309

-0,774994098

0,150991763

1,076977625

0

0,150991763

0,022798513

-1,023589667

-0,094787157

0,834015353

-0,9

0,805212843

0,648367723

-0,665987341

0,260363951

1,186715244

0,2

0,060363951

0,003643807

1,197507568

2,12504098

3,052574392

3,8

1,67495902

2,805487719

3,6

4,4

5,2

6,2

1,8

3,24

2

2,8

3,6

3

0,2

0,04

2,15

2,95

3,75

3,3

0,35

0,1225

1,25

2,05

2,85

1,5

0,55

0,3025

СКО :

0,883118955

Прогноз 11 точек был получен путем прогнозирования следующей точки при помощи модели с адаптируемыми на каждом шаге коэффициентами

Размер скользящего окна: 12 точек

Размер обучающей выборки: 7 точек

Размер проверочной выборки: 5 точек

Частичное описание, используемое при синтезе моделей:

Количество описаний, передаваемых на следующий этап синтеза : 10