1.8. Синтез экстремальной модели (алгоритма) РО
Среди множества математических задач, возникающих на уровне моделей РО, следует выделить задачу синтеза математической модели (или алгоритма), оптимальной по качеству распознавания образов в данном классе моделей. Функциональное качество алгоритма РО может определяться различными способами. Обычно задается способ построения объектов каждого класса оценивания для алгоритма из данного класса моделей, а также, какую долю объектов он классифицирует правильно (то есть относительно к заданному классу). Полученная величина усредняется по классам и является функционалом качества РО. Задача состоит в том, чтобы для заданного класса моделей найти алгоритм (модель) с максимальным значением функционала качества (ФК).
1. Например, может быть задан следующий закон порождения классов
и
. Пусть описания
объектов S являются наборами числовых признаков
, где
,
. Пусть в n-мерном пространстве заданны два нормальных распределения с математическим ожиданием
,
и дисперсией
,
. Производится случайный выбор точек (описаний) и разыгрывается по заданным законам класс, в который они зачисляются. После этого объект S занесенный, например, в класс
, с вероятностью p причисляется к обучающей выборке и с вероятностью (1-p) – к контрольной, то же самое выполняется и с объектами из класса
. Пусть сформированы таким образом обучающие и контрольные выборки. В обучающую выборку зачислены объекты
и
, а в контрольную выборку –
и
.
В модели строится алгоритм А, который по описаниям
дает максимальное значение ФК
,где
- число объектов из контрольной выборки, правильно классифицированных алгоритмом А,
- общее число объектов в контрольной выборке.
Значение
есть случайная величина, а ее характеристики (например, моменты) дают представление о точности модели на определенном типе задач распознавания.
2. Более стандартным является подход, в котором при фиксированной начальной информации
и модели требуется найти алгоритм, позволяющий максимально точно классифицировать данную совокупность
,
контрольных объектов, принадлежность которых классам
известна.
Естественно, что информация типа
и
не вводится в алгоритм. В частности можно сформировать следующие классы синтеза экспериментальной модели (алгоритма) распознавания.
Пусть даны описания объектов
из класса
и
из класса
, где
. Строится R- модель, разбиение производится гиперплоскостью
Параметрами модели являются неизвестные коэффициенты
, решающее правило таково: если
, то
; если
, то
. Выписав эти условия для всех объектов
, мы получим систему линейных неравенств с неизвестными
:
Cистема (8) несовместна. Для синтеза искомого алгоритма требуется найти максимальную совместную подсистему в (8) Решив ее, получим искомые значения параметров
. Система (8) в общем случае несовместна, и нахождение максимальной совместной подсистемы даже для линейных систем требует разработки специальных методов.