1.6. Модели и методы распознавания образов на основе статистической теории принятия решений.
Пусть имеем K классов:
- вероятность того, что Х принадлежит k-му классу (условная плотность изображения).
- априорная вероятность
Х – наблюдаемое изображение (объекты)
Наблюдаем; необходимо определить принадлежность его к какому-то классу. Для этого вычисляется
(1)
(1) – функция правдоподобия.
, если(2)
(на основе принципа максимума правдоподобия)
Недостаток: неизвестны, известен лишь класс законов распределения вероятности (семейство законов с различными параметрами).
Пусть- риск, связанный с ошибочной классификацией объектов распознавания, принадлежащих классу(т.е. ситуация, когда объект изошибочно отнесли к другому классу). Обозначим вероятность ошибки.
Средний риск распознавания
Средняя ошибка распознавания k-го класса определяется следующим образом
(3)
Необходимо найти решающее правило, при котором.
Для одномерного закона распределения (Х - скаляр)
Из условиянаходим значение величины. Далее:
.
Если, то граница будет определяться с учетом весов.
:, если.
Пусть, тогдаопределяется из выражения:
.
Если попадаем в эту точку, то отказ от принятия решения.
Этот подход широко применялся в 70-е годы для распознавания радиолокационных сигналов.
Область применения теории статистических решений при распознавании образов ограничена тем, что ее методы предполагают известными условные плотности вероятности. При решении практических задач точное численное значение этих вероятностей получить очень сложно. Однако принципиально всегда можно получить приближенное значение плотности распределения вероятностей, определив относительную частоту, с которой появляется каждое изображение. На практике ограничиваются конечным и сравнительно малым числом изображений, по которым оцениваются неизвестные распределения.
Согласно теории статистических решений, обучение можно рассматривать как нахождение или приблизительную оценку плотностей распределения вероятностей в пространстве описаний.
В процессе распознавания оцениваются и сопоставляются полученные условные плотности вероятностей каждого образа для той точки векторного пространства, которая соответствует исследуемому изображению. При обучении предполагается, что изображения обучающей последовательности достаточно полно представляют рассматриваемые образы. Это предположение позволяет допустить, что плотности вероятностей, построенные по обучающей последовательности, близки к истинным.
Существенным ограничением методов теории статистических решений является сложность их практической реализации. Если плотности вероятностей не удается представить аналитически, то, даже если они известны, необходимо хранить в памяти их значения для каждой точки n-мерного пространства. Объем требуемой памяти при этом так велик, что построение распознающих машин, основанных на вычислении коэффициента подобия, практически невозможно. Поэтому часто предполагается, что характер распределений известен (например, нормальные распределения), но неизвестны его параметры (например, математическое ожидание, дисперсия), то есть законы распределения задаются с точностью до параметров. В этом случае задача обучения существенно упрощается и состоит лишь ив определении неизвестных параметров. Часто стремятся сформулировать такие правила, которые были бы просты в реализации, но по надежности приближались к методу, основанному на статистических решениях, т.е. к методу коэффициентов подобия.
Решения, полученные согласно байесовскому правилу при определенном правиле аппроксимации плотности вероятности, совпадают с решениями, полученными на основании сравнения эвклидовых расстояний между изображениями в преобразованном пространстве.