Постановка задачи оптимизации процесса распознавания

 

Прежде всего покажем, что с увеличением числа признаков, используемых при распознавании, вероятность правильного распознавания неизвестных объектов также увеличивается.

Вероятность получить однозначное решение по одному признаку xj, j=1, ..., N равна вероятности попадания соответствующей случайной величины на такие интервалы D1, где отлична от нуля только одна из функций fi(xj), i=l, 2, ..., m. Обозначим это событие ag, а соответствующую вероятность — Р(ag) и будем предполагать, что Р(ау)³e>0 при любом g.

Допустим, что все признаки независимы между собой. Тогда события а1, а2, ... также будут независимы. Вероятность получить однозначное решение при использовании v признаков

 

(9.1)

 

(уравнение (9.1) получено в соответствии с общей формулой для вероятности суммы любого числа совместных событий). При использовании (v+1)-гo признака

 

(9.2)

 

При любом v, вычитая из уравнения (9.2) уравнение (9.1), получим

 

(9.3)

 

Предположим, что так как существование равенства доказывало бы сделанное утверждение. Следовательно, при любом v, а ограниченная последовательность чисел является монотонно возрастающей и потому сходится. Так как для сходящейся последовательности чисел то в силу (9.3)

Постановка задачи оптимизации процесса распознавания требует введения в рассмотрение следующих понятий.

1. Пусть —множество, каждый элемент со которого — объект; произведена классификация объектов, в результате которой множество Q подразделено на классы

2. Каждый объект обладает определенной совокупностью признаков xj, j=l, ..., N.

3. Признаки объектов могут быть определены путем обработки измерительной информации, получаемой с помощью технических средств наблюдений Тb, 0 = 1, ..., r.

4. Для определения признаков распознаваемого объекта необходимо с помощью технических средств наблюдений провести множество экспериментов. Обозначим это множество А = {а}. Назначить проведение эксперимента а — значит указать, какой признак и с помощью какого средства необходимо определить.

5. Каждый эксперимент имеет определенный исход (определение факта либо наличия соответствующего признака у объекта, либо его отсутствия, определение числового значения признака и т. д.). Введем в рассмотрение множество возможных исходов экспериментов х= {ха} (здесь ха — общее обозначение исхода эксперимента а). Когда а есть эксперимент по проверке логического признака, то ха принимает одно из трех возможных значений: 0 или 1, или х, означающих соответственно либо отсутствие данного признака, либо его наличие, либо то, что при проведении эксперимента не удалось установить, присущ ли данный признак распознаваемому объекту. Если в результате эксперимента а определяется детерминированный или вероятностный признак, то ха принимает числовое значение.

6. На проведение экспериментов накладываются определенные ограничения, обусловленные рядом обстоятельств (например, оптические средства не могут быть использованы в дневное время суток; выход из строя того или другого технического средства или ограниченность его ресурса, время проведения очередного эксперимента или группы экспериментов не должно превышать заданной величины).

Таким образом, на множество А = {а} накладывается система последовательных ограничений Г, которая, будем считать, задана, если для каждой Г-допустимой цепочки исходов хa1, хa2,..., хak, т. е. цепочки определено множество экспериментов (k+1)-й стадии Ak+l(xa1, ..., хak), допустимых после цепочки исходов хa1, ..., хak экспериментов а1 ..., аk.

Совокупность экспериментов А с заданной системой ограничений Г обозначим АГ.

7. Информация, полученная при проведении очередного эксперимента, используется в алгоритме распознавания для решения о принадлежности объекта к одному из классов. Обозначим z—{zi} множество окончательных решений. Оно распадается на подмножества zi = {zki}, элементы которого z, означают, что после проведения k стадий экспериментов принято окончательное решение о принадлежности объекта w к Ωi-му классу.

8. Принятие окончательных решений сопряжено с определенным риском. Если проведены эксперименты а1 ..., аk, завершившиеся исходами x1,..., хk, и принято окончательное решение z,- , то будем полагать, что значение риска принять окончательное решение равно Ca[zki (xa1, ..., хаk)].

Введенные понятия позволяют сформулировать задачу построения оптимального плана проведения процесса распознавания: дана совокупность технических средств наблюдения Тb, 0=1, ..., r, обеспечивающих на основе проведения экспериментов А = {а} получение апостериорной информации о распознаваемом объекте со, что позволяет с помощью специальных алгоритмов определить его признаки xj,j= 1, ..., N. Проведение экспериментов, как и принятие окончательного решения о принадлежности объекта со какому-либо классу, по информации, полученной в результате этих экспериментов, сопряжено с определенными расходами Uw. Значение этих расходов Uw, усредненное по всем возможным цепочкам развития экспериментов, определяется последовательным правилом R, в соответствии с которым осуществляется планирование экспериментов, т. е. `Uw — `Uw (R). Каждое из последовательных правил R может строиться лишь с учетом ограничений Г, накладываемых на возможность проведения экспериментов. Ввиду того что заранее не известно, какой объект подвергается распознаванию, величина `Uw должна быть усреднена с помощью априорной вероятности появления объектов Р(Ωi).

Качество каждого алгоритма, определяющего последовательное правило R, в соответствии с которым реализуется процесс распознавания, может быть охарактеризовано функционалом, представляющим собой математическое ожидание от значения средних расходов:

 

(9.4)

 

' Требуется определить оптимальное правило ŘÎRГ , обеспечивающее минимум функционала (9.4), т. е. минимизацию математического ожидания расходов, связанных с реализацией процесса распознавания.