Решение логических задач распознавания

 

В логических системах распознавания классы и признаки объектов рассматриваются как логические переменные. Чтобы подчеркнуть эту особенность, для обозначения классов и признаков введем специальные обозначения.

Пусть множество объектов подразделено на классы Ω1 ..., Ωm, а для описания объектов используются признаки А1 ..., Аn.

Предположим, что все сведения априорного характера о классах объектов, выражающие, с одной стороны, связь между высказываниями Ω1, ..., Ωm и А1, ..., Аn, с другой стороны, зависимости только между признаками А1, ..., Аn или только между классами Ω1, ..., Ωm, представлены в форме булевых соотношений:

 

(6.31)

 

Предположим также, что наряду с (6.31) в результате проведения экспериментов установлены некоторые данные, касающиеся части признаков Ах1 ..., Аn, присущих объектам классов Ω1, ..., Ωm, и что эти данные выражены как булева функция G(A1 ...,Аn)=1.

Прямая задача распознавания состоит в том, чтобы определить, какие выводы можно сделать относительно классов Ω1, ..., Ωm на основе общих сведений априорного характера (6.31) и апостериорной информации G(A1..., Аn), т. е. требуется определить неизвестную функцию F(Ω1, ..., Ωm), удовлетворяющую уравнению

 

 

(6.32)

 

при ограничениях (6.31).

Задача, сопряженная с данной, заключается в том, чтобы установить, какие совокупности признаков А1 ..., Аn должны иметь место, если известны некоторые сведения о классах (Ω1, ..., Ωm, т. е. требуется определить неизвестную функцию G1(A1, ..., Аn), удовлетворяющую уравнению

 

(6.33)

 

при заданной функции F1 (Ω1, ..., Ωm) и связях (6.31).

Положим, в соотношениях (6.32) и (6.33) F(Ω1, ..., Ωm) =F1(Ω1, ..., Ωm). Тогда, если G1(A1 ..., An)=G(A1 ..., Аn), перемножив левые части (6.32) и (6.33), получим G×F+`G×`F=l или

 

(6.34)

 

иначе говоря, посылки G(A1 ..., Аn) [или F1 (Ω1, ..., Ωm)] и следствия F(Ω1, ..., Ωm) [или G11, ..., Аn)] эквивалентны.

Другая задача — обратная задача распознавания — заключается в том, чтобы определить множество априори неизвестных посылок G(A1 ..., Аn), из которых следуют некоторые данные выводы F((Ω1, ..., Ωm) при условии, что признаки А1, ..., Аn и классы (Ω1, ..., Ωm связаны зависимостями (6.31).

Покажем, что решение этой задачи приводится к решению предыдущей задачи. Пусть F(Ω1, ..., Ωm) есть заданная функция, имшшканты которой требуется найти в виде функции G(A1 ..., Аn). Перейдем от функции F(Ω1, ..., Ωm) к ее отрицанию F1 =`F(Ω1, ..., Ωm) и с помощью (6.33) определим функцию G1(A1 ..., Аn), связанную с `F((Ω1, ..., Ωm) зависимостью `F(Ω1, ..., Ωm)®G1(A1 ..., Аn). Так как эта зависимость эквивалентна соотношению

 

(6.35)

 

то G(A1 ..., An) = `G1(A1 ..., Аn) и является искомой функцией.

Если наряду с (6.35) справедливо соотношение F((Ω1, ..., Ωm®-G(A1 ..., Аn), то F(Ω1, ..., Ωm) = G(A1 ..., Аn), т. е. G(A1 ..., Аn) представляет собой полный набор импликант функции F(Ω1, ..., Ωm), через сумму которых эта функция может быть выражена.

Методы решения прямой и обратной задач распознавания основываются на построении сокращенного базиса bс1 ..., Аn(Ω1, ..., Ωm], определяемого следующим образом. Соотношения (6.31) накладывают определенные ограничения на возможные комбинации значений истинности элементов Аи ..., А„; Qb ..., Qm, так что не все столбцы полного базиса b[А1, ..., Аn; (Ω1, ..., Ωm] совместны с этими соотношениями. Если отбросить столбцы базиса b[А1... Аn; (Ω1, ..., Ωm], противоречащие хотя бы одному из соотношений (6.31), то оставшиеся столбцы, по определению, образуют сокращенный в соответствии с данными связями базис. Сокращенный базис устанавливает соответствие между колонками базиса bс1 ..., Аn] и базиса bc[(Ω1, ..., Ωm] и определяет тем самым возможные преобразования соотношений (6.31) к такому виду, для которого рассматриваемые задачи решаются либо в рамках уравнений (6.32) или (6.35), либо (6.34).

Рассмотрим конкретный пример.

Предположим, что при некоторых условиях, характеризуемых признаками А1 А2, А3, в системе могут протекать процессы Ω1,2, Ω3, причем связи между Ω1,2, Ω3 и А1 А2 А3 представлены соотношениями

 

(6.36)

 

Изображающие числа булевых функций, представленных соотношениями (6.36), относительно базиса b[А1 А2, А3; Ω1,2, Ω3] соответственно равны 0101 0000 0000 0101 1010 0000 0000 1010 0101 0000 0000 0101 1010 0000 0000 1010 и 1001 1100 1001 1100 1001 1100 1001 1100 0110 0011 0110 0011 0110 0011 0110 0011.

Перемножив эти два изображающих числа, получим 0001 0000 0000 0100 1000 0000 0000 1000 0100 0000 0000 0001 0010 0000 0000 0010. Следовательно, соотношения (6.36) удовлетворяются только при таких комбинациях значений истинности элементов А1, А2, А3, Ω1,2, Ω3, которые соответствуют 3, 13, 16, 28, 33, 47, 50 и 62-му столбцам базиса b[А1 А2, А3; Ω1,2, Ω3]. Сохраняя перечисленные колонки и отбрасывая остальные, получим следующий сокращенный базис:

 

(6.37)

 

Разобьем базис (6.37) на два базиса: bс1 А2, А3] и bc[Ω1,2, Ω3]. Тогда сокращенный базис bc[Ω1,2, Ω3] будет совпадать с полным стандартным базисом b[Ω1,2, Ω3 ] и bс1 А2, А3] будет представлять собой полный нестандартный базис для элементов А1, А2, А3. Пусть i и j обозначают порядковые номера столбцов стандартных базисов b[Ω1,2, Ω3 ] и b[А1, А2, А3], соответственно.

Базис (6.37) устанавливает следующее взаимно однозначное соответствие между значениями i и j:

 

(6.38)

 

или при другом порядке расположения чисел:

 

(6.39)

 

Из (6.38) следует, что изображающие числа #Al,2 и #А3 относительно базиса b[Ω1,2, Ω3] запишутся как

 

(6.40)

 

а перестановочная матрица ||Rij|| будет иметь вид

 

(6.41)

 

Аналогично (6.39) показывает, что в базисе b[А1 А2, А3]

 

(6.42)

 

а матрица ||Rij|| перехода от переменных Ω1,2, Ω3 к переменным А1, А2, А3 получается как транспонированная по отношению к матрице (6.41). Полученный результат означает, что исходные связи (6.36) полностью эквивалентны либо соотношениям (6.40), либо соотношениям (6.42).

Предположим, что протекающие в рассматриваемой системе процессы проявляют себя через совокупности признаков А1, А2, А3, причем сведения о признаках Aj можно представить в виде булевой функции G(A1, A2, А3), например

 

(6.43)

 

Какие выводы можно сделать относительно процессов Ω1,2, Ω3 на основании информации (6.43) и соотношений (6.36)? По (6.26)

 

 

и, следовательно,

 

(6.44)

 

т. е. либо протекает только один процесс Ω3, либо можно утверждать, что процесс Ω1 протекает, а относительно процессов Ω2 и Ω3 ничего сказать нельзя, либо, наконец, имеет место Ω1,2, Ω3. При таком не очень определенном выводе может потребоваться узнать, какие признаки из числа признаков А1, А2, А3 должны быть обнаружены дополнительно, чтобы убедиться, что в системе протекает только процесс Ω1 т. е. F(Ω1,2, Ω3) = Ω1,×`Ω2,×`Ω3. В соответствии с (6.22)

 

 

откуда

 

(6.45)

 

т. е. в группе наблюдений, где было установлено A1×`A2 требуется дополнительно обнаружить наличие признака A3. утверждения (6.44) и (6.45) имеют смысл необходимых и достаточных условий, когда посылки и следствия полностью эквивалентны.

 

Глава 7 ЛОГИЧЕСКИЕ СИСТЕМЫ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ

 

Для решения задач распознавания объектов или явлений на практике приходится прибегать к пострению систем распознавания (см. гл. 1). При практическом построении систем распознавания необходимо использовать большие массивы данных о признаках объектов. Общее число классов объектов и признаков, на языке которых они описываются, может доходить до нескольких сотен. Построение логических систем распознавания объектов, содержащих большое число классов и признаков, и оценка их эффективности связаны со значительными трудностями.

В данной главе рассматривается идея использования сокращенного базиса применительно к логическим системам распознавания с большим числом элементов. Показаны особенности построения алгоритмов решения логических задач, возникающих при построении систем распознавания и реализации этих алгоритмов на ЭВМ.