рефераты конспекты курсовые дипломные лекции шпоры

Раздел Философия
/
Сравнительная оценка признаков

Реферат Курсовая Конспект

Выберите учебное заведение

Сравнительная оценка признаков

Сравнительная оценка признаков - раздел Философия, ОБЩАЯ ХАРАКТЕРИСТИКА ПРОБЛЕМЫ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ Выше Были Рассмотрены Достаточно Общие Методы Выбора Совокупн...

Выше были рассмотрены достаточно общие методы выбора совокупности признаков, которые целесообразно и доступно использовать при построении системы распознавания. Однако на практике достаточно часто возникает более простая задача, состоящая в проведении сравнительной оценки качества признаков. Остановимся на некоторых методах решения этой задачи. При этом будем полагать, что качество признака х_l выше, чем качество признака х_s, l, s=l, ..., N, если в соответствии с выбранным критерием сравнительной оценки показатель качества признака xi больше или меньше (в зависимости от метода сравнения) показателя качества признака х_s.

Сравнение апостериорных вероятностей. Пусть задан алфавит классов Ω_i, i=l, ..., m, выбран априорный словарь признаков x_j, _j=1, ..., N_a, известны условные плотности распределений f_i(х_j) и априорные вероятности Р(Ω_i). Требуется произвести сравнительную оценку признаков х_l и х_s, l, s= 1, ..., N_a, иначе — определить, какой из этих признаков обладает лучшими разделительными свойствами. Разделим диапазон изменения признака х, на интервалы D¹_i(x_l); D²_i(x_l); ...; D^m_i(x_l), на которых отличны от нуля соответственно одна функция f_i(х_l); две функции f_i(х_l), ..., m функций f_i(х_l).

То же проделаем и с признаком x_s, т. е. определим интервалы D¹_i(x_s); D²_i(x_s)...; D^m_i(x_s). Вероятность получить однозначное решение равна

(5.37)

Вероятность получить двузначное решение вида «класс g, или класс q», g, q=1, ..., m, равна

(5.38)

где D²_i — совокупность интервалов, на которых отличны от нуля какие-либо две функции из набора f_i(х_l).

Вероятность получить m-значное решение вида «класс 1, или класс 2, ..., или класс m» равна

(5.39)

где D^m_i(x_l) — совокупность интервалов, на которых отличны от нуля все т функций f_i(х_l)., i=l, 2, ..., m.

Обозначив математическое ожидание случайной величины x, которая может принимать значения x=1, 2, ..., m с вероятностями Р_x, определим указанное математическое ожидание для первого и второго признаков, т. е. M_xl(x) и M_xs(x). Если M_xl(x)>M_xs ⁽^x⁾(x), то признак х_s обладает лучшими разделительными свойствами, если Mx_s(x)>M_lx(x), то признак x_l обладает лучшими разделительными свойствами. Будем полагать, что в первом случае выше качество признака х_s, а во втором случае — признака х_l.

Сравнение вероятностных характеристик признаков. Сравнительная оценка качества признаков может быть произведена и в случае, когда условные плотности распределений f_i(х_j) неизвестны, однако известны первые и вторые моменты этих распределений, т. е. m_ji и D_ji. Оценка, основанная на использовании этих данных, возможна в связи с тем, что признаки Xj могут быть условно подразделены на две группы.

К первой группе относятся признаки, значения которых незначительно изменяются при переходе от одного объекта данного класса к другому объекту и весьма заметно изменяются при переходе от объекта одного класса к объектам других классов.

Ко второй группе относятся признаки, значения которых чувствительны к переходам от одного объекта данного класса к другому объекту и лишь незначительно изменяются при переходах от объектов одного класса к объектам других классов.

Признаки, относящиеся к первой группе, полезней признаков, относящихся ко второй группе. Количественная оценка качества признаков x_j, j=1, 2, ..., N, может быть произведена следующим образом.

Пусть некоторый механизм вырабатывает значения j-го признака с вероятностями, равными априорным вероятностям Р(Ω_i), i=1, ..., m. Определим математическое ожидание некоторой фиктивной случайной величины, принимающей значения m_ji с вероятностями Р(Ω_i), т. е.

(5.40)

а также математическое ожидание дисперсии j-го признака по классам:

(5.41)

Если M[D_li]<M[D_si], l, s=1, ..., N_a то при прочих равных условиях качество признака x_t выше, чем качество признака х_l так как вдоль оси признака x_s объекты располагаются компактней, чем вдоль оси признака х_s.

Дисперсия математического ожидания распределений признаков при переходе от класса к классу Если `D_li>`D_si то при прочих равных условиях качество признака x_l выше, чем качество признака х_s так как вдоль оси признака х_l объекты, относящиеся к разным классам, располагаются на удалениях больших, чем вдоль оси признака x_s. Геометрическая интерпретация сказанного прослеживается при рассмотрении рис. 5.2, а, б.

В качестве критерия сравнительной оценки признаков целесообразно использовать величину

Будем полагать, что если К_l<К_s, то качество признака х_l выше, чем качество признака х_s при этом наилучший признак тот, который реализует

Информационный подход. Сравнительная оценка качества признаков x_l и x_s, l, s=1, ..., N_a может быть произведена также на основе определения количества информации, которое получает система в процессе распознавания объектов в результате определения каждого из этих признаков.

Пусть распознаваемый объект может принадлежать лишь одному из т классов, априорные вероятности отнесения этого объекта к определенному классу обозначим Р(Ω_i) i,j=1, 2, ..., m, а условные плотности распределения значений признаков —f_j(x_l), f_j(x_s).

До проведения экспериментов исходная априорная неопределенность состояния системы, или ее энтропия,

(5.42)

Рис. 5.2

Здесь логарифм может быть взят при любом основании а> 1. На практике удобнее пользоваться логарифмами при основании 2 и выражать энтропию в битах.

Определим, какое количество информации получает система распознавания при измерении признака x_l.

Если признак x_l принимает дискретные значения с вероятностями то полная условная энтропия системы распознавания при измерении всех возможных значений признака x_l

(5.43)

Если признак х_l — непрерывный и его совместная плотность распределения— условная плотность распределения признака x_l в Ω_i-м классе), то значение полной условной энтропии системы после измерения признака x_l

(5.44)

где G — полная область изменения признака x_l по всем классам; G_i — область изменения признака x_l в Ω_i-м классе.

Таким образом, если проведены эксперименты, связанные с определением признака x_h и рассчитаны апостериорные вероятности отнесения объекта к соответствующим классам, то количество информации, которое получает система распознавания в результате проведения этих экспериментов, составит: _;если признак дискретный, то

(5.45)

если признак непрерывный, то

(5.46)

Аналогичные выражения могут быть получены и для признака х_s. При этом будем полагать, что качество признака х_l выше, чем качество признака х_s в случае, если количество информации, связанное с определением признака x_l больше, чем количество информации, связанное с определением признака х_s т. е. J_xl> J_xs. При этом имеем в виду следующее. Информативность признаков не является постоянной величиной и не представляет собой безусловной величины, а наоборот, в общем случае количество информации, получаемое системой распознавания в результате измерения каждого данного признака, зависит от того, какие признаки были определены ранее и какие значения они приняли. Это в равной мере относится как к статистически зависимым, так и к статистически независимым признакам.

Пусть задан словарь признаков В общем случае

(5.47)

Применительно к статистически зависимым признакам, т. е. когда утверждение, содержащееся в (5.47), обсуждалось в публикациях по проблеме распознавания. В то же время применительно к статистически независимым признакам, т. е. когда этот вопрос либо вообще не обсуждался, либо трактовался ошибочно.

В [19] приведены результаты подробного исследования проблемы информативности признаков в системах распознавания. Показано, что статистическая независимость признаков распознаваемых объектов не является условием ни необходимым, ни достаточным для того, чтобы информативность признаков была величиной, не зависящей от того, какие признаки были определены на предыдущих шагах и какие при этом значения они приняли. Этот вопрос имеет не только теоретическое, но и практическое значение, так как если бы информативность признаков была величиной постоянной, то тогда не представляло бы затруднений решить задачи: 1) минимизации описаний классов объектов на основе априорного определения группы наиболее информативных признаков, определяемых с помощью соотношений (5.45) и (5.46); 2) построения оптимального маршрута распознавания на основе априорного ранжирования признаков в соответствии с их информативностью. *

*Даже оставляя в стороне принципиальный вопрос о ресурсах, затрачиваемых на разработку аппаратуры, необходимой для определения тех или других признаков (задача 1), а также связанных с проведением экспериментов по определению признаков распознаваемых объектов (задача 2), легко заметить, что с учетом сказанного эти задачи подобным образом не могут быть решены.

При построении систем распознавания целесообразно априорно оценивать информативность каждого признака (в предположении, что он определен первым). Такая процедура позволяет, по крайней мере предварительно, определять, какие из признаков априорного словаря целесообразно исключить из дальнейшего рассмотрения. Окончательное решение, связанное с построением рабочего словаря признаков, может быть принято на основе общего подхода к проблеме (см. § 5.1 — 5.4).

Далее (см. гл. 9) будет подробно рассмотрен вопрос о глобальном оптимальном планировании процесса распознавания. Здесь же обсудим возможность использования для локальной оптимизации процесса распознавания информационного подхода.

Пусть оценена информативность всех признаков рабочего словаря, а также известна стоимость C(x_j), j=l, ..., N_p, определения признаков. На первой стадии экспериментов определяется такой признак из рабочего словаря (например, х_k), который доставляет экстремальное значение функции L(x_j)=J(x_j)/C(x_j), т. е.

(5.48)

где J(x_j) — количество информации, вносимое в систему распознавания измерением признака x_j, усредненное по всему множеству его возможных значений.

Признак х_k и надлежит измерить на первой стадии экспериментов. Далее в зависимости от того, какое конкретное значение принял признак х_k=х*_k, определяется такой признак, например x_h который в среднем по всему множеству его значений доставляет экстремум функции т. е.

(5.49)

Аналогично определяются третья и последующие стадии экспериментов. При этом на каждом шаге целесообразно проверять, не превзойден ли заданный уровень вероятности отнесения неизвестного объекта к какому-либо классу. Если это произошло, то целесообразно дальнейшее проведение экспериментов прекратить.

§ 5.6. Построение рабочего словаря признаков при отсутствии априорного словаря признаков

Выше были рассмотрены методы определения признакового пространства при ограничениях на стоимость его реализации и методы сравнительной оценки признаков, возможность применения которых связана с наличием априорного словаря признаков. Однако в практике построения систем распознавания приходится сталкиваться с ситуациями, когда априорный словарь признаков неизвестен, а дана лишь некоторая совокупность реализаций сигналов, характеризующих явления или процессы, для распознавания которых предназначена разрабатываемая система. К таким сигналам могут быть отнесены, например, сигналы звуковые, возникающие в процессе работы некоторых технических устройств, радиолокационные или световые, отраженные от каких-либо объектов, электрические, возникающие при электрокардиографических или энцефалографических исследованиях, и т. д. В подобных ситуациях возникает следующая задача: на основе совокупности сигналов, характеризующих каждый класс объектов или явлений, определить и упорядочить признаки, приписывая больший вес признаку, несущему больше информации при различении объектов или явлений.

Решение этой задачи на основе разложения Карунена — Лоэва состоит в следующем [17]. Пусть множество объектов или явлений подразделено на классы Ω_i, получена совокупность реализаций сигналов x_i(t) на интервале 0£t^0£T, характеризующая классы, известна априорная вероятность появления объектов Р(Ω_i), i=1, ..., m, и сигналы х_i(t) представляют собой случайные функции. Положим, что функции обладают разложением

(5.50)

где V_ik — случайные коэффициенты, математическое ожидание которых M(V_ik) = 0; {j_k(t)}—множество детерминированных ортонормированных координатных функций на интервале (0, Т). Корреляционная функция случайных процессов, описывающих классы Ω_i, i=l, ..., m,

(5.51)

Подставив (5.50) в (5.51), получим

(5.52)

Пусть случайные коэффициенты V_ik удовлетворяют условиям

(5.53)

Тогда (5.53) приобретает вид

(5.54)

или

(5.55)

Если можно поменять местами суммирование и интегрирование, то (5.55) запишется так:

(5.56)

Разложение (5.50), в котором функции j_k(t) определяются согласно (5.55) или (5.56) через корреляционную функцию K(t, t'), называется обобщенным разложением Карунена — Лоэва.

Искомое признаковое пространство (координатная система) образуется в результате решения интегрального уравнения Фред-гольма второго рода (5.56), ядро которого — корреляционная функция K(t, /') случайных процессов х,(0, описывающих классы Ω_i, i = l, ..., m, на интервале наблюдения [0, T] относительно координатных функций j_k(t), k=l, 2, ... .

При упорядочении координатных функций j_k(t) в порядке убывания соответствующих им собственных значений s²_k коэффициенты разложения случайных процессов V_ik обладают также в порядке убывания наилучшими разделительными качествами, т. е. вносят в систему большее количество информации. Это означает следующее. Пусть координатным функциям j_r(t) и j_l(t) соответствуют значения дисперсий s²_r и s²_l и при этом s²_r > s²_l, k, r, 1=1,2, ... . Тогда признак х_r обладает лучшими разделительными свойствами, чем признак х_l. Использование признака х_r вносит в систему распознавания больше информации, чем использование признака х_l. Заметим, что s²_k представляют собой дисперсию математического ожидания распределений найденных признаков (k= 1, 2, ...) при переходе от класса к классу (см. § 5.5).

Построение признакового пространства системы распознавания на основе коэффициентов разложения Карунена — Лоэва обеспечивает минимизацию начальной энтропии системы, определяемой величиной Р(Ω_i) i = 1,..., m. При этом среднеквадратичная ошибка, возникающая за счет того, что реальное признаковое пространство системы реализуется на основе конечного числа признаков, минимальна.

Рис. 5.3

Рис. 5.4

Пример*. Пусть дана совокупность реализаций сигналов, принадлежащих классам Ω₁ и Ω₂. Будем полагать, что сигналы описывают эргодические случайные стационарные процессы. Выполнено усреднение по множеству реализаций, относящихся к каждому классу, и построены корреляционные функции К_Ω1 (t) и К_Ω2 (t). Последние будем рассматривать в качестве описаний классов (рис. 5.3).

*Пример разработан Л. И. Калиновым.

Корреляционные функции К_Ω1 (t) и К_Ω2 (t) представим в виде набора числовых значений, относящихся к дискретным моментам времени, а затем применительно к К_Ω1 (t) и К_Ω2 (t) выполним обобщенное разложение Карунена — Лоэва. В результате найдем, что суммарное значение дисперсии при этом два члена разложения (20-й и 44-й) обеспечивают значение дисперсий s²₂₀ + s²₄₄ =0,83, что составляет 97,7% от суммарного значения дисперсии. Это дает основание признаковое пространство проектируемой системы распознавания строить с использованием только двух признаков, которые обозначим x₁ и х₂. При этом оценки математических ожиданий и дисперсий признаков по классам Ω₁ и Ω₂ соответственно равны:

На рис. 5.4, а, б показаны гистограммы, представляющие собой описания классов на языке признаков x₁ и х₂. Из рисунков видно, что признак х₁ обладает лучшими разделительными свойствами, чем признак х₂ (действительно, s²₁»0,8, в то время как D²₂»0,03).

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

ОБЩАЯ ХАРАКТЕРИСТИКА ПРОБЛЕМЫ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ

В А Скрипкин... Методы распознавания... ОБЩАЯ ХАРАКТЕРИСТИКА ПРОБЛЕМЫ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Сравнительная оценка признаков

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Качественное описание задачи распознавания i
Распознавание образов (объектов, сигналов, ситуаций, явлений или процессов) — едва ли не самая распространенная задача, которую человеку приходится решать практически ежесекундно от первого до посл

Основные задачи построения систем распознавания
Рассмотренный в § 1.1 пример свидетельствует о том, что распознавание сложных объектов и явлений требует создания специальных систем распознавания — сложных динамических систем, сос

Экспертные системы распознавания
Рассмотренная классификация систем распознавания и принципы их функционирования отражают современное состояние вопроса. Все виды систем распознавания базируются на строго формализов

Содержательная трактовка проблемы распознавания
Процесс распознавания состоит в том, что система распознавания на основании сопоставления апостериорной информации относительно каждого поступившего на вход системы объекта или явле

Постановка задачи распознавания
Пусть задано множество объектов или явлений Ω={w1 ..., ..., wz}, а также множество возможных решений L={l1, ..., lk}, которые могут

Метод решения задачи распознавания
Рассмотренная постановка проблемы распознавания позволяет определить последовательность задач, возникающих при разработке системы распознавания, предложить их формулировки и возможн

Системы распознавания без обучения
Построение систем распознавания без обучения возможно при наличии полной первоначальной априорной информации, которая представляет собой совокупность: 1) сведений о том, какова есте

Обучающиеся системы распознавания
Использование методов обучения для построения систем распознавания необходимо в случае, когда отсутствует полная первоначальная априорная информация. Ее объем позволяет подразделить

Самообучающиеся системы распознавания
На практике иногда приходится сталкиваться с необходимостью построения распознающих устройств в условиях, когда провести классификацию объектов либо невозможно, либо по тем или другим соображениям

Некоторые сведения из теории статистических решений
Рассмотрим основные результаты теории статистических решений на следующем примере. Пусть совокупность объектов подразделена на классы Ω1 и Ω2, а дл

Критерий Байеса
Критерий Байеса — правило, в соответствии с которым стратегия решений выбирается таким образом, чтобы обеспечить минимум среднего риска. Применение критерия Байеса целесообразно в с

Минимаксный критерий
При построении систем распознавания возможны такие ситуации, когда априорные вероятности появления объектов соответствующих классов неизвестны. Минимизировать значение среднего риск

Критерий Неймана—Пирсона
При построении некоторых систем распознавания могут быть неизвестны не только априорные вероятности появления объектов соответствующих классов, но и платежная матрица (1.7). В подоб

Процедура последовательных решений
Ранее предполагалось, что решение о принадлежности распознаваемого объекта w соответствующему классу Ωi, i=l, ..., m, принимается после измерения всей совокупности

Регуляризация задачи распознавания
В соответствии со стратегией Байеса, если у распознаваемого объекта со измеренное значение признака х = х0 , то

Рабочего словаря признаков
В § 5.1 был рассмотрен один из возможных методов выбора пространства признаков системы распознавания, обеспечивающий в пределах выделенных ресурсов максимальное значение критерия ка

Изображающие числа и базис
Булева функция считается заданной, если можно указать значения истинности этой функции при всех возможных комбинациях значений истинности входящих в нее элементов. Таблицу, которая

Восстановление булевой функции по изображающему числу
Рассмотрим методы, позволяющие переходить от задания булевой функции в виде изображающего числа к явному выражению ее через элементы. Дизъюнктивная нормальная форма (ДНФ).

Зависимость и независимость высказываний
Условия независимости. Поскольку каждая булева функция может иметь два значения истинности, n булевых функций могут образовывать 2n комбинаций значений истинности. По опр

Булевы уравнения
Решение многих задач, связанных с распознаванием объектов, может быть сведено к нахождению решений булевых алгебраических уравнений с одним (или более) неизвестным. Примером булева

Замена переменных
Понятие замены переменных в алгебре логики аналогично понятию замены переменных в обычной алгебре. Если А, В, С, ... — элементарные высказывания и совершается замена переменных, то,

Решение логических задач распознавания
В логических системах распознавания классы и признаки объектов рассматриваются как логические переменные. Чтобы подчеркнуть эту особенность, для обозначения классов и признаков введ

Решение задач распознавания при большом числе элементов
Приложение изложенных в предыдущих параграфах методов построения сокращенного базиса и решения логических задач существенно ограничивается объемом памяти ЭВМ и их быстродействием. Т

Алгоритм построения сокращенного базиса
В § 7.1 было показано, как с помощью ЭВМ, опираясь на сокращенный базис b´ [А1, А2, ...Ω1, Ω2,...], находить

Распознавание объектов в условиях их маскировки
Маскировка — один из основных методов снижения эффективности разведки противника в общем комплексе мероприятий по противодействию. Решение проблемы маскировки требует привлечения, с

Распознавание в условиях противодействия
Рассмотрим задачу распознавания объектов в условиях, когда противник может препятствовать как выявлению отдельных признаков объектов, так и сознательно изменять свою тактику в отнош

Алгоритмы распознавания, основанные на вычислении оценок
Логические алгоритмы распознавания, рассмотренные выше, в ряде случаев не позволяют получить однозначное решение о принадлежности распознаваемого объекта к определенному классу. Ю.

Общая характеристика структурных методов распознавания
Во многих случаях апостериорная информация о распознаваемых объектах или явлениях содержится в записях соответствующих сигналов (электрокардиограмм, энцефалограмм, отраженных от цел

Основные элементы аппарата структурных методов распознавания
Говоря о средстве описания объектов в терминах непроизводных элементов и их отношений, употребляют понятие язык. Правила этого языка, определяющие способы построения объекта из непр

Реализация процесса распознавания на основе структурных методов
Для распознавания неизвестного объекта на основе структурных методов необходимо прежде всего найти его непроизводные элементы и отношения между ними, а затем с помощью синтаксическо

Постановка задачи оптимизации процесса распознавания
Прежде всего покажем, что с увеличением числа признаков, используемых при распознавании, вероятность правильного распознавания неизвестных объектов также увеличивается. Вер

Алгоритм управления процессом распознавания
Рассмотренные понятия позволяют построить алгоритм управления процессом распознавания в виде правила последовательного поиска решений, обеспечивающего разработку оптимального плана

Частные подходы к принятию решений при распознавании
Решение задачи оптимизации распознавания в рассмотренной постановке требует наличия определенных данных. Когда они отсутствуют, приходится пользоваться частными подходами к пр

Алгебраический подход к задаче распознавания
Выше рассмотрены алгоритмы распознавания: детерминированные алгоритмы, основанные на проведении в признаковом пространстве решающей границы (границы, разделяющей классы и представля

Эффективность вероятностных систем распознавания
Чтобы оценить эффективность вероятностных систем распознавания на основе математического моделирования, можно использовать метод статистических испытаний. Для проведения таких испыт

Эффективность логических систем распознавания
При построении логических систем распознавания приходится сталкиваться с ситуацией, когда значения истинности элементов А1..., Аn, выражающих признаки объектов