Задачи принятия статистических решений при обработке экспериментальных данных

Конечной целью обработки экспериментальных данных являются некоторые выводы о состоянии или свойствах исследуемого процесса или объекта. Например, это могут быть выводы о законах распределения случайных величин или параметрах законов распределения, о справедливости каких-либо гипотез и, наконец, выводы о наличии и особенностях взаимосвязей различных показателей, характеризующих свойства объекта. В любом случае из множества возможных выводов необходимо выбрать один, оптимальный в каком-либо смысле. Иначе говоря, необходимо принять решение.

Решением называется некоторое заключение, вывод об исследуемом объекте или его свойствах.

Обработка данных всегда осуществляется в условиях неопределённости, обусловленной неполнотой информации об исследуемом объекте, помехами как естественного, так и искусственного характера. В связи с этим принимаемые решения являются статистическими.

Статистическим решением называется некоторое заключение (вывод) об исследуемом объекте или его свойствах, полученное в результате обработки экспериментальных данных.

Основой для принятия решения являетсярешающее правило (решающая функция), которое служит для выбора из множества возможных решений одного предпочтительного.

Пусть {E} - множество возможных состояний исследуемого объекта; {X<n>} – множество возможных результатов наблюдений, а – множество возможных решений.

Функция

,

отображающая множество {X<n>} результатов наблюдений в множество решений , называется решающим правилом (решающей функцией).

Существует много решающих правил, но из этих правил выбирается такое, которое обеспечивает принятие решения требуемого качества, т.е. решения в определённом смысле оптимального.

В связи с этим возникает задача определения оптимального решающего правила. Выбор такого правила определяется рядом факторов:

а) требованиями, которые предъявляются к качеству решения;

б) свойствами экспериментальных данных;

в) условиями, в которых получены данные;

г) дополнительной априорной информацией, которая может быть использована при принятии решения.

Требования к качеству решения определяются потребителем решения (см. рис.1.1) и могут быть сформированы в виде требований минимизации:

- потерь, которые может понести потребитель при неправильном решении;

- риска, связанного с принятием неправильного решения;

- вероятности принятия неправильного решения.

Потерями называются отрицательные последствия, сопровождающие реализацию принятого решения.

Риск – это возможность некоторых потерь со стороны потребителя.

Условия, в которых получены данные, можно разделить на две группы: условия пассивного эксперимента и условия активного эксперимента. В первом случае планирование экспериментальных работ с целью получения данных с необходимыми свойствами отсутствует. Во втором случае эксперимент организуется так, чтобы полученные результаты обладали требуемыми свойствами.

Наиболее важными свойствами совокупности экспериментальных данных, существенно влияющими на качество решающей функции являются объём выборки и её представительность, статистическая устойчивость, однородность, отсутствие аномальных результатов.

Влияние данных свойств на качество решения и вид решающей функции рассмотрено в последующих разделах.

Наиболее важными свойствами априорной информации, оказывающими влияние на формирование решающей функции, являются объём данной информации и её достоверность. Так, в идеальном случае априорная информация I1 (см. рис.1.1) позволяет получить ряд распределения вероятностей состояний исследуемого объекта, наиболее полной формой информации I4 является закон распределения вектора результатов наблюдений.

Описание свойств решений может осуществляться с различных позиций. Чаще всего для этого применяется функция потерь.

Пусть множество решений является дискретным и состоит из l альтернативных решений , . Такими же свойствами пусть обладает и множество {E} состояний объекта, мощность этого множества обозначим через m.

Функцией потерь называется функция p(Ei; ), , , характеризующая последствия принятия решения при условии, что объект находится в состоянии Ei:

p(Ei; ) = pij. (2.3.1)

Функция (2.3.1) записывается в виде матрицы потерь

.

Следует заметить, что для определённого состояния Ei исследуемого объекта величина потерь в общем случае будет величиной случайной. В дальнейшем будем полагать, что информация I6 (рис.1.1) представляет собой сведения о функции потерь (2.3.1).

Учитывая изложенное выше, под объёмом априорной информации будем понимать число видов информации, используемой при формировании решающего правила, а под качеством априорной информации – степень её соответствия объективным свойствам исследуемого объекта.

Оптимальным решающим правилом называется правило, обеспечивающее выполнение требований, предъявляемых к качеству решения в конкретных условиях применения данного правила.

Под условиями принятия решения понимается совокупность перечисленных выше факторов, определяющих выбор правила решения. Обозначим вектор условий, в которых применяется решающее правило RI(X), символом K<4>. Компонентами данного вектора являются объём KX1 и качество KX2 результатов наблюдений, объём KI1 и качество KI2 априорной информации:

K<4> = (KХ1, KХ2, KI1, KI2)т.

С учётом этого решающее правило можно представить в виде функции двух переменных – результатов наблюдений и априорной информации, т.е.

RI(X) = R(X <n>; I),

а качество (оптимальность) данного правила применительно к условиям K<4> охарактеризовать показателем

L = f(R; K<4>),

представляющим собой эффект, который достигается в результате использования решающего правила R в условиях K<4>. Конкретное выражение показателя L при решении различных задач обработки может быть различным. Поэтому оптимальным решающим правилом R0 для некоторой совокупности условий обработки K<4>j, , целесообразно считать правило, обеспечивающее экстремум показателя L в условиях K<4>j:

,

где {R} – множество решающих правил.

На практике подбор оптимального решающего правила для некоторых условий обработки выполняется на основе принципов принятия решений. В настоящее время сформулирован ряд таких принципов, основными из которых являются принцип максимального правдоподобия и принцип минимальной вероятности ошибки.

Рассмотрим их более подробно.