Качество оценивания функций распределения

По определению функция распределения случайной величины есть вероятность случайного события:

.

Пусть в качестве её оценки используется частота статистического аналога xi < x события < x в серии n испытаний:

. (4.3.4)

Поскольку (4.3.4) является оценкой вероятности случайного события < x, то её качество должно исследоваться методами, рассмотренными в § 3.3.

Если объём выборки достаточно велик, то закон распределения оценки функции может быть аппроксимирован нормальным законом аналогично (3.3.4):

(4.3.5)

С учётом (4.3.5) по аналогии с формулами (3.3.5) – (3.3.7) получим

(4.3.6)

; (4.3.7)

. (4.3.8)

При исследовании качества оценки возникает проблема, связанная с незнанием истинной функции распределения . При большом объёме выборки эта функция заменяется её оценкой и формулы (4.3.6) – (4.3.8) приобретают вид:

(4.3.9)

; (4.3.10)

. (4.3.11)

Из соотношений (4.3.6) – (4.3.11) видно, что все показатели качества оценивания функции распределения зависят от её аргумента x. Так, при фиксированных доверительной вероятности b = const и объёме выборки n = const доверительные границы для будут функциями:

.

П р и м е р 4.4. Пусть признак массива экспериментальных данных распределён нормально, т.е.

.

По результатам ста наблюдений (n = 100) построена статистическая функция распределения

.

Требуется построить для функции распределения 95-процентный доверительный интервал (b = 0,95).

▼ По формулам (4.3.7) и (4.3.8) получим

;

.

На рис.4.6 изображена доверительная область для функции , границы которой даны пунктиром. График функции – сплошная линия. ▲

Рис.4.6. Доверительная область функции распределения (к примеру 4.4)

4.3.5. Потребный объём экспериментальных данных

Поскольку является оценкой вероятности случайного события < x, то объём n выборки, потребный для оценивания функции распределения с необходимыми точностью e и надёжностью b, определяется выражением, аналогичным (3.3.8):

. (4.3.12)

Как видно из рис.4.6, доверительная область для зависит от x и имеет наибольшую ширину при . Это означает, что наибольшее число наблюдений потребуется для оценивания значения (см. табл.3.1). Согласно формуле (4.3.12) и табл.3.1. при x ® ¥ потребное число n экспериментальных точек снижается, однако при этом уменьшается правомерность предположения о нормальном распределении оценки . Поэтому при оценивании функции распределения объём выборки берётся максимальным, обеспечивающим требуемые точность и надёжность оценки при всех x Î {x}. Указанный объём определяется соотношением

. (4.3.13)