Оценка неизвестных параметров.

В качестве оценки плотности вероятностей для непрерывной случайной величины Х) или функции вероятностей (для дискретной величины) используют сгруппированный вариационный ряд, интервальный - в первом случае и дискретный - во втором.

Вариационным рядом называют расположенные в возрастающем порядке значение признака. Если ряд сгруппирован, то эти значения указывают вместе с соответствующими частотами m или w = m/n, n- объем выборки.

В случае дискреного ряда х - значение признака

Значение признака х x1 x2 ... xi ... xl
Частота m m1 m2 ... mi ... ml

При построении интервального ряда весь диапазон изменения признака R = xmax-xmin, где соответственно максимальное и минимальное значения признакаХ, разбивают на l интервалов (нижняя и верхняя границы i-го интервала обозначаются соответственно ai и bi, i=1,2,...l). В качестве значения признака для i-го интервала рассматривается его середина xi= 1/2 (ai + bi):

Интервал значений признака (ai; bi) (a1; b1) (a2; b2) ... (ai; bi) ... (al; bl)
Середина интервала xi x1 x2 ... xi ... xl
Частота mi m1 m2 ... mi ... ml

Соответствующие эмпирическим частотам mi теоретические частоты определяются по формуле: miT = npi , где n - объем выборки, pi - вероятность попадания непрерывной случайной величины Х в i-тый интервал или вероятность i-го значения признака для дискретной величины.

Накопленная частота i-го интервала mHi равна сумме частоты mi и частот всех предшествующих интервалов. Например, mH3 = m3 +(m1+m2).

Оценкой вероятность pi попадания случайной величины Х в i-тый интервал является частость Wi=mi/n, а оценкой функции распределения F(xi) при X=xi - накопленная частость WHi - mHi/n. Однако, так как частости Wi и WHi пропорциональны частотам mi и mHi, то удобнее сопоставлять не частости с вероятностями pi и F(xi), а эмпирические частоты mi и mHi с теоретическими miT = npi и mHiT = nF(xi).