Оценка неизвестных параметров.

В качестве оценки плотности вероятностей для непрерывной случайной величины Х) или функции вероятностей (для дискретной величины) используют сгруппированный вариационный ряд, интервальный - в первом случае и дискретный - во втором.

Вариационным рядом называют расположенные в возрастающем порядке значение признака. Если ряд сгруппирован, то эти значения указывают вместе с соответствующими частотами m или w = m/n, n- объем выборки.

В случае дискреного ряда х - значение признака

Значение признака х	x₁	x₂	...	x_i	...	x_l
Частота m	m₁	m₂	...	m_i	...	m_l

При построении интервального ряда весь диапазон изменения признака R = xmax-xmin, где соответственно максимальное и минимальное значения признакаХ, разбивают на l интервалов (нижняя и верхняя границы i-го интервала обозначаются соответственно ai и bi, i=1,2,...l). В качестве значения признака для i-го интервала рассматривается его середина xi= 1/2 (ai + bi):

Интервал значений признака (a_i; b_i)	(a₁; b₁)	(a₂; b₂)	...	(a_i; b_i)	...	(a_l; b_l)
Середина интервала x_i	x₁	x₂	...	x_i	...	x_l
Частота m_i	m₁	m₂	...	m_i	...	m_l

Соответствующие эмпирическим частотам m_i теоретические частоты определяются по формуле: m_i^T = np_i , где n - объем выборки, p_i - вероятность попадания непрерывной случайной величины Х в i-тый интервал или вероятность i-го значения признака для дискретной величины.

Накопленная частота i-го интервала m_Hi равна сумме частоты mi и частот всех предшествующих интервалов. Например, m_H₃ = m₃ +(m₁+m₂).

Оценкой вероятность pi попадания случайной величины Х в i-тый интервал является частость W_i=m_i/n, а оценкой функции распределения F(x_i) при X=x_i - накопленная частость W_Hi - m_Hi/n. Однако, так как частости W_i и W_Hi пропорциональны частотам mi и m_Hi, то удобнее сопоставлять не частости с вероятностями p_i и F(x_i), а эмпирические частоты m_i и m_Hi с теоретическими m_i^T = np_i и m_Hi^T = nF(x_i).