ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

ПРЕДМЕТ: Анализ экспериментальных данных – значений количественного признака (артериальное давление, пульс). Такой признак – случайная величина.

 

ЗАДАЧА: изучить законы распределения исследуемых случайных величин,

их характеристики, проверить ряд гипотез, установить, есть ли между величинами связь.

БАЗОВЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ – ВСЕ МНОЖЕСТВО ОБЪЕКТОВ, ОБЛАДАЮЩИХ ДАННЫМ ПРИЗНАКОМ. ВЫБОРКА – ЧАСТЬ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

ЭЛЕМЕНТЫ ВЫБОРКИ – значения изучаемого признака у входящих в выборку объектов. ОБЪЕМ ВЫБОРКИ N – число элементов в ней. ВАРИАНТЫ – отличающиеся друг от друга, различные элементы выборки.

Чтобы по выборке можно было судить о генеральной совокупности, выборка должна быть РЕПРЕЗЕНТАТИВНОЙ.РЕПРЕЗЕНТАТИВНОЙ называется выборка,

верно отражающая основные закономерности генеральной совокупности.

Условия репрезентативности:случайный отбор достаточно большой объем

ПРОСТОЙ СТАТИСТИЧЕСКИЙ РЯД

· РАНЖИРОВАННЫЙ РЯД

· ВАРИАЦИОННЫЙ РЯД

· ИНТЕРВАЛЬНЫЙ РЯД

ПРОСТОЙ СТАТИСТИЧЕСКИЙ РЯД – ПЕРЕЧИСЛЕНИЕ ЭЛЕМЕНТОВ ВЫБОРКИ В ПОРЯДКЕ ИХ ПОЛУЧЕНИЯ.

РАНЖИРОВАННЫЙ

РЯД – ПЕРЕЧИСЛЕНИЕ ЭЛЕМЕНТОВ ВЫБОРКИ В ПОРЯДКЕ ИХ ВОЗРАСТАНИЯ (ИЛИ УБЫВАНИЯ).

При этом каждое значение повторяется столько раз, сколько оно встречается в выборке.

Число появлений данного значения, т.е. варианты, в выборке называется частотой этой варианты, n.

Отношение частоты к объему выборки называется

Относительной частотой варианты, W = n / N.

ВАРИАЦИОННЫЙ РЯД – ПЕРЕЧИСЛЕНИЕ ВАРИАНТ В ПОРЯДКЕ ИХ ВОЗРАСТАНИЯ (ИЛИ УБЫВАНИЯ) С УКАЗАНИЕМ СООТВЕТСТВУЮЩИХ ЧАСТОТ ИЛИ ОТНОСИТЕЛЬНЫХ ЧАСТОТ.

ТАБЛИЦА ВАРИАЦИОННОГО РЯДА

x1 < x2 <... < xk

N1 + n2 + ... + nk = N

N1 + n2 + ... + nk = N

• На оси абсцисс - значения xi ,

на оси ординат - частоты ni или относительные частоты Wi.

• Точки с координатами (xi, ni) соединяются отрезками прямых.

Полученная ломаная – полигон.


ЕСЛИ ОБЪЕМ ВЫБОРКИ ВЕЛИК, ВАРИАЦИОННЫЙ РЯД ПРЕОБРАЗУЮТ ИНТЕРВАЛЬНЫЙ. В этом случае не перечисляют все варианты, а разбивают вариационный ряд на несколько интервалов и указывают число значений в каждом из них.

  1. Определение mразумного числа интервалов:

m = log2N, округляем до целого числа.

2. Размах распределения:

L = xmax - xmin.

Шаг разбиения, или ширина интервала:

h = ∆x = L / m =

xmax - xmin

 

m

 


Границы интервалов: получаются добавлением шага

к предыдущей границе. Граница может входить только в один интер-

вал, предыдущий или последующий.

[ - граница включа-ется в данный интервал;

( - граница не вклю-чается в интервал.


Подсчет частоты n - числа значений, попавших в данный интервал,

и относительной частоты

W = n / N.

 

Графическое изображение интервального ряда –

ГИСТОГРАММА:фигура, состоящая из прямоугольников.

Основание каждого прямоугольника - соответствующий интервал, высота равна частоте или относительной частоте.


Пример.

У 12 больных гриппом, прошедших предварительно вакцинацию,

замерили температуру в первые сутки болезни.

Получены значения – простой статистический ряд:

37,5; 39,0; 38,1; 38,4; 37,9; 38,4; 38,4; 38,1; 38,6; 38,4; 38,6; 38,4.

Ранжированный ряд:

37,5; 37,9; 38,1; 38,1; 38,4; 38,4; 38,4; 38,4; 38,4; 38,6; 38,6; 39,0.

Интервальный ряд

L = 39,0 - 37,5 = 1,5; Δx = 1,5 / 3 = 0,5. Определяем границы первого интервала:

S

 

Чтобы «исправить» ,выборочные дисперсию ,и среднеквадратическое отклонение, нужноввести поправочный коэффициент:

N

s2 = σ2в

N-1

 

Таким образом,

Σ (xi - x )2 ni

s2 =

N – 1

Σ (ck - xи)2 nk

s2и =

N – 1

Далее s = √s2

 

Обратите внимание:точечные оценки –приблизительные

И cлучайные(так как выборка сделана из генеральной совокупности случайным образом, то ее элементы и параметры можно считатm случайными величинами)

 

Дать ИНТЕРВАЛЬНУЮ ОЦЕНКУ того или иного параметра генеральной совокупности значит указать случайный интервал, который с заданной

 

Вероятностью γ (гамма) содержит данный параметр.

Этот интервал называется ДОВЕРИТЕЛЬНЫМ,а γ

ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТЬЮ,или НАДЕЖНОСТЬЮ.

 

Наряду с доверительной вероятностью используют также понятие

УРОВЕНЬ ЗНАЧИМОСТИ

т.е. вероятность того, что доверительный интервал НЕ содержит в себе оцениваемый параметр. Имеет вид ( х – Δ , х + Δ).

То есть γ = 0,95.

Точность Δ рассчитывается по формуле:


ts

Δ =

N

Среднюю выборочную и

Стандартное отклонение

Находим по выборке.

 

T определяется

по надежности с помощью известной формулы теории вероятности:

Ф (t) – 1. Отсюда

2Ф (t) = 1+ γ

 

1+ γ

Ф (t) 2


Зная Ф (t), по таблицам нормального распределения находим t.

Так, если γ = 0,95, то

Ф (t) = 0,975

И t ≈ 2.

Если объем выборки невелик, то вместо

Таблицы нормального распределения нужно воспользоваться

Таблицей

РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА. Значение t в таблице этого распределения находят по заданным N и γ.

Алгоритм Вычислить x и s. По заданной γ рассчитать Ф (t). По значению Ф (t) в таблице найти значение t. Рассчитать точность…   Итак, известны γ (и t)

А найти надо N.

Пользуемся формулой:

Ts

Δ =

N

Отсюда

Ts

√ N =

Δ

И

t2s2

N =

Δ2

Округлить до ближайшего большего целого!