Элементы математической статистики

Опорный конспект

15.1. Основные понятия математической статистики. О: Выборка -совокуп­ность значений СВ , полученных в результате независимых экспериментов. О: Статистический ряд: ,, ,,-относитель­ная частота, -частота появления . О: Статистический ряд по интервалам -число значений СВ , попавших в . Графическое изображение О: Эмпирическая функция распределения: 15.2. Определение неизвестных параметров распределения О: Для выборки среднее арифметическое ,дисперсия; для статистического ряда: ,; , -числовые характеристики СВ с выборкой , . О: Доверительный интервал , - точность оценки параметра в функции распределения СВ , -коэффициент доверия. Для нормального распределения с параметрами при . Для двумерной СВ с выборкой выборочный коэффициент корреляции .

Основные понятия математической статистики
Построение эмпирических законов распределения

Математическая статистика – наука о методах обработки экспериментальных данных, полученных при изучении закономерностей в случайных массовых явлениях. Способ статистической обработки, равно как и ценность её результатов полностью зависит от положенной в основу вероятностной модели, которая должна объяснить вероятностную структуру наблюдений.

Пусть произведено независимых экспериментов и получено значений , ,…, случайной величины .

О: Генеральной совокупностью называется множество всех возможных значений случайной величины . Выборкой объёма называется совокупность значений , полученных в результате независимых экспериментов.

По исследованию выборки необходимо сделать правильный вывод о СВ . Например, по толщине покрытия 100 деталей из серии необходимо сделать вывод о качестве покрытия деталей. В этом случае классическую вероятность заменяют статистической.

О: Статистическим рядом называется таблица, в которой записываются в упорядоченном по возрастанию виде различные элементы выборки , , и относительные частоты ( - частота появления ):

, . (15.1)

При большом числе измерений анализ такого материала затруднителен. Поэтому поступают следующим образом.

Составляется статистический ряд по интервалам или вариационный ряд. Весь интервал полученных значений величины разбивается на интервалы , ,…, , подсчитываются относительные частоты , где - число значений величины , попавших в , и строится таблица:

(15.2 )

Графическими изображениями статистических рядов являются полигон и гистограмма.

Полигон состоит из отрезков, соединяющих точки , , где в случае ряда по интервалам - срединное значение интервала (рис. 15.1)

 

             
Рис 15.1.   Рис. 15.2.

Гистограмма служит для изображения интервального статистического ряда (15.2). По оси откладывают интервалы , варьирования СВ и на этих отрезках строят прямоугольники с высотами (рис. 15.2).

О: Эмпирической функцией распределения СВ , для которой составлен статистический ряд (15.2), называется

При малых , и больших функция близка к теоретической функции распределения .

Определение неизвестных параметров распределения
и выборочного коэффициента корреляции

Выборочные числовые характеристики. Оценки параметров

Для выборки СВ и для статистического ряда определяются следующие числовые характеристики.

О: Среднее арифметическое выборки это ,

среднее арифметическое статистического ряда (15.1): . Дисперсия выборки это ,

дисперсия статистического ряда (15.1) ‑ .

Среднее квадратичное отклонение: .

Пусть случайная величина с функцией распределения , где - неизвестный параметр распределения, т.е. неизвестная числовая характеристика СВ . Например, имеет нормальное распределение с неизвестным параметром . Рассмотрим выборок , , этой СВ . Обозначим через оценку величины , её можно представить как случайную величину, зависящую от , , т.е. . Чтобы выбрать в некотором смысле лучшую оценку , рассматриваются свойства оценок: несмещённость, состоятельность, эффективность.

О: Оценка параметра называется несмещённой, если её математическое ожидание , состоятельной, если по вероятности сходится к при , т.е. . Несмещённая оценка называется эффективной, если её дисперсия - наименьшая среди всех дисперсий, вычисляемых для оценок по выборкам одинакового объёма.

Т: Среднее арифметическое выборки СВ , имеющей математическое ожидание и дисперсию , является несмещённой и состоятельной оценкой математического ожидания. В случае нормального распределения СВ эта оценка является эффективной.

Пример. Найти параметры распределения СВ в примере п. 15.1, если имеет нормальный закон распределения.

Решение. Плотность вероятности для нормального закона распределения , неизвестные параметры - , . Т.к. (мкм),

(мкм2), то , .

Доверительные интервалы параметров

Рассмотренные выше оценки параметров являются точечными. При малом объёме выборки, чтобы избежать грубых ошибок, вводят интервальную оценку. Обозначим точность оценки параметра через , т.е. , а через - вероятность , т.е. . Последнее условие означает, что интервал покрывает значение с заданной вероятностью . Он называется доверительным интервалом, - коэффициентом доверия. На практике выбирают достаточно близким к 1.

Величины , и объём выборки связаны между собой. Если определены две из них, то можно определить третью.

Пусть случайная величина имеет нормальное распределение с параметрами , .

В качестве оценки берётся . Все элементы , , выборки случайные и имеют то же распределение, что и с параметрами , . Тогда по (15.6) в силу нечётности функции Лапласа :.

Обозначим , тогда .

Если задано, то находится по таблице функции Лапласа. Интервал с вероятностью покрывает значение и является доверительным для . При этом предполагается, что известно. Если заменить приближённым значением , то коэффициент доверия уменьшится.

Пример. Найти доверительный интервал с коэффициентом доверия 0,95 для и .

Решение. По таблице Лапласа . Так как , , то имеем , доверительный интервал и .

Выборочный коэффициент корреляции

Пусть проведено независимых испытаний, в результате которых получены выборочные значения двумерной СВ : (, , …, ).

Аналогично случаю одномерной СВ определяются выборочные числовые характеристики: , , , , .

О: Выборочным коэффициентом корреляции СВ называется .

Пример. Дана выборка СВ :(2,2), (4,5), (6,7), (8,10). Найти .

Решение. , , , , , . Коэффициент корреляции близок к 1, т.е. зависимость между , близка к линейной.