Определение вида закона распределения случайной величины.

Вернемся к исходной таблице рассматриваемого примера, добавив еще одну строку в которой проставим частость одинаковых ответов

Размер,
Количество,
Частость, 0,05 0,15 0,2 0,25 0,2 0,1 0,05 1,00

Представим имеющиеся данные в виде графика. Как видно из графика: - численные значения изменяются не беспредельно; - чем больше отклонение от среднего значения, тем меньше частость ее появления и наоборот. Следовательно, имеют место элементы, присущие нормальному закону.

Выдвигаем гипотезу (Высказываем предположение): случайные величины распределены по нормальному закону. Но нормальный закон характерен для генеральной совокупности, а у нас выборка ограниченного объема. Насколько приемлема наша гипотеза?

Вполне очевидно, что при нормальном законе распределения частости будут иные. Если они отличаются от опытных данных несущественно, то можно согласиться с выдвинутой гипотезой, если отличия существенные, то придется опровергнуть гипотезу. Но что значит «несущественно»? Видимо придется установить какой-либо критерий. Существуют различные способы установления критерия, который принято называть «Критерий согласия». К числу наиболее распространенных способов относятся: критерий согласия Пирсона ( хи – квадрат); Романовского; Колмагорова и Ястремского.

Сущность всех способов одинакова и сводится к определению опытного значения критерия согласия и сравнению его с некоторым теоретическим значением. Если опытное значение критерия согласия превосходит теоретическое его значение, то гипотеза отвергается, если не превосходит, то принимается. Наиболее распространенным является критерий согласия Пирсона ( хи – квадрат). Рассмотрим порядок проведения расчетов при использовании этого способа.

Формулируем основную гипотезу: опытное распределение соответствуют теоретическому распределению, что записывается в виде . Тогда конкурирующая гипотеза .

Опытное значение критерия согласия рассчитывают по формуле ,

где n – общее число опытов;
  – число значений, оказавшихся в i–м интервале по результатам опыта;
  – теоретическая частость попадания в i–ый интервал;
  – число значений в i–м интервале, которое соответствует теоретическому распределению.

По физическому смыслу критерий согласия Пирсона- это мера отклонений опытных данных от теоретических.

Для того чтобы найти теоретическую частость попадания в i–ый интервал, необходимо сначала вычислить отклонения от среднего значения и это отклонение выразить в среднем квадратическом отклонении для генеральной совокупности, т.е. . Например, .

Результаты аналогичных расчетов сведем в таблицу

Размер,
-1,86 -1,22 -0,58 0,06 0,71 1,35 1,99

Затем, используя таблицу функции распределения нормального закона найти соответствующие значения . Например, первому столбцу должно соответствовать значение

f(39)= F(-1,86)–F(-1,22),

второму столбцу f(40)= F(-0,58)-F(-1,22) и т.д.

Примечание. При отсутствии таблицы можно воспользоваться компьютером. Для этого в Excel в какой-либо столбец ввести значения .Выделить ячейку рядом с первым числом, вызвать Статистические функции, НОРМСТРАСП и в появившемся подменю указать первое число х = –1,86. Ок. В ячейке появится 0,031, соответствующее

F(-1,86). Аналогично для F(-1,22)= 0,111.

Вычитая, имеем

f(39)= F(-1,26)–F(-1,52)= 0,111-0,031=0,080.

Аналогичные и последующие расчеты заносим в таблицу

 

Размер,
-1,86 -1,22 -0,58 0,06 0,71 1,35 1,99
0,031 0,111 0,281 0,524 0,761 0,911 0,977
0.080 0.170 0.243 0.237 0.150 0.065 0.019
0,222 0,046 0,152 0,014 0,328 0,371 1,008

Суммируя последнюю строку, получим

=2,142.

Необходимо сравнить опытное значение с теоретическим значением. Теоретическое значениенаходят по специальным таблицам, Входом в таблицу является гарантированная вероятность и число степеней свободы. Число степеней свободы находят по формуле, где k – число разрядов в таблице (в нашем случае число столбцов k=7); s– число наложенных связей. Одна связь присутствует всегда. Действительно, если сумма вероятностей равна единице, то n-1 значений могут быть любыми, а одна всегда равна . Если потребуем равенства , то это еще одна связь. Если потребуем равенства дисперсий, то это еще одна связь. Итого три. Следовательно, число степеней свободы . По таблице, для уровня значимости , при , находим .

Вывод. Так как , то с вероятностью 90% можно утверждать, что нет оснований для того, чтобы отвергнуть гипотезу. Вероятность того, что мы ошибаемся равна .

Примечание. При отсутствии таблицы можно воспользоваться компьютером. Для этого в Excel вызвать Статистические функции, ХИ2ОБР и в появившемся подменю указать Вероятность 0,1, Степеней свободы 4. Ок. Прочитать ответ 7,77944.

 

Пример 1. 2. В казино поступила жалоба, что игральная кость с неравномерным выпадением очков. Необходимо проверить следуют ли экспериментальные данные закону равной вероятности. Для решения этой задачи проведен эксперимент, в котором произведено 600 бросаний.

Используем критерий χ2. Основная гипотеза Но: , конкурирующая гипотеза . Результаты эксперимента и промежуточные расчеты отражены в таблице.

Число очков, Их число в эксперименте, Теоретическое значение Примечание
0.01
1.96
0.49
0.36
0.09
2.25
Всего 5,16  

Суммируя, находим

Число степеней свободы: ; k=6 – число строк; s=3. Следовательно, r =6-3=3.

. Так как, то нет оснований для того, чтобы отвергнуть гипотезу о равномерном выпадении очков. Отклонения–следствие случайности. Вероятность того, что мы ошибаемся составляет 5%.