Вернемся к исходной таблице рассматриваемого примера, добавив еще одну строку в которой проставим частость одинаковых ответов
Размер, | ||||||||
Количество, | ||||||||
Частость, | 0,05 | 0,15 | 0,2 | 0,25 | 0,2 | 0,1 | 0,05 | 1,00 |
Представим имеющиеся данные в виде графика. Как видно из графика: - численные значения изменяются не беспредельно; - чем больше отклонение от среднего значения, тем меньше частость ее появления и наоборот. Следовательно, имеют место элементы, присущие нормальному закону.
Выдвигаем гипотезу (Высказываем предположение): случайные величины распределены по нормальному закону. Но нормальный закон характерен для генеральной совокупности, а у нас выборка ограниченного объема. Насколько приемлема наша гипотеза?
Вполне очевидно, что при нормальном законе распределения частости будут иные. Если они отличаются от опытных данных несущественно, то можно согласиться с выдвинутой гипотезой, если отличия существенные, то придется опровергнуть гипотезу. Но что значит «несущественно»? Видимо придется установить какой-либо критерий. Существуют различные способы установления критерия, который принято называть «Критерий согласия». К числу наиболее распространенных способов относятся: критерий согласия Пирсона ( хи – квадрат); Романовского; Колмагорова и Ястремского.
Сущность всех способов одинакова и сводится к определению опытного значения критерия согласия и сравнению его с некоторым теоретическим значением. Если опытное значение критерия согласия превосходит теоретическое его значение, то гипотеза отвергается, если не превосходит, то принимается. Наиболее распространенным является критерий согласия Пирсона ( хи – квадрат). Рассмотрим порядок проведения расчетов при использовании этого способа.
Формулируем основную гипотезу: опытное распределение соответствуют теоретическому распределению, что записывается в виде . Тогда конкурирующая гипотеза .
Опытное значение критерия согласия рассчитывают по формуле ,
где | n | – общее число опытов; |
– число значений, оказавшихся в i–м интервале по результатам опыта; | ||
– теоретическая частость попадания в i–ый интервал; | ||
– число значений в i–м интервале, которое соответствует теоретическому распределению. |
По физическому смыслу критерий согласия Пирсона- это мера отклонений опытных данных от теоретических.
Для того чтобы найти теоретическую частость попадания в i–ый интервал, необходимо сначала вычислить отклонения от среднего значения и это отклонение выразить в среднем квадратическом отклонении для генеральной совокупности, т.е. . Например, .
Результаты аналогичных расчетов сведем в таблицу
Размер, | |||||||
-1,86 | -1,22 | -0,58 | 0,06 | 0,71 | 1,35 | 1,99 |
Затем, используя таблицу функции распределения нормального закона найти соответствующие значения . Например, первому столбцу должно соответствовать значение
f(39)= F(-1,86)–F(-1,22),
второму столбцу f(40)= F(-0,58)-F(-1,22) и т.д.
Примечание. При отсутствии таблицы можно воспользоваться компьютером. Для этого в Excel в какой-либо столбец ввести значения .Выделить ячейку рядом с первым числом, вызвать Статистические функции, НОРМСТРАСП и в появившемся подменю указать первое число х = –1,86. Ок. В ячейке появится 0,031, соответствующее
F(-1,86). Аналогично для F(-1,22)= 0,111.
Вычитая, имеем
f(39)= F(-1,26)–F(-1,52)= 0,111-0,031=0,080.
Аналогичные и последующие расчеты заносим в таблицу
Размер, | |||||||
-1,86 | -1,22 | -0,58 | 0,06 | 0,71 | 1,35 | 1,99 | |
0,031 | 0,111 | 0,281 | 0,524 | 0,761 | 0,911 | 0,977 | |
0.080 | 0.170 | 0.243 | 0.237 | 0.150 | 0.065 | 0.019 | |
0,222 | 0,046 | 0,152 | 0,014 | 0,328 | 0,371 | 1,008 |
Суммируя последнюю строку, получим
=2,142.
Необходимо сравнить опытное значение с теоретическим значением. Теоретическое значениенаходят по специальным таблицам, Входом в таблицу является гарантированная вероятность и число степеней свободы. Число степеней свободы находят по формуле, где k – число разрядов в таблице (в нашем случае число столбцов k=7); s– число наложенных связей. Одна связь присутствует всегда. Действительно, если сумма вероятностей равна единице, то n-1 значений могут быть любыми, а одна всегда равна . Если потребуем равенства , то это еще одна связь. Если потребуем равенства дисперсий, то это еще одна связь. Итого три. Следовательно, число степеней свободы . По таблице, для уровня значимости , при , находим .
Вывод. Так как , то с вероятностью 90% можно утверждать, что нет оснований для того, чтобы отвергнуть гипотезу. Вероятность того, что мы ошибаемся равна .
Примечание. При отсутствии таблицы можно воспользоваться компьютером. Для этого в Excel вызвать Статистические функции, ХИ2ОБР и в появившемся подменю указать Вероятность 0,1, Степеней свободы 4. Ок. Прочитать ответ 7,77944.
Пример 1. 2. В казино поступила жалоба, что игральная кость с неравномерным выпадением очков. Необходимо проверить следуют ли экспериментальные данные закону равной вероятности. Для решения этой задачи проведен эксперимент, в котором произведено 600 бросаний.
Используем критерий χ2. Основная гипотеза Но: , конкурирующая гипотеза . Результаты эксперимента и промежуточные расчеты отражены в таблице.
Число очков, | Их число в эксперименте, | Теоретическое значение | Примечание | |
0.01 | ||||
1.96 | ||||
0.49 | ||||
0.36 | ||||
0.09 | ||||
2.25 | ||||
Всего | 5,16 |
Суммируя, находим
Число степеней свободы: ; k=6 – число строк; s=3. Следовательно, r =6-3=3.
. Так как, то нет оснований для того, чтобы отвергнуть гипотезу о равномерном выпадении очков. Отклонения–следствие случайности. Вероятность того, что мы ошибаемся составляет 5%.