Проверка гипотезы о нормальном распределении генеральной совокупности

по критерию Пирсона (критерию c2)

Построить графики трех исходных рядов температуры воды (рисунок 1). Визуальный анализ графиков позволяет качественно оценить изменчивость рядов, наличие периодических колебаний и тренда.

Рисунок – 1 Временная изменчивость температуры поверхности океана

в октябре, ноябре и декабре в точке 9 (55° с.ш. 30° з.д.)

 

Для первого из трех предложенных рядов Х1, Х2 и Х3 проверить гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона (критерию c2).

Для этого необходимо:

1. Руководствуясь рисунком 1 выдвинуть гипотезу о законе распределения исходных данных.

2. Произвести ранжирование ряда по возрастанию; определить минимальное и максимальное значение выборки:

, ,

п – объем выборки.

Вычислить размах (диапазон) выборки:

R = xmax – xmin.

3. Весь диапазон значений признака [xmin, xmax] разбить на N интервалов одинаковой длины. Число интервалов N определить по формуле Стерджеса:

N = 1 + [3,322 lg n ] = 1 + [log2 n],

где n – объем выборки, [.] – целая часть числа.

Вычислить величину интервалов h = R / N.

4. Определить границы интервалов (ai, ai+1):

a1 = xmin, a2 = a1 + h = xmin + h, a 3 = a2 + h = xmin + 2h, …, aN +1 = aN + h = xmin + Nh.

5. Построить интервальный вариационный ряд, указав абсолютные mi и относительные wi частоты. Проверить выполнение условий нормировки для абсолютных и относительных частот.

6. Рассчитать середины x(i) интервалов (ai, ai+1):

.

7. По имеющемуся интервальному вариационному ряду с помощью Мастера диаграмм MS Excel построить гистограмму и полигон распределения абсолютных частот. Гистограмма представляет собой эмпирическую функцию распределения.

8. Вычислить выборочное среднее и выборочное среднее квадратическое отклонение , где п – объем выборки, N – число интервалов, mi – абсолютные частоты, – среднее арифметическое концов интервалов.

9. Перейти к нормированным величинам

, ,

причем значение z1 полагают равным – ¥, а значение zN+1 полагают равным + ¥.

10. Вычислить теоретические частоты

mi' = nPi,

где п – объем выборки,

Pi = Ф0(zi+1) – Ф0(zi),

Ф0(z) = , Ф0(–z) = – Ф0(z), Ф0(–¥) = –0,5; Ф0(¥) = 0,5.

Значения функции Ф0(z) найти по Таблице 1 Приложения 2.

Замечание 1.Интервалы, содержащие малочисленные эмпирические частоты (mi < 5), следует объединить, а частоты этих интервалов сложить. В этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле k = N – 3 следует в качестве N принять число интервалов, оставшихся после объединения интервалов.

Замечание 2.Должно выполняться . В случае, если эти величины значительно (более чем на 1) отличаются друг от друга, необходимо ввести дополнительные фиктивные разряды, в которых частоты mj = 0, а теоретические частоты вычисляются по соответствующей формуле. Количество этих разрядов и их местоположение (в начале или в конце таблицы) должны обеспечивать максимально быстрое выполнение вышеуказанного приближенного равенства.

11. Для того чтобы оценить степень приближения выборочного распределения к теоретической кривой, вычислить наблюдаемое значение критерия c2набл :

c2набл = .

12. По Таблице 3 Приложения 2 критических точек распределения c2, по заданному уровню значимости a и числу степеней свободы k = N – 3, N – число интервалов, найти критическую точку c2кр(a; k) правосторонней критической области.

Указания:

а) значение критической точки c2кр(a; k) можно получить, применяя встроенную статистическую функцию ХИ2ОБР приложения MS Excel .

 

б) значения a уровней значимости выбрать из таблицы согласно номеру варианта:

 

№ варианта
a1 0,01 0,02 0,025 0,05 0,05 0,02 0,01 0,01 0,02
a2 0,05 0,001 0,09 0,025 0,02 0,01 0,05 0,025 0,05
№ варианта
a1 0,025 0,05 0,025 0,01 0,09 0,01 0,02 0,025 0,05
a2 0,01 0,001 0,065 0,025 0,01 0,05 0,01 0,05 0,08

 

13. Если c2набл < c2кр, то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо. Если c2набл > c2кр – гипотезу отвергают.