Реферат Курсовая Конспект
П. 8. Корреляция - раздел Образование, П. 8. Корреляция ...
|
Решение.
.
Если располагаем n точками (х1, у1), (х2, у2),…, (хn, уn), полученными в результате n независимых опытов над системой (х, у), то в качестве приближенного значения неизвестного коэффициента корреляции берется выборочный коэффициент корреляции:
, (16)
где - выборочное мат. ожидание случайной величины Х, - выборочное мат. ожидание случайной величины У, выборочное мат. ожидание случайного вектора,
- выборочная дисперсия случайной величины Х, , - выборочная дисперсия случайной величины У, .
.
Величины называются теоретическими частотами. Тогда
. (*)
Величина случайная, определим ее распределение в предположении, что принятая гипотеза Н0 верна.
Теорема Пирсона.Какова бы ни была функция распределения F(x) случайной величины Х, при распределение величины стремиться к - распределениюс k степенями свободы, то есть при в каждой точке х, где f(x) – плотность распределения случайной величины с k степенями свободы.
Распределение зависит от параметра k – числа степеней свободы, которое определяется как , где s – число неизвестных параметров распределения случайной величины Х, r - число интервалов группировки.
Если предполагаем закон распределения Х полностью определенным, то . Если, например, выдвигаем гипотезу о том, что закон распределения Х – нормальный, а его параметры и определяем по выборке, то .
Обычно с помощью теоремы Пирсона вводят критерий для поверки выдвинутой гипотезы Н0: СВ Х распределена по нормальному закону, так как с увеличением степеней свободы распределение стремится к нормальному закону.
Для распределения составлены специальные таблицы (Таблица П5, стр. 412-413 задачника Ефимова), пользуясь которыми можно для каждого значения и числа степеней свободы k найти вероятность р того, что величина, распределенная по закону , превзойдет это значение.
Распределение дает возможностьоценить степень согласованности теоретического и статистического распределений. Будем исходить из того, что величина Х действительно распределена по закону F(x) . Тогда вероятность р, определенная по таблице, есть вероятность того, что за счет чисто случайных причин мера расхождения (отклонения) теоретического и статистического распределений U будет не меньше, чем фактически наблюдаемое в данной серии опытов значение .Если эта вероятность р весьма мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе Н0 о том, что закон распределения величины Х есть F(x). Эту гипотезу следует отбросить как неправдоподобную. Напротив, если вероятность р сравнительно велика, можно признать расхождения между теоретическим и статистическим распределениями несущественными и отнести их за счет случайных причин. Гипотезу Н0 о том, что величина Х распределена по закону F(x) можно считать правдоподобной или, по крайней мере, не противоречащей опытным данным.
Схема применения критерия к оценке согласованности теоретического и статистического (эмпирического) распределений:
1) Задают уровень значимости α.
2) Находят оценки параметров нормального закона и : или
zi – середина интервала.
,или .
3) Вычисляют теоретические частоты по формуле , где ,и , примем- функцияЛапласа.
4) По формуле (*) находится величина набл. – наблюдаемое значение критерия Пирсона.
5) Находят число степеней свободы .
6) По таблице критических точек распределения , по заданному уровню значимости α и числу степеней свободы находят критическую точку правосторонней критической области .
7) Если , то нет оснований отвергнуть гипотезу о нормальном распределении случайной величины Х. Если , то гипотезу отвергают.
Насколько мала должна быть вероятность р для того, чтобы отбросить или пересмотреть гипотезу, - вопрос неопределенный, он не может быть решен из математических соображений, так же как и вопрос о том, насколько мала должна быть вероятность события для того, чтобы считать его практически невозможным. На практике, если р оказывается меньшим, чем 0,1, рекомендуется проверить эксперимент, если возможно – повторить его и в случае, если заметные расхождения снова появятся, пытаться искать более подходящий для описания статистических данных закон распределения.
С помощью критерия (или любого другого критерия согласия) можно только в некоторых случаях опровергнуть выбранную гипотезу или отбросить ее как явно несогласную с опытными данными. Если же вероятность р велика, то этот факт сам по себе ни в коем случае не может считаться доказательством справедливости гипотезы, а указывает только на то, что гипотеза не противоречит опытным данным.
Замечание 1. Асимптотический характер теоремы Пирсона, лежащий в основе этого правила, требует осторожности при его практическом использовании. На него можно полагаться только при больших n. Достаточно велико должно быть и n, и все и произведения npi. На практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений.
Критерийиспользует тот факт, что случайная величина ,, имеет закон распределения близкий к нормальному N(0, 1). Проблема применимости аппроксимации(непрерывное распределение) к статистике, распределение которой дискретно, оказалась сложной. Согласно имеющемуся опыту, аппроксимация применима, если все ожидаемые частоты npi > 10. Если число различных исходов велико, граница для npi может быть снижена: необходимо, чтобы для всех интервалов выполнялось условие .Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними.
Замечание 2. Если дано статистическое распределение выборки в виде последовательности равноотстоящих вариант и соответствующих им эмпирических частот:
xi | x1 | x2 | … | xr |
ni | n1 | n2 | … | nr |
то в этом случае теоретические частоты вычисляются по формуле: ,где , h –шаг (разность между двумя соседними вариантами), -функция Гаусса.
Пример. Дан статистический ряд:
xi xi | 2,5 | 3,0 | 3,5 | 4,0 | 4,5 | 5,0 | 5,5 | 6,0 | 6,5 | |
ni ni |
Проверить гипотезу о нормальном распределении данной генеральной совокупности. Уровень значимости α = 0,01.
.
7) Сравним и : . Так как , то гипотезу о нормальном распределении генеральной совокупности принимаем. Эмпирические и теоретические частоты различаются незначимо.
Теорема Колмогорова. Какова бы ни была функция распределения F(x) непрерывной случайной величины Х, при неограниченном возрастании числа независимых наблюдений n (то есть при )вероятность неравенствастремится к пределу.
Значения вероятности приведены в таблице.
0,7 | 0,711 | 1,4 | 0,04 | ||
0,1 | 0,8 | 0,544 | 1,5 | 0,022 | |
0,2 | 0,9 | 0,393 | 1,6 | 0,012 | |
0,3 | 0,27 | 1,7 | 0,006 | ||
0,4 | 0,997 | 1,1 | 0,178 | 1,8 | 0,003 |
0,5 | 0,964 | 1,2 | 0,112 | 1,9 | 0,002 |
0,6 | 0,864 | 1,3 | 0,068 | 0,001 |
Схема применения критерия Колмогорова следующая: строятся статистическая функция распределенияи предполагаемая теоретическая функция распределения F(x), и определяется максимум D модуля разности между ними.
Далее определяется величина и по таблиценаходится вероятность - вероятность того, что (если величина Х действительно распределена по закону F(x)) за счет чисто случайных причин максимальное расхождение между F(x) и будет не меньше, чем фактически наблюдаемое. Если вероятность весьма мала, гипотезу следует отвергнуть как неправдоподобную, при сравнительно больших ее можно считать совместимой с опытными данными.
Критерий А.Н. Колмогорова своей простотой выгодно отличается от критерия , поэтому его охотно применяют на практике. Но этот критерий можно применять только в случае, когда гипотетическое распределение F(x) полностью известно заранее из каких-нибудь теоретических соображений, то есть когда известен не только вид функции распределения F(x), но и все входящие в нее параметры. Такой случай редко встречается на практике. Обычно из теоретических соображений, известен только общий вид функции F(x), а входящие в нее числовые параметры определяются по данному статистическому материалу. При применении критерия это обстоятельство учитывается соответствующим уменьшением числа степеней свободы распределения . Критерий Колмогорова такого согласования не предусматривает.
Если все же применять этот критерий в тех случаях, когда параметры теоретического распределения выбираются по статистическим данным, критерий дает заведомо завышенные значения вероятности , поэтому в ряде случаев рискуем принять как правдоподобную гипотезу, в действительности плохо согласующуюся с опытными данными.
– Конец работы –
Используемые теги: Корреляция0.038
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: П. 8. Корреляция
Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов