рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Проверка соответствия ряда распределения нормальному

Проверка соответствия ряда распределения нормальному - раздел Математика, Понятие о статистике. Предмет и метод статистики Под Теоретической Кривой Распределения Понимается Графическое Изображение Ряд...

Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов, другими словами, теоретическое распределение может быть выражено аналитически – формулой, которая связывает частоты и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения. Большое познавательное значение имеет сопоставление фактических кривых распределения с теоретическими.

Как уже неоднократно отмечалось, часто пользуются типом распределения, которое называется нормальным. Формула функции плотности нормального распределения имеет следующий вид (41):

или (41)

где X – значение изучаемого признака;

– средняя арифметическая ряда;

σ – среднее квадратическое отклонение;

– нормированное отклонение;

π = 3,1415 – постоянное число (отношение длины окружности к ее диаметру);

e = 2,7182 – основание натурального логарифма.

Следовательно, кривая нормального распределения может быть построена по двум параметрам – средней арифметической и среднему квадратическому отклонению. Поэтому важно выяснить, как эти параметры влияют на вид нормальной кривой.

Если не меняется, а изменяется только σ, то чем меньше σ, тем более вытянута вверх кривая и наоборот, чем больше σ, тем более плоской и растянутой вдоль оси абсцисс становится кривая нормального распределения (см. рис. 8).

 

X
σ1
σ2
σ3
= const σ1 < σ2 < σ3
X
f(X)

 

Рис. 8. Влияние величины σ на кривую нормального распределения

Если σ остается неизменной, а изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются друг от друга положением максимальной ординаты (вершины) (см. рис. 9).

f(X)
< <
σ = const

 
 


Рис. 9. Влияние величины на кривую нормального распределения

Итак, выделим особенности кривой нормального распределения:

1) кривая симметрична и имеет максимум в точке, соответствующей значению = Ме = Мо;

2) кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности (чем больше отдельные значения X отклоняются от , тем реже они встречаются);

3) кривая имеет две точки перегиба на расстоянии ± σ от ;

4) коэффициенты асимметрии и эксцесса равны нулю.

Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в изучаемой совокупности подчиняется какому-то определенному закону. Проверка гипотезы состоит в том, чтобы на основании сравнения фактических (эмпирических) частот с предполагаемыми (теоретическими) частотами сделать вывод о соответствии фактического распределения гипотетическому распределению.

Под гипотетическим распределением необязательно понимается нормальное распределение. Может быть выдвинута гипотеза о логнормальном, биномиальном распределениях, распределении Пуассона и пр.[21] Причина частого обращения к нормальному распределению состоит в том, что, как уже было замечено ранее, в этом типе распределения выражается закономерность, возникающая при взаимодействии множества случайных причин, когда ни одна из не имеет преобладающего влияния.

В нашем примере про ВО близость значений средней арифметической величины (60,82), медианы (59,30) и моды (58,96) указывает на вероятное соответствие изучаемого распределения нормальному закону.

Проверка гипотезы о соответствии теоретическому распределению предполагает расчет теоретических частот этого распределения.

Для нормального распределения порядок расчета этих частот следующий:

1) по эмпирическим данным рассчитывают среднюю арифметическую ряда и среднее квадратическое отклонение σ;

2) находят нормированное (выраженное в σ) отклонение каждого эмпирического значения от средней арифметической:

;(42)

3) по формуле (41) или с помощью таблиц интеграла вероятностей Лапласа находят значение φ(t)[22];

4) вычисляют теоретические частоты m по формуле:

,(43)

где N – объем совокупности, hi – длина (размах) i-го интервала.

Определим теоретические частоты нормального распределения в нашем примере про ВО по данным табл. 12, для чего построим вспомогательную таблицу 14. Средняя арифметическая величина и среднее квадратическое отклонение нами уже найдены ранее (); значения нормированных отклонений t рассчитаны в 5-м столбце таблицы 14, а значения плотностей φ(t) – в 8-м столбце (в 6-м и 7-м столбцах приведены промежуточные расчеты по формуле (41)); в последнем столбце – теоретические частоты нормального распределения.

Таблица 14. Расчет теоретических частот нормального распределения

i Xi fi Хi φ(t) mi
24,16 – 38,66 31,41 -1,4889 -1,1084 0,3301 0,0067 3,383
38,66 – 53,16 45,91 -0,7549 -0,2850 0,7520 0,0152 7,707
53,16 – 67,66 60,41 -0,0210 -0,0002 0,9998 0,0202 10,246
67,66 – 82,16 74,91 0,7130 -0,2542 0,7756 0,0157 7,948
82,16 – 96,66 89,41 1,4470 -1,0468 0,3510 0,0071 3,598
96,66 – 111,16 103,91 2,1809 -2,3782 0,0927 0,0019 0,950
  Итого           33,832

Сравним на графике эмпирические f (ВО по таможенным постам) и теоретические m (нормальное распределение) частоты, полученные на основе данных табл. 14 (рис. 10). Близость этих частот очевидна[23], но объективная оценка их соответствия может быть получена только с помощью критериев согласия.

Рис. 10. Распределение ВО по таможенным постам (эмпирическое) и нормальное

Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда – существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой гипотезы о характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.

Существует ряд критериев согласия, но чаще всего применяют критерии Пирсона χ2, Колмогорова и Романовского.

Критерий согласия Пирсона χ2 (хи-квадрат) – один из основных критериев согласия, рассчитываемый по формуле (44):

, (44)

где k – число интервалов;

fi – эмпирическая частота i-го интервала;

mi – теоретическая частота.

Для распределения χ2 составлены таблицы, где указано критическое значение критерия согласия χ2 для выбранного уровня значимости α и данного числа степеней свободы ν (см. Приложение 3).

Уровень значимости α – это вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность (P) того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости:

1) α = 0,10, тогда P = 0,90;

2) α = 0,05, тогда P = 0,95 [24];

3) α = 0,01, тогда P = 0,99.

Число степеней свободы ν определяется по формуле:

ν = k – z – 1,(45)

где k – число интервалов;

z – число параметров, задающих теоретический закон распределения.

Для нормального распределения z = 2, так как нормальное распределение зависит от двух параметров – средней арифметической () и среднего квадратического отклонения (σ).

Для оценки существенности расхождений расчетное значение χ2 сравнивают с табличным χ2табл. Расчетное значения критерия должно быть меньше табличного, т.е. χ22табл, в противном случае расхождения между теоретическим и эмпирическим распределением не случайны, а теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.

Использование критерия χ2 рекомендуется для достаточно больших совокупностей (N>50), при этом частота каждой группы не должна быть менее 5, в противном случае повышается вероятность получения ошибочных выводов.

В нашем примере про ВО для расчета критерия χ2 построим вспомогательную таблицу 15.

Таблица 15. Вспомогательные расчеты критериев согласия

i Xi fi mi fi mi |fi’– mi’|
24,16 – 38,66 3,383 0,773 3,383 1,617
38,66 – 53,16 7,707 0,065 11,090 0,910
53,16 – 67,66 10,246 0,740 21,336 3,664
67,66 – 82,16 7,948 1,961 29,284 0,284
82,16 – 96,66 3,598 0,045 32,882 0,118
96,66 – 111,16 0,950 1,160 33,832 1,168
  Итого 33,832 4,744      

Теперь по формуле (44): χ2 =4,744, что меньше табличного (Приложение 3) значения χ2табл=7,8147 при уровне значимости α = 0,05 и числе степеней свободы ν=6–2–1=3, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.

Критерий Романовского КР основан на использовании критерия Пирсона χ2, т.е. уже найденных значений χ2 и числа степеней свободы ν, рассчитывается по формуле (46):

. (46)

Он используется в том случае, когда отсутствует таблица значений χ2. Если КР < 3, то расхождения между теоретическим и эмпирическим распределением случайны, если КР > 3, то не случайны, и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.

В нашем примере про ВО по формуле (46): = 0,712 < 3, что подтверждает несущественность расхождений между эмпирическими и теоретическими частотами.

Критерий Колмогорова λ основан на определении максимального расхождения между накопленными частотами эмпирического и теоретического распределений (D), рассчитывается по формуле (47) [25]:

. (47)

Рассчитав значение λ, по таблице P(λ) (см. Приложение 6) определяют вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Вероятность P(λ) может изменяться от 0 до 1. При P(λ) = 1 (т.е. при λ < 0,3) происходит полное совпадение частот, при P(λ) = 0 – полное расхождение.

В нашем примере про ВО в последних трех столбцах таблицы 15 приведены расчеты накопленных частот и разностей между ними, откуда видно, что в 3-ей группе наблюдается максимальное расхождение (разность) D = 3,664. Тогда по формуле (47): . По таблице Приложения 6 находим значение вероятности при λ = 0,6: P = 0,86 (наиболее близкое значение к 0,619), т.е. с вероятностью, близкой к 0,86, можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, а расхождения эмпирического и теоретического распределений носят случайный характер.

Итак, подтвердив правильность выдвинутой гипотезы с помощью известных критериев согласия, можно использовать результаты распределения для практической деятельности. Какое же практическое значение может иметь произведенная проверка гипотезы? Во-первых, соответствие нормальному закону позволяет прогнозировать, какое число таможенных постов (или их доля) попадет в тот или иной интервал значений величины ВО. Во-вторых, нормальное распределение возникает при действии на вариацию изучаемого показателя множества независимых факторов. Из чего следует, что нельзя существенно снизить вариацию величины ВО, воздействуя только на один-два управляемых фактора, скажем число работников таможенного поста или степень технической оснащенности.

– Конец работы –

Эта тема принадлежит разделу:

Понятие о статистике. Предмет и метод статистики

Понятие о статистике... Предмет и метод статистики... Статистическое наблюдение...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Проверка соответствия ряда распределения нормальному

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Предмет и метод статистики
В научный обиход термин «статистика»[1] ввел немецкий ученый Готфрид Ахенваль в 1746 году, предложив заменить название курса «Государствоведение», преподававшегося в университетах Германии, на «Ста

Статистическое наблюдение
Люди по-разному относятся к статистической информации: одни не воспринимают ее, другие безоговорочно верят, а третьи согласны с мнением английского политика Дизраэли: «Существует 3 типа лжи: ложь,

Сводка и группировка статистических данных
Сводка – научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных, систематизацию, группиро

Формы представления статистических данных
Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существует 3 основных формы представления статистических данных: 1) текстовая – включение данных в те

Абсолютные величины
Для характеристики массовых явлений статистика использует статистические величины (показатели), которые характеризуют группы единиц или совокупность (явление) в целом. Статистические величин

Относительные величины
Относительная величина – это результат деления (сравнения) двух абсолютных величин. В числителе дроби стоит величина, которую сравнивают, а в знаменателе – величина, с которой сравнивают (ба

Средние величины
Как уже неоднократно было сказано ранее, статистика изучает массовые явления и процессы. Каждое из таких явлений обладает как общими для всей совокупности, так и особенными, индивидуальными свойств

Построение ряда распределения
Признаки, изучаемые статистикой, варьируются (отличаются друг от друга) у различных единиц совокупности в один и тот же период или момент времени. Например, величина внешнеторгового оборота варьиру

Расчет структурных характеристик ряда распределения
При изучении вариации применяются такие характеристики ряда распределения, которые описывают количественно его структуру, строение. Такова, например, медиана – величина варьирующего признака

Расчет показателей размера и интенсивности вариации
Простейшим показателем является размах вариации – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений (24):

Расчет моментов распределения и показателей его формы
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются

Проверка соответствия ряда распределения закону Пуассона
Таможенная инспекция провела проверку после выпуска товаров. В результате получен следующий дискретный ряд распределения числа нарушений, выявленных в каждой проверке (табл. 16). Таблица 1

Абсолютные и относительные показатели изменения структуры
Развитие статистической совокупности проявляется не только в количественном росте или уменьшении элементов системы, но также и в изменении ее структуры. Структура – это строение совокупности

Ранговые показатели изменения структуры
Для измерения различий структуры часто используют менее точные, но более простые по расчету показатели, которые основаны на оценки различий не самих значений долей, а их рангов, то есть порядковых

Понятие выборочного наблюдения
Выборочный метод используется, когда применение сплошного на­блюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет ме­сто, на

Способы формирования выборки
1. Собственно случайный отбор: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному об

Средняя ошибка выборки
После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц, переходят к расчету обобщающих показателей. К ним от

Предельная ошибка выборки
Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. В конкретной выборке разность

Необходимая численность выборки
Разрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. Не­известной остается минимальная численность выборки, обеспечиваю­щая заданную

Методические указания
Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица 24): Та

Понятие о рядах динамики
Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов).

Показатели изменения уровней ряда динамики
Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить

Средние показатели ряда динамики
Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщить в виде средних величин. Такие обобщенные (средние) показатели особенно нео

Методы выявления основной тенденции (тренда) в рядах динамики
Одна из основных задач изучения рядов динамики – выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случ

Оценка адекватности тренда и прогнозирование
Для найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр

Анализ сезонных колебаний
В рядах динамики, уровни которых являются месячными или квартальными показателями, наряду со случайными колебаниями часто наблюдаются сезонные колебания, под которыми понимаются периодически

Методические указания
По данным ФСГС сальдо внешней торговли (СВТ) России за период 2000-2006 гг. характеризуется рядом динамики, представленным в табл. 36. Таблица 36. Сальдо внешней торговли (СВТ) России за п

Понятие корреляционной зависимости
Один из наиболее общих законов объективного мира – закон всеобщей связи и зависимости между явлениями. Естественно, что, исследуя явления в самых различных областях, статистика неизбежно сталкивает

Методы выявления и оценки корреляционной связи
Для выявления наличия и характера корреляционной связи между двумя признаками в статистике используется ряд методов. 1. Рассмотрение параллельных данных (зна

Коэффициенты корреляции рангов
Коэффициенты корреляции рангов – это менее точные, но более простые по расчету непараметрические показатели для измерения тесноты связи между двумя коррелируемыми признаками. К ним относятся

Особенности коррелирования рядов динамики
Во многих исследованиях приходится изучать динамику нескольких показателей одновременно, т.е. рассматривать параллельно несколько рядов динамики. В этом случае возникает необходимость измерить зави

Показатели тесноты связи между качественными признаками
Метод корреляционных таблиц применим не только к количественным, но и к описательным (качественным) признакам, взаимосвязи между которыми часто приходится изучать при проведении различных социологи

Множественная корреляция
При решении практических задач исследователи сталкиваются с тем, что корреляционные связи не ограничиваются связями между двумя признаками: результативным y и факторным x. В действите

Назначение и виды индексов
Индекс – относительная величина, показывающая во сколько раз уровень изучаемого явления в данных условиях отличается от уровня того же явления в других условиях. Различие условий может прояв

Индивидуальные индексы
Относительная величина, получаемая при сравнении уровней, называется индивидуальным индексом, если не имеет значения структура изучаемого явления. Индивидуальные индексы обозначаются i

Общие индексы
Если изучаемое явление неоднородно и сравнение уровней можно провести только после приведения их к общей мере, экономический анализ выполняют посредством общих индексов. Индекс становится общим

Индексы средних величин
При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) средней величины индексируемого показателя для определенной однородной совкупност

Территориальные индексы
Территориальные индексы применяются для пространственных, межрегиональных сопоставлений различных показателей. Их расчет более сложен, чем расчет традиционных (динамических) индексов, рассмотренных

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги