Моделирование ряда распределения

Моделирование ряда распределения. Нормальное распределение - распределение, полностью определяющееся двумя параметрами - средним значением и СКО. Причина частого обращения именно к закону нормального распределения заключается в том, что в этом типе распределения отражается закономерность, возникающая при взаимодействии множества случайных факторов, ни один из которых не является преобладающим. Проверим гипотезу о нормальном законе распределения.

Для этого воспользуемся критерием согласия Пирсона (хи-квадрат). Идея Пирсона заключается в расчете и последующей оценке размера отклонений фактических значений частоты появления признака по интервалам от их теоретических значений, т.е. значений, которые бы имели место в случае нормального распределения.

Чем больше размер этих отклонений, тем меньше оснований считать распределение близким к нормальному.

Результаты проверки гипотезы представлены в Приложении В. Т.к. значение Хи-квадрат расчетное (28,09) больше значения Хи-квадрат табличное (9,488), то гипотеза о нормальном характере распределения отклоняется.

Этот результат не явился неожиданным, т.к. в социально-экономической статистике нормальное распределение практически вообще не встречается; однако сравнение с нормальным распределением важно для выяснения степени и характера отклонений от него фактического распределения.

Проанализируем характер отклонений в параметрах распределения от нормального.

Построим график распределения.

Диаграмма 3.1 - График распределения Анализируя график и используя данные вариационного анализа, делаем вывод о том, что распределение островершинное, имеет место умеренная правосторонняя асимметрия. 4. Корреляционный анализ Следующим пунктом статистического исследования является проведение корреляционного анализа, задачей которого является оценка тесноты связи между признаками.

Прежде всего, выделим признаки, наличие связи с которыми мы будем проверять:  Численность учащихся государственных дневных общеобразовательных учреждений (на начало учебного года 2001/02), тысяч человек;  Строительство жилых домов в 1 полугодии 2002г тыс. кв. м общей площади. (Значения этих показателей по регионам представлены в Приложении Г). Корреляционный анализ будем проводить в 4 этапа: 1) Построим корреляционную решетку (аналитическую группировку единиц совокупности по двум признакам, между которыми оценивается связь). 2) Построим поле корреляции (Графическое изображение связи между переменными, множество точек, координатами которых являются пары значений признаков по всем единицам совокупности) 3) Рассчитаем показатели корреляции: коэффициент Фехнера (очень приближенный показатель (не учитывает величину отклонений индивидуальных значений признака от его средней величины), но по его значению можно сделать первые выводы о наличии или отсутствии связи) и эмпирическое корреляционное отношение (оценивает тесноту связи с высокой точностью и подходит для любых зависимостей). 4) Произведем анализ и оценку наличия, направления и тесноты корреляционной связи. Численность населения в возрасте моложе трудоспособного на 1.01.2002 г чел. (X) и численность учащихся государственных дневных общеобразовательных учреждений (на начало учебного года 2001/02), тыс. чел. (Y). 1) Исключим из совокупности г. Москву и Московскую обл. как регионы, характеризующиеся аномальными значениями признака Y. Y X Менее 100 100-200 200-300 300-400 400-500 500-600 600- 700 Менее 180000 15 8 - - - - - 180000-360000 - 26 5 - - - - 360000-540000 - 1 8 - - - 540000-720000 - - - 2 7 1 - 720000-90 - - - - - 3 1 90-1080000 - - - - - - 1 2) 3) Коэффициент Фехнера = 1,0 (Расчеты представлены в Приложении Д). Эмпирическое корреляционное отношение = 0,97 (Расчеты представлены в Приложении Е). 4) По расположению и концентрации единиц на поле корреляционной решетки можно с уверенностью предположить наличие прямой тесной связи между двумя данными признаками.

Анализируя график, оцениваем, что характер распределения точек на координатном поле подтверждает предположения о наличии прямой тесной связи между данными признаками.

Т.к. полученные значения коэффициентов корреляции превышают пороговые значения (0,5 для коэффициента Фехнера и 0,7 для ЭКО), то можно сделать окончательный вывод о том, что данные показатели связаны тесно (связь линейная). Следовательно, можно построить уравнение регрессии и иметь возможность прогнозировать значения признака-результата.

Численность населения в возрасте моложе трудоспособного на 1.01.2002 г чел. (X) и строительство жилых домов в 1 полугодии 2002г тыс. кв. м общей площади (Y). 1) Исключим из совокупности г. Москву и Московскую обл. как регионы, характеризующиеся аномальными значениями признака Y. Y X Менее 60 60-120 120-180 180-240 240-300 300-360 Более 360 Менее 180000 21 1 - - - - - 180000-360000 17 9 2 2 - - - 360000-540000 - 4 2 1 2 - - 540000-720000 1 3 3 1 1 1 - 720000-90 - - 1 1 - 1 1 90-1080000 - - - - - - 1 2) 3) Коэффициент Фехнера = 0,71 (Расчеты представлены в Приложении Ж). Эмпирическое корреляционное отношение = 0,63 (Расчеты представлены в Приложении З). 4) По расположению и концентрации единиц на поле корреляционной решетки сделать предположение о наличии слабой связи между двумя данными признаками.

Это предположение подтверждает и анализ графика.

Полученное значение коэффициента Фехнера говорит о наличии связи между данными показателями, но более точный показатель корреляции - эмпирическое корреляционное отношение - свидетельствует о том, что связь имеется, но не является тесной (значение ЭКО немного меньше порогового). 5.