Вариационный анализ

Вариационный анализ. Первый этап вариационного анализа - построение вариационного ряда. На этом этапе важно правильно определить, ряд какого вида целесообразно построить.

Т.к. изучаемый признак – чмсленность населения в возрасте моложе трудоспособного – относится к непрерывному виду, то строим интервальный вариационный ряд. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала.

Воспользуемся формулой Стержесса: Количество интервалов k = 1 + 3,32 * lg80 = 7,3. В качестве длины интервала l выберем целочисленное и удобное для восприятия значение в интервале от l2 до l1: l1 = (1348893-14577)/7 = 190617 l2 = (1348893-14577)/8 = 166790 Получим вариационный ряд, состоящий из 7 интервалов длиной 180000. (Таблица 2.1). Таблица 2.1 - Вариационный ряд Численность населения в возрасте моложе трудоспособного на 1.01.2002 г тыс. чел. Менее 180 180-360 360-540 540-720 720-900 900-1080 Более 1080 Число регионов 23 31 9 10 4 2 1 Графически интервальный вариационный ряд изображается гистограммой: Диаграмма 2.1 - Вариационный ряд Второй этап вариационного анализа - расчет показателей вариации (Приложение Б). Оформим его в виде таблицы: Таблица 2.2 - Показатели вариации Показатель Значение Качественная оценка Среднее значение 339750 На 1.01.2002 средняя численность населения в возрасте моложе трудоспособного по регионам РФ составляла 339750 чел. Показатели структуры вариации Мода 228000 Наиболее часто встречающееся значение численности населения в возрасте моложе трудоспособного составляет около 228000 чел. Медиана 278710 40 регионов РФ характеризуется численностью населения в возрасте моложе трудоспособного ниже 278710 чел. и 40 регионов выше Показатели силы и интенсивности вариации Размах вариации 976409 Даже исключив из совокупности регион с аномальным значением показателя (г. Москва - 1348893 чел.), найдем, что абсолютный разброс значений признака чрезвычайно высок.

Среднее линейное отклонение 197663 Значения численности населения в возрасте моложе трудоспособного по регионам на 1.01.2002 отличались в среднем на 197663 чел. от среднего значения 339750 чел. Дисперсия 61959937500 Квадрат отклонений значений признака по регионам от среднего значения по всей стране равен 61959937500 чел.2 Среднее квадратическое отклонение 248918 СКО является мерой надежности средней величины: чем оно меньше, тем точнее средняя арифметическая отражает собой всю изучаемую совокупность Относительный размах вариации 287% Разница между максимальным и минимальным значениями превышает среднее значение почти в 3 раза, т.е. относительный разброс значений признака также чрезвычайно высок Относительное линейное отклонение 58% Доля усредненного значения абсолютных отклонений от средней величины равна 58% Коэффициент вариации 73% По численности населения в возрасте моложе трудоспособного совокупность является неоднородной Показатели характера вариации Коэффициент асимметрии 0,45 Распределение умеренно асимметрично, асимметрия правосторонняя (смещение в область более низких значений показателя) Показатель эксцесса 0,88 Распределение островершинное 3.