Тема 5: Вариационный анализ

§1. Вариация признаков и ее причины

§2. Ряды распределения

§3. Структурные характеристики вариационного ряда.

§4. Показатели силы вариации.

§5. Показатели интенсивности вариации

§6. виды дисперсии. Правило сложения дисперсии.

 

§1.

Вариацией значения какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени.

Причина вариации: разные условия существования ЕСС именно вариация порождает необходимость в такой науке как статистика.

 

§2.

Проведение вариационного анализа начинается с построения вариационного ряда – упорядоченное распределение единиц совокупности по возрастающим или по убывающим признакам и подсчет соответствующих частот.

Ряды распределения

ü ранжированные

ü дискретные

ü интервальные

Ранжированный вариационный ряд – перечень отдельных ед. совокупности в порядке возрастания убывания ранжированного признака

БАНК Капитал тыс. руб.
СБ РФ
Внешторгбанк

Дискретный вариационный ряд – таблица состоящая из 2х строк – полимерных значений варьирующего признака и кол-во единиц с данным значением признака.

Кол-во детей в семье
Кол-во семей

Интервальный вариационный ряд строится в случаях:

1. признак принимает дискретные значения , но кол-во их слишком велико

2. признака принимает любые значения в определенном диапазоне

Размер собственного капитала тыс. руб. 0 - 10000 10000-50000 Свыше 50000
Количество банков

При построении интервального вариационного ряда необходимо выбрать оптимальное количество групп, самый распространенный способ по формуле Стерджесса

k=1+3.32lgn

k – количество интервалов

n – объем совокупности

При расчетах почти всегда получают дробные значения, округления производить до целого числа.

Длина интервала – l

Виды интервалов

1. нижняя граница последующего интервала повторяет верхнюю границу последующего интервала

 

0 - 10 10 - 20 20 - 30
     

 

2. С индивидуальными границами в интервал входят верхняя и нижняя границы

 

 

0 - 9 10 - 19 20 - 29
     

 

3. открытый интервал, интервал с одной границей

 

До 5 5 - 10 10 – 15
     

В случае открытого интервала l принимается равной длине смежного с ним интервала, либо исходя из логических соображений.

 

Стаж До 5 5-7 7-9
Кол-во рабочих      

 

При расчетах по интервальному вариационному ряду за xi принимается середина интервала.

 
 

Интервалы могут быть как равные так и нет. При изучении вариационного ряда существенную помощь оказывает графическое изображение. Дискретный вариационный ряд изображается с помощью полигона.

 

Интервальный вариационный ряд изображается с помощью гистограммы.

 
 

Накопленная частота

xi
fi

 

NME=60 медиана = 1

Кумулята – распределение меньше чем

 
 

Огива – распределение больше чем

 

§3.

Медиана – значение признака делящее всю совокупность на две равные части.

Для дискретного вариационного ряда расчет медианы: если n-четное, то №Ме медианой единицы

Интервальный вариационный ряд:

k – количество интервалов

х0 – нижняя граница медианного интервала

l – длина медианного интервала

- сумма частот

- накопленная частота интервала предшествующая медианному.

- частота медианного интервала

Медианный интервал – первый интервал накопленная частота которого превышает половину от общей суммы частот.

0-5 5-10 10-15 15-20

 

Графически медиана находится по кумуляте.

2. Квартили – значение признака делящее совокупность на 4 равные части.

1ый квартиль

3ий квартиль

2ой квартиль – медиана.

xQ1 xQ3 – нижняя граница интервала содержащего 1го и 3го квартили.

l – длина интервала

и - накопленные частоты интервалов предшествующих интервалов содержащих 1 и 3 квартили.

- частоты квартильных интервалов.

Для характеристики вариационного ряда используются:

Децили – делят совокупность на 10 равных частей, Перцитили – делят совокупность на 100 равных частей.

3. Мода – часто встречающаяся характеристика признака. Для дискретного вариационного ряда – наибольшая частота. Для интервального вариационного ряда мода рассчитывается по следующей формуле:

- нижняя граница модального интервала

l – длина модального интервала

fMoчастота модального интервала

fMo+1 – частота интервала следующего за модальным

Модальный интервал – интервал с наибольшей частотой. Графически мода находится по гистограмме.

§4.

1. Размах вариации

2. Среднее линейное отклонение

- взвешенная

3. Дисперсия:

- взвешенная

4. Средне квадратическое отклонение