Тема лекции 6. Показатели вариации и способы их расчета.

Конспект лекции: Группировочный признак, имеющий количественное выражение, варь­ирует,т. е. принимает различное числовое значение у каждого элемента совокупности (варианты).

Вариация признака может быть:

- прерывной(дискретной) — иметь только вполне определенные значения, между которыми не может быть промежуточных;

- непрерывной— иметь любые значения с определенной степенью точности. Средняя величина признака не позволяет судить о тех колебаниях, ко­торым подвержен изучаемый признак в данной совокупности. Для оп­ределения величины этой колеблемости в статистике применяют пока­затели вариации.

Размах вариации R находится так:

R=xma x - xmin (6)

где xmax , xmin - максимальное и минимальное значение признака соот­ветственно.

Среднее линейное отклонение для несгруппированных данных определяется по формуле :

,

для сгруппированных данных

(7)

Дисперсия σ2 для несгруппированных данных находится так:

. (8)

для сгруппированных данных σ рассчитывается следующим образом:

(9)

Размах вариации, среднее линейное и среднее квадратиче­ское отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные зна­чения признака.

Дисперсия и среднее квадратическое отклонение - наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятностей, слу­жащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позво­ляющие оценить влияние различных факторов, обусловливаю­щих вариацию признака. В последующих разделах будет показано, как дисперсия используется для построения показателей тесно­ты корреляционной связи, при оценке результатов выборочных наблюдений, в дисперсионном анализе и т.д.

Расчет показателей вариации для 20 банков m=20, сгруппированных по размеру прибыли, показан в таблице 6.

Таблица 6

Размер прибыли, млрд. тенге. Число банков Расчетные показатели
Интервалы группы   mi хi mi хi xi - │хi-│mi │(xi-)│2 mi
3,7 - 4,6 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 -1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 -0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 + 1,665 4,995 8,317
Итого   121,70   17,640 23,126

 

Примечание. Знак (-) в первом интервале указывает, что значения призна­ка, совпадающие с верхней границей интервала, включаются в следующий ин­тервал. Это связано с тем, что верхняя граница последнего интервала больше х1 данной совокупности. По таблице 6 =6,085 млрд. тенге, d=0,882 млрд. тенге σ2=1,156, σ =1,075 млрд. тенге. Значение среднее линейное и среднее квадратическое отклонения по­казывает на сколько в среднем колеблется величины признаков хi.

Ряды распределения. Описание колебаний варьирующего признака осуществляется с помо­щью ряда распределения, который представляет собой характеристику вариантов признака их частотами. В соответствии с разными вариация­ми признака различают дискретный вариационный ряд и непрерывный, или интервальный, вариационный ряд. Графически дискретный ряд распределения изображается в виде полигона (многоугольника рис. 4), а не­прерывный ряд — в виде гистограммы рис.3, 5. При анализе непрерывного ряда распределения с неравными интервалами прибегают к показателю «плотность распределения» — числу единиц совокупности, приходя­щемуся на единицу ширины интервала. Для различных целей возникает необходимость находить ряд накопленных частот, который графически представляется кумулятивной кривой рис.3.

Вариация признака, вызванная случайными факторами (внутригрупповая дисперсия), определяется следующим образом:

σ2r=Σσ2rnr/Σnr (10)

где δ 2r — дисперсия в отдельных группах. Она вычисляется по формуле:

σ2r=(xi-X)2/Σnr (11)

Сумма указанных дисперсий образует общую дисперсию признака:

δ2+σ2=σ2 .

Данное равенство определяет правило сложения дисперсий. Оно ис­пользуется, в частности, в корреляционном анализе при определении тесноты связи результативного признака и факторных значений.

 
 

Рисунок 5. Дискретный ряд распределения

По аналитической группировке можно измерить связь с помощью еще одного показателя: эмпирического корреляцион­ного отношения. Этот показатель обозначается греческой бу­квой ƞ (эта). Он основан на правиле разложения дисперсии, со­гласно которому общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.

Эмпирическое корреляционное отношение измеряет, часть общей колеблемости результативного признака и вызы­вает изучаемый фактор.

Соответственно этот показатель рас­считывается на основе отношения факторной дисперсии к общей дисперсии результативного признака:

- коэффициент детерминации, (12)

- эмпирическое корреляционное отношение. (13)

Этот показатель принимает значения в интервале [0, 1]: чем ближе к 1, тем теснее связь, и наоборот.

Дисперсия обладает рядом свойств, некоторые из них позво­ляют упростить ее вычисления:

1) дисперсия постоянной величины равна нулю;

2) если все варианты значений признака уменьшить на одно и то же число,

то дисперсия не уменьшится;

3) если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз.

Выполнение группировки позволяет разло­жить общую дисперсию признака на две дисперсии, одна из кото­рых будет характеризовать часть вариации, обусловленную вли­янием фактора, положенного в основу группировки, а вторая - вариацию, происходящую под влиянием (внешних) прочих факторов (кро­ме фактора, положенного в основу группировки). Расчеты приведены в предыдущей таблице 3.

Например, вариации цен на муниципальное жилье ( таблица 3 ) в мае 2009 г. было сделано после расчета показателя относительной колеблемости уровня признака, т.е. коэффициента вариации.

Расчет коэффициента вариации цен 1 кв. м муниципального жилья в Москве приводит к следующим результатам:

В январе 2009г.

В мае 2009г.

Следовательно, в мае 2009 г. вариация цен 1 кв. м муници­пального жилья в Москве снизилась 2,88 % по сравнению с январем 2009 г.

Отклонение индивидуальных значений признака от общей средней можно представить так. Вариацию, обусловленную влиянием фактора, положенно­го в основу группировки, характеризует межгрупповая дисперсия σ-, которая является мерой колеблемости частных средних по группам хi общей средней Х и исчисляется по формуле (9) где k - число групп; п- число единиц в i-и группе; - частная сред­няя по i-и группе; X - общая средняя по совокупности единиц.

Вариацию, обусловленную влиянием прочих факторов, харак­теризует в каждой группе внутригрупповая дисперсия (11).

Основная литература : 4[26-28], 3 [55-59], 2[63-65].

Контрольные вопросы:

1. Формула для расчета дисперсии

2. Формула для расчета среднего квадратического отклонения.

3. Виды и размах вариации

4. Дисперсия и среднее квадратическое отклонение

5. Ряды распределения.