Непараметрическое методы оценки связей атрибутивных признаков

Методы КРА не универсальны, они применяются для изучения взаимосвязи количественных признаков. Для исследования взаимосвязи атрибутивных признаков используют непараметрические методы. Оценка силы связи качественных признаков производится на базе коэффициентов ассоциации и контингенции, Пирсона-Чупрова.

Вспомогательная таблица для расчета коэффициента взаимной сопряженности

y x I II III Всего
I. II. III.
Итого n

, , - значения соответствующих категорий, находящихся в указанных местах. Для расчета коэффициентов Пирсона-Чупрова строятся таблицы сопряженности и рассчитываются коэффициенты взаимной сопряженности:

Пирсона () и Чупрова (), где j2 - показатель взаимной сопряженности, K1 – число значений (групп) первого признака, , K2 – число значений (групп) второго признака.

Коэффициент ассоциации , коэффициент контингенции .

Макет таблицы для расчета коэффициента ассоциации и контингенции

a b a+b
c d c+d
a+c b+d a+b+c+d

Пример. С помощью коэффициента взаимной сопряженности исследуем связь между себестоимостью продукции и накладными расходами на реализацию:

Накладные расходы Себестоимость Итого
Низкая Средняя Высокая
Низкие
Средние
Высокие
Итого:

 

= 0,431 + 0,356 + +0,414=1,183 Þ, тогда Кп==0,39, а Кч=0,31. Оба коэффициента говорят о средней связи между себестоимостью и накладными расходами на реализацию.

При построении моделей регрессии должны соблюдаться следующие требования:

1. совокупность должна быть однородной и математически описываться непрерывными функциями;

2. факторный признак должен иметь количественное (цифровое) значение;

3. наличие достаточно большого объема исследуемой выборочной совокупности;

4. причинно-следственные связи должны описываться линейной или приводимой к линейной форме зависимостью;

5. отсутствие количественных ограничений на параметры модели связи;

6. постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные процессы и явления.

Контрольные вопросы:

1. В чем состоит отличие функциональной и стохастической связи?

2. В чем достоинства и недостатки метода параллельных рядов и аналитических группировок?

3. Какие основные задачи решают с помощью корреляционного и регрессионного анализа?

4. Какие виды уравнений регрессии существуют?

5. Что называется корреляционной связью?

6. Какой признак в статистике является факторным?

7. Какой признак в статистике является результативным?

8. Какие коэффициенты используются для оценки связи атрибутивных признаков?

9. Какие формулы используются для расчета коэффициентов в линейном уравнении регрессии?

10. Можно ли строить уравнение парной корреляции для сгруппированных данных?

11. Что показывает коэффициент корреляции и коэффициент детерминации?

12. Для чего используется шкала Чеддока?

13. Каков экономический смысл параметров в уравнении линейной парной корреляции?

14. Какие приемы используются для оценки адекватности линейной регрессионной модели?

15. Охарактеризуйте основные проблемы и правила построения однофакторной линейной регрессионной модели.

16. Исследовалась социально-демографическая характеристика случайных потребителей наркотиков от их семейного положения в одном из регионов РФ (тыс.чел.):

Потребление Семейное положение
замужем (женат) не замужем (не женат)
Потреблял 10,5 14,5
Не потреблял 2,5 4,5

Рассчитайте коэффициенты ассоциации и контингенции, сформулируйте выводы, вытекающие из полученных расчетов.

 

Тесты по теме

1. Что можно сказать о направлении связи :

а) связь прямолинейная;

б) связь прямая;

в) связь однофакторная;

г) связь криволинейная;

д) связь обратная.

 

2. Какой вид связи описан уравнением :

а) функциональная однофакторная связь;

б) множественная корреляционная связь;

в) корреляционная криволинейная парная связь;

г) корреляционная линейная парная связь.

 

3. Если rxy=-0,7, то, какова сила, направление и теснота связи:

а) связь отсутствует, так как коэффициент корреляции отрицателен;

б) связь линейная, слабая, 49 % изменений результата происходит под влиянием фактора;

в) связь прямая, умеренная, 70% изменений результата происходит под влиянием фактора;

г) связь обратная, сильная, 49 % изменений результата происходит под влиянием фактора.

4. Выберите верные утверждения:

а) стохастическая связь – вероятностным образом определенная связь;

б) функциональная и жестко детерминированная связь разные типы связи;

в) функциональная и статистическая связь это одно и тоже;

г) корреляционная связь – частный случай статистической;

д) уравнение регрессии описывает функциональный вид связи;

уравнение регрессии описывает зависимость условной средней величины результата от фактора.

5. Коэффициенты, использующиеся для изучения связи только атрибутивных признаков (выберите нужные):

а) коэффициент ассоциации;

б) коэффициент Пирсона-Чупрова;

в) коэффициенты взаимной сопряженности;

г) коэффициент контингенции;

д) коэффициент детерминации;

е) линейный коэффициент корреляции.

 

6. Метод, с помощью которого рассчитываются значения параметров уравнения регрессии:

а) метод параллельных рядов;

б) метод наименьших квадратов;

в) метод аналитических группировок;

г) метод оценки адекватности модели;

д) метод сопоставления рядов.

 

глава 6. статистическое изучение динамики.

 

6.1. Понятие ряда динамики, классификация рядов

Динамическим рядом (рядом динамики, временным рядом) называются ряды изменяющихся во времени значений статистического показателя, расположенных в хронологическом порядке и описывающих процесс развития, движения социально-экономических явлений.

Ряд динамики – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Всякий ряд динамики включает, следовательно, два обязательных элемента: во-первых, время и, во-вторых, конкретное значение показателя, или уровень ряда. Относящиеся к отдельным периодам или датам значения признака - это уровни динамического ряда (yi),периоды или даты, за которые представлены значения показателя - это показатели времени (ti).

Существует следующая классификация рядов динамики:

I. По способу выражения уровней(yi) II. По способу выражения показателей времени (ti) III. По способу выражения временных промежутков IV. В зависимости от наличия основной тенденции
1. Ряд из абсолютных величин 1. Интервальный ряд 1. Ряд с равноотстоящими уровнями 1. Стационарные ряды.
2. Ряд из относительных величин 2. Моментный ряд. 2.Ряд с не равноотстоящими уровнями. 2. Нестационарные ряды.
3. Ряд из средних величин.      

I. По способу выражения уровней ряда. Ряды динамики, у которых уровни ряда представляют собой абсолютные величины (значения, характеризующие природные и потребительские свойства изучаемого явления или процесса), относительные величины (удельные веса, темпы роста и другие коэффициенты) и средние величины (результат обобщения какого-нибудь свойства изучаемого явления или процесса). Другими словами уровни ряда выражают количественную оценку (меру) развития во времени изучаемого явления;

II. По способу выражения показателей времени. Интервальный ряд- ряд, составленный из значений признака за периоды, моментный- ряд, составленный из значений признака на определенную дату. В качестве показателей времени выступают либо определенные даты (моменты времени), либо отдельные периоды (годы, кварталы, месяцы, дни), т.е. уровни рядов могут относиться либо к определенным датам, либо к определенным периодам;

III. По способу выражения временных промежутков. Ряды с равноотстоящими уровнями – ряды, между уровнями которых проходит одинаковое количество времени, с неравноотстоящими – разное количество времени;

IV. В зависимости от наличия основной тенденции. Стационарные ряды- ряды, у которых значения признака и дисперсия постоянны и не зависят от времени, нестационарные- все остальные, на практике стационарные ряды встречаются крайне редко.

Графическим изображением ряда динамики являются диаграммы: линейные, столбиковые, ленточные, секторные и фигурные, наиболее часто встречаются столбиковые диаграммы (гистограммы).

Рассмотрим примеры рядов динамики:

1. Объем продаж долларов США на ММВБ, млн. долл.

Дата 09.01.08 11.01.08 12.01.08 13.01.08
 
 

Объем продаж

126,750 124,300 148,800 141,400

На гистограмме проиллюстрированы значения объемов продаж (на оси y) и даты, на которые представлены объемы продаж долларов США на Московской международной валютной бирже (на оси x).

2. Индекс инфляции в текущем году (за период, в % к декабрю предыдущего года)

Период Январь Февраль Март Апрель Май Июнь
Индекс инфляции

В первом примере представлен моментный ряд динамики из абсолютных величин, с неравноотстоящими уровнями, во втором – интервальный, из относительных величин, с равноотстоящими уровнями.

Важнейшим условием правильного построения ряда динамики является сопоставимость всех входящих в него уровней, что достигается либо в процессе сбора данных, либо путем их пересчета. Несопоставимость может возникнуть:

- Вследствие изменений единиц измерения и единиц счета (нельзя сравнивать, например, объемы производства, если они представлены в одни годы в натуральных измерителях, а в другие – в стоимостных), показателей, имеющих разный экономический смысл (например, производство вида продукции, имеющего разное качество: молока разной жирности в литрах и т.д.). В этом случае необходимо выполнить пересчет показателей:

Производство молока молокозаводом в текущем году характеризуется следующими цифрами (в литрах)

Наименование продукции Январь Февраль Март
Молоко, 3,2% жирности
Молоко, 2,5% жирности

Очевидно, что для сопоставимости следует выполнить пересчет, перевести второй вид молока к стандартной жирности, что осуществляется с помощью коэффициента, равного отношению 2,5% к 3,2%, т.е. 0,78, и умножения на него показателей второй строки:

Наименование продукции Январь Февраль Март
Молоко, 3,2% жирности
Молоко, 2,5% жирности

- Вследствие нарушения динамики, которая происходит в результате представления показателей за несопоставимые периоды, которые могут возникать как для показателей, имеющих разный экономический смысл, так и для периодов разной протяженности:

Объемы реализаций магазина «Канцелярские товары»

Наименование товара Предыдущий год 1 кв. текущего года Август текущего года
Тетради, шт.
Ручки, шт.

Здесь очевидной является необходимость представления показателя за одинаковые промежутки времени (например, помесячно или поквартально).

- Вследствие несопоставимости по кругу охватываемых объектов при изменении подчиненности объекта или его изменения (например, реорганизация фирмы). В этом случае требование сопоставимости достигается смыканием рядов динамики.

В 2007 году произошло укрупнение коммерческой фирмы, что отразилось на изменениях объемов товарооборота:

Объем товарооборота, млн.руб.
До реорганизации -
После реорганизации - 622,5
Сопоставимые показатели 604,8 630,0 622,5

Смыкание рядов и возможность сравнивать изменение показателя во времени достигается построением нового ряда (последняя строка таблицы), уровни которого рассчитываются с помощью соотношения двух уровней года реорганизации: 630/450=1,4, а именно

Для изучения показателей динамического ряда существует несколько методов, позволяющих оценивать как абсолютные, так и относительные изменения, обязательным условием изучения является сопоставимость уровней динамических рядов.

6.2. Цепные и базисные показатели в рядах динамики

Для количественной оценки динамики социально-экономических явлений применяются следующие основные показатели: абсолютный прирост, темп роста и прироста. В зависимости от применяемого способа сопоставления показатели динамики могут рассчитываться на постоянной и переменной базах сравнения:

Ø расчет показателей на постоянной базе - сравнение с одним и тем же уровнем (базисным), рассчитанные показатели называют базисными;

Ø расчет показателей на переменной базе – сравнение текущего показателя с предыдущим, рассчитанные показатели называют цепными.

Цепные и базисные показатели рядов динамики

Название показателя Расчетная формула Содержание
А
Абсолютный прирост В абсолютных величинах отличие текущего уровня от базисного или предыдущего (приращение уровня ряда). Если абсолютный прирост положителен, то показатель увеличился, а если отрицателен - уменьшился
Темп и коэффициент роста В относительных величинах сравнение текущего уровня с базисным или предыдущим. Если коэффициент превышает 1 (темп роста 100%), то уровень увеличился, а если менее 1 (темп роста менее 100%), то уменьшился.
Темп прироста В относительных величинах отличие текущего уровня от базисного или предыдущего (на сколько процентов произошел рост или снижение уровня ряда).
Абсолютное значение 1 % прироста Показывает размер уровня ряда, приходящегося на 1 % изменения (темпа прироста).

Пример. Для изучения изменений прибыли предприятия выполнить оценку с помощью цепных и базисных показателей абсолютных и относительных:

Год Прибыль, тыс.руб.
1876,00
1868,20
1898,08

 

Построим расчетную таблицу:

Наименование показателя
1. Прибыль, тыс.руб. 1876,00 1868,20 1898,08
2. Абсолютный прирост      
цепной - 1868,20-1876,00= -7,80 1898,08-1868,20= 29,88
базисный - 1868,20-1876,00= -7,80 1898,08-1876,00= 22,08
3. Темп роста      
цепной - 1868,20/1876,00= 99,58% 1898,08/1868,20= 101,60%
базисный - 1868,20/1876,00= 99,58% 1898,08/1876,00= 101,18%
4. Темп прироста      
цепной - 99,58%-100%=-0,42% 101,60%-100%=1,60%
базисный - 99,58%-100%=-0,42% 101,18%-100%=1,18%
5. Абсолютное значение 1% прироста, тыс.руб. - 18,760 18,682

Столбец «2007» (строки 2-4) заполняется выполнением соответствующих арифметических действий с данными прибыли за 2007 (текущий) и 2006 (предыдущий), эти значения демонстрируют снижение прибыли на 7,8 тыс.руб, что соответствует снижению на 0,42% по сравнению с предыдущим годом ( для цепных и базисных показателей они одинаковы, так как 2006 год является для 2007 одновременно и предыдущим и базисным).

Столбец «2008» (строки 2-4) заполняется выполнением соответствующих арифметических действий с данными прибыли за 2008 (текущий), 2006 (предыдущий) и 2006 (базисный), эти значения столбца показывают для цепных показателей рост прибыли на 29,88 тыс.руб. (на 1,6%) и для базисных – рост на 22,08 тыс.руб. (1,18%). Абсолютное значение 1% прироста показывает в столбце «2007» 18,76 тыс.руб. на 1% снижения, а в столбце «2008» – 18,862 тыс.руб. на 1% роста прибыли.