рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Коэффициент корреляции, коэффициент детерминации, корреляционное отношение

Коэффициент корреляции, коэффициент детерминации, корреляционное отношение - раздел Экономика, Курс лекций по дисциплине Эконометрика. В последнее время специалисты Для Трактовки Линейной Связи Между Двумя Переменными Акцентируют Внимание На ...

Для трактовки линейной связи между двумя переменными акцентируют внимание на коэффициенте корреляции.

Пусть имеется выборка наблюдений (Xi, Yi), i=1,...,n, которая представлена на диаграмме рассеяния, именуемой также полем корреляции (рис. 2.3).

 

Y

 

 


X

 

Рис. 2.3. Диаграмма рассеяния

 

Разобьем диаграмму на четыре квадранта так, что для любой точки P(Xi, Yi) будут определены отклонения

Ясно, что для всех точек I квадранта xiyi>0; для всех точек II квадранта xiyi<0; для всех точек III квадранта xiyi>0; для всех точек IV квадранта xiyi<0. Следовательно, величина åxiyi может служить мерой зависимости между переменными X и Y. Если большая часть точек лежит в первом и третьем квадрантах, то åxiyi>0 и зависимость положительная, если большая часть точек лежит во втором и четвертом квадрантах, то åxiyi<0 и зависимость отрицательная. Наконец, если точки рассеиваются по всем четырем квадрантам åxiyi близка к нулю и между X и Y связи нет.

Указанная мера зависимости изменяется при выборе единиц измерения переменных X и Y. Выразив åxiyi в единицах среднеквадратических отклонений, получим после усреднения выборочный коэффициент корреляции:

(2.9)

Из последнего выражения можно после преобразований получить следующую формулу для квадрата коэффициента корреляции:

или

(2.10)

Квадрат коэффициента корреляции называется коэффициентом детерминации. Согласно (2.10) значение коэффициента детерминации не может быть больше единицы, причем это максимальное значение будет достигнуто при =0, т.е. когда все точки диаграммы рассеяния лежат в точности на прямой. Следовательно, значения коэффициента корреляции лежат в числовом промежутке от -1 до +1.

Кроме того, из (2.10) следует, что коэффициент детерминации равен доле дисперсии Y (знаменатель формулы), объясненной линейной зависимостью от X (числитель формулы). Это обстоятельство позволяет использовать R2 как обобщенную меру "качества" статистического подбора модели (2.6). Чем лучше регрессия соответствует наблюдениям, тем меньше и тем ближе R2 к 1, и наоборот, чем "хуже" подгонка линии регрессии к данным, тем ближе значение R2 к 0.

Поскольку коэффициент корреляции симметричен относительно X и Y, то есть rXY=rYX, то можно говорить о корреляции как о мере взаимозависимости переменных. Однако из того, что значения этого коэффициента близки по модулю к единице, нельзя сделать ни один из следующих выводов: Y является причиной X; X является причиной Y; X и Y совместно зависят от какой-то третьей переменной. Величина r ничего не говорит о причинно-следственных связях. Эти вопросы должны решаться, исходя из содержательного анализа задачи. Следует избегать и так называемых ложных корреляций, т.е. нельзя пытаться связать явления, между которыми отсутствуют реальные причинно-следственные связи. Например, корреляция между успехами местной футбольной команды и индексом Доу-Джонса. Классическим является пример ложной корреляции, приведенный в начале ХХ века известным российским статистиком А.А. Чупровым: если в качестве независимой переменной взять число пожарных команд в городе, а в качестве зависимой переменной – сумму убытков от пожаров за год, то между ними есть прямая корреляционная зависимость, т.е. чем больше пожарных команд, тем больше сумма убытков. На самом деле здесь нет причинно-следственной связи, а есть лишь следствия общей причины – величины города.

Проверка гипотезы о значимости выборочного коэффициента корреляции эквивалентна проверке гипотезы о b=0 (см. ниже) и, следовательно, равносильна проверке основной гипотезы об отсутствии линейной связи между Y и X. Вычисляя значение t-статистики

,

вывод о значимости r делается при |t|>te, где te - соответствующее табличное значение t-распределения с (n-2) степенями свободы и уровнем значимости e.

Пример. Вычислим коэффициент корреляции и проверим его значимость для нашего примера табл. 2.1.

По (2.9) r=43145/(46510×40068,25)0,5=0,9994. R2=0,998. Значение t-статистики t=0,9994×[10/(1-0,998)]0,5=70,67. Поскольку t0,05;10=2,228, то t>t0,05;10 и коэффициент корреляции значим. Следовательно, можно считать, что линейная связь между переменными Y и X в примере существует. Ñ

Если между переменными имеет место нелинейная зависимость, то коэффициент корреляции теряет смысл как характеристика степени тесноты связи. В этом случае используется наряду с расчетом коэффициента детерминации расчет корреляционного отношения.

Предположим, что выборочные данные могут быть сгруппированы по оси объясняющей переменной X. Обозначим s – число интервалов группирования, (j=1,…,s) – число выборочных точек, попавших в j-й интервал группирования, - среднее значение ординат точек, попавших в j-й интервал группирования, - общее среднее по выборке. С учетом формул для оценок выборочных дисперсий среднего значения Y внутри интервалов группирования и суммарной дисперсии результатов наблюдения получим:

. (2.11)

Величину в (2.11) называют корреляционным отношением зависимой переменной Y по независимой переменной X. Его вычисление не предполагает каких-либо допущений о виде функции регрессии.

Величина по определению неотрицательная и не превышает единицы, причем =1 свидетельствует о наличии функциональной связи между переменными Y и X. Если указанные переменные не коррелированны друг с другом, то =0.

Можно показать, что не может быть меньше величины коэффициента корреляции r (формула (2.9)) и в случае линейной связи эти величины совпадают.

Это позволяет использовать величину разности R2 в качестве меры отклонения регрессионной зависимости от линейного вида.

 

– Конец работы –

Эта тема принадлежит разделу:

Курс лекций по дисциплине Эконометрика. В последнее время специалисты

Введение... В последнее время специалисты обладающие знаниями и навыками проведения прикладного экономического анализа с...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Коэффициент корреляции, коэффициент детерминации, корреляционное отношение

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Взаимосвязь эконометрики с экономической теорией, статистикой и экономико-математическими методами
Эконометрика не только выявляет объективно существующие экономические законы и связи между экономическими показателями, качественно определенными в экономической теории, но и формирует подходы к их

Области применения эконометрических моделей
Области применения эконометрических моделей напрямую связаны с целями эконометрического моделирования, основными из которых являются: 1) прогноз экономических и социально-экономичес

Методологические вопросы построения эконометрических моделей
В любой эконометрической модели, в зависимости от конечных прикладных целей ее использования все участвующие в ней переменные подразделяются на: - экзогенные переменные, зада

Основные цели и задачи прикладного корреляционно-регрессионного анализа
Рассмотрим некоторый экономический объект (процесс, явление, систему) и выделим только две переменные, характеризующие объект. Обозначим переменные буквами Y и X. Будем предполагать,

Постановка задачи регрессии
Поставим задачу регрессии Y на X. Пусть мы располагаем n парами выборочных наблюдений над двумя переменными X и Y:

Парная регрессия и метод наименьших квадратов
Будем предполагать в рамках модели (2.2) линейную зависимость между двумя переменными Y и X. Т.е. имеем модель парной регрессии в виде: Yi =a+

Оценка статистической значимости регрессии
Перейдем к вопросу о том, как отличить "хорошие" оценки МНК от "плохих". Конечно, предполагается, что существуют критерии качества рассчитанной линии регрессии. Перечис

Интерпретация уравнения регрессии
Проанализируем, какую информацию дает нам оцененное уравнение регрессии (2.6), т.е. поставим вопрос об интерпретации (содержательном объяснении) коэффициентов уравнения. Во-первых,

Предположения модели
Пусть мы располагаем выборочными наблюдениями над k переменными Yi и , j=1,..., k,

Методом наименьших квадратов
Применяя к (3.1) с учетом (3.2)-(3.5) МНК, получаем из необходимых условий минимизации функционала: , т.

Парная и частная корреляция в КЛММР
В случаях, когда имеется одна независимая и одна зависимая переменные, естественной мерой зависимости (в рамках линейного подхода) является выборочный (парный) коэффициент корреляции между ними.

И множественный коэффициент детерминации
Множественный коэффициент корреляции используется в качестве меры степени тесноты статистической связи между результирующим показателем (зависимой переменной) y и набором объясняющих

Оценка качества модели множественной регрессии
Проверка качества модели множественной регрессии может быть осуществлена с помощью дисперсионного анализа. Как уже было отмечено (см. 2.5), сумма квадратов отклонений от среднего в выборке

Мультиколлинеарность и методы ее устранения
Одним из важнейших этапов построения регрессии является отбор факторов , j=1,..., k, i=1,2,…,n

Спецификация уравнения регрессии и ошибки спецификации
  При построении эконометрической модели исследователь специфицирует составляющие ее соотношения, выбирает переменные, входящие в эти соотношения, а также определяет вид математическо

Обобщенный метод наименьших квадратов
Обобщим КЛММР вида (3.1). Пусть по-прежнему мы располагаем выборочными наблюдениями над k переменными Yi и

С гетероскедастичными остатками
Довольно часто при построении регрессии анализируемые объекты неоднородны, например, при исследовании структуры потребления домохозяйств естественно ожидать, что колебания в структуре будут выше дл

Проверка гомоскедастичности дисперсии по критерию Бартлетта
Y Ошибка ei ei2 Y Ошибка ei ei

С автокорреляцией остатков
Вернемся еще раз к предположению (3.3). Из него, в частности, следует, что ковариации случайной ошибки для разных наблюдений равны нулю. Если к тому же случайные ошибки распределены нормально, то э

Фиктивные переменные. Тест Чоу
Факторы (объясняющие переменные), применяемые в задаче регрессии до сих пор, принимали значения из некоторого непрерывного интервала. Иногда может понадобиться ввести в модель переменные, значения

Данные для расчета модели с фиктивной переменной
X

Специфика временных рядов
Часто исследователь имеет дело с данными в виде временных рядов. Совокупность наблюдений анализируемой величины

Проверка гипотезы о существовании тренда
Для выявления факта наличия или отсутствия неслучайной составляющей f(t), то есть для проверки гипотезы о существовании тренда - Н0: Еy(t

Аналитическое выравнивание временных рядов, оценка параметров уравнения тренда
Метод обработки временных рядов, целями которого является устранение случайных колебаний и построение аналитической функции, характеризующей зависимость уровней ряда от времени – тренда, называется

Метод последовательных разностей
Часто при аналитическом выравнивании ряда используется модель тренда в виде полинома. Для определения порядка аппроксимирующего полинома в этом случае выделения тренда широко используется

Аддитивная и мультипликативная модели временного ряда
Простейшим подходом к моделированию временных рядов, содержащих сезонные колебания, является построение аддитивной или мультипликативной моделей временного ряда. Выбор одной из этих моделе

Модели стационарных и нестационарных временных рядов и их идентификация
Модели авторегрессии порядка p (AutoRegressive - AR(p) models). Достаточно часто экономические показатели, представлен

Тестирование стационарности временного ряда
Как было отмечено выше, стационарные временные ряды имеют следующие отличительные черты: значения ряда колеблются вокруг постоянного среднего значения с постоянной дисперсией, которая не зависит от

Эконометрический анализ взаимосвязанных временных рядов
Коинтеграция и мнимая регрессия. Рассмотрим два временных ряда yt и xt. Предположим, что оба ряда имеют единичные корни, то есть

Библиографический список
  1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. М.: ЮНИТИ, 1998. 1022 с. 2. Джонстон Дж. Эконометрические методы.- М.: Статис

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги