рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Тема 11. Статистическая связь между явлениями

Тема 11. Статистическая связь между явлениями - раздел Связь, Тема 11. Статистическая связь между явлениями Применение Метода Корреляционного Анализа Дает Возможность Выражать Связь Меж...

Применение метода корреляционного анализа дает возможность выражать связь между признаками аналитически в виде уравнения и исчислить меру тесноты связи.

Построение моделей взаимосвязей включает ряд этапов.

1. Предварительный априорный анализ изучаемого явления.

2. Сбор исходных данных и их первичная статистическая обработка.

3. Построение статистических моделей (уравнений регрессии).

4. Проверка значимости регрессионной модели.

5. Экономическая интерпретация полученных результатов.

6. Использование полученных данных на практике.

Допустим, что после предварительного анализа предполагают наличие линейной связи между изучаемыми явлениями. Поэтому для выражения аналитической зависимости между у – зависимой случайной величиной и х1, х2, х3, – независимыми случайными величинами мы выбираем модель следующего вида:

, (1)

где u – случайная компонента.

Оценкой этой модели является следующее уравнение:

, (2)

где bi – оценка параметра bi при i = 0; 1; 2; 3.

Термин "оценка" применяется, чтобы подчеркнуть тот факт, что рассчитанные показатели лишь приближаются к реальным, истинным значениям этих параметров в генеральной совокупности. Ошибки (отклонения) возникают вследствие действия ряда факторов: расчетов на основе выборочных данных, действия неучтенных факторов, издержек математических выкладок.

Для исчисления , как известно, может быть использован метод наименьших квадратов:

, (3)

где n – число наблюдений.

Дифференцируя (3) по , получаем соответственно (k+1) уравнений, которые называют нормальными, где k – число независимых переменных х (в нашем примере k = 3).

(4)

Однако студентам следует обратить особое внимание на то, что такое оценивание не исчерпывает всего содержания корреляционно-регрессионного анализа. Это лишь один из этапов. Не менее важная задача состоит в том, чтобы определить насколько "хороши" полученные уравнения регрессии: дело в том, что методологически с помощью уравнений мы всегда можем определить оценки параметров bi, даже если вид и форма связи выбраны неверно, а исходный материал точно характеризует генеральную совокупность. "Отсюда следует, что никто не может полагаться на результаты регрессионного анализа до тех пор, пока он не научится отличать “хорошие оценки от плохих”"[1][1]. Для решения этой задачи в статистике используют методы дисперсионного анализа и проверяют, существенно ли вектор b () отличается от нулевого вектора, то есть проверяют гипотезу H0:bi = 0 против гипотезы H1:bi ¹ 0 (хотя бы один параметр). Необходимость таких действий объясняется следующим.

Составление регрессионных моделей – не самоцель, важна отдача от их практического использования в финансовой и кредитной работе, в частности. Эффективность модели тем выше, чем больше вклад систематической компоненты в определении y (см. (1)) и чем ниже вклад случайной компоненты (неопределенной в ходе данного исследования ошибки). Формально это влияет следующим образом: чем меньше дисперсия случайной составляющей, тем более значима систематическая составляющая. Поскольку в генеральной совокупности нет таких характеристик, как ошибки, то их оценками могут выступать отклонения вычисленных по уравнению от значения у в генеральной совокупности:

. (5)

Если сумму квадратов отклонений у от его среднего уровня разбить на два слагаемых:

1. – сумма квадратов отклонений, рассчитанных по уравнению регрессии от среднего уровня. (Это слагаемое имеет место, потому что выравненные значения уравнений у по х, т.е. отличаются от среднего уровня именно вследствие влияния признаков х, то есть эти разности – результат действия факторов х на результативный признак у).

2. – сумма квадратов отклонений у от линии регрессии. Эта величина характеризует влияние на результативный признак у прочих неучтенных в данном случае факторов. Это и есть рассмотренная ранее доля влияния случайной компоненты.

Таким образом получим:

,

. (6)

Видно, что (5) входит составной частью в сумму (6). Поскольку если гипотеза о равенстве bi = 0 верна, то и Qr близко к 0. Таким образом, для оценки существенности случайной компоненты удобно использовать критерий:

,

,

.

Данная величина имеет распределение Фишера с числом степеней свободы V1 = K для числителя (в данном примере по числу независимых х); V2= n – (K+1) для знаменателя (n – численность совокупности).

В нашем случае Qост оценивается через отклонение у от выравненного. Ошибки (отклонения) уже не являются независимыми в полном объеме, так как они рассчитываются после решения (К + 1) нормального уравнения. Таким образом, линейно независимы только n – (K + 1) суммы квадратов отклонений. По определению степень свободы характеризует количество свободно варьирующих элементов совокупности. Если совокупность n связана линейными соотношениями так, что зная (n – K) из них можно определить остальные К, то число степеней свободы у данной совокупности равно (n – K), следовательно, для нашего примера могут быть рассчитаны линейно независимо только n – (K + 1) суммы квадратов ошибок.

Характеристики выборочного распределения F-статистики (Fкрит) рассчитаны и приводятся в специальных таблицах. "Входами" в эти таблицы служат степени свободы V1 и V2, а также уровень значимости a. Уровень значимости определяет вероятность ошибки первого рода, то есть отвергнута правильная гипотеза. Уровень значимости обычно выбирают 0,05; 0,01. При первом уровне значимости вероятность принятия правильной гипотезы выше (95%), чем при следующем (99%).

Нулевая гипотеза (H0) отвергается, если Fнабл > Fкрит. Следовательно, Fнабл попала в критическую область, которая включает все значения F больше определенного критического, переломного Fкрит. Попадание F-статистики в эту область имеет вероятность, соответствующую уровню значимости.

Если гипотеза H0 отвергается, это значит, что уравнение регрессии в целом значимо и необходимо приступить к следующим этапам регрессионного анализа. Если H0 не отвергается, то все коэффициенты принимаются равными 0 и проверка заканчивается.

Рассмотрим применение приемов корреляционного анализа на конкретном примере.

– Конец работы –

Эта тема принадлежит разделу:

Тема 11. Статистическая связь между явлениями

Таблица Стоимость основных фондов и выпуск продукции по группе заводов Для определения формы... Таблица Группы семей со среднедушевым совокупным доходом в... Расходы на питание выберем в качестве результативного признака у уровень среднедушевого совокупного дохода в...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Тема 11. Статистическая связь между явлениями

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Стоимость основных фондов и выпуск продукции по группе заводов
Номер завода Стоимость основных фондов, млн руб. х Выпуск продукции, млн руб. у х×у х

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги