Понятие о регрессионном анализе

 

При рассмотрении взаимосвязей, как правило, рассматривают одну из величин (X) как независимую (объясняющую), а другую (Y) как зависимую (объясняемую). При этом изменение первой из них может служить причиной изменения другой. Например, рост дохода ведет к увеличению потребления; рост цены – к снижению спроса; снижение процентной ставки увеличивает инвестиции и т.д. Эта зависимость не является однозначной в том смысле, что каждому конкретному значению объясняющей переменой X может соответствовать не одно, а множество значений Y. Другими словами, каждому конкретному значению независимой переменной соответствует некоторое вероятностное распределение зависимой переменной. Поэтому анализируют, как объясняющая переменная (или переменные) влияет (или влияют) на зависимую переменную "в среднем". Зависимость такого типа, выражаемая соотношением

называется функцией регрессии Y на X. При рассмотрении зависимости двух случайных величин говорят о парной регрессии.

Зависимость нескольких переменных, выражаемую функцией

называют множественной регрессией.

Под регрессией понимается функциональная зависимость между объясняющими переменными и условным математическим ожиданием (средним значением) зависимой переменной Y, которая строится с целью предсказания (прогнозирования) среднего значения Y при некоторых значениях независимых переменных.

Установление формы зависимости и оценка параметров функции регрессии являются задачами регрессионного анализа.

Так как реальные значения зависимой переменной могут быть различными при данном X (или ), зависимость должна быть дополнена некоторым слагаемым e, которое, по существу, является случайной величиной. Получающиеся в результате соотношения

или

называются регрессионнымиуравнениями (или моделями).

Построение уравнения регрессии, описывающего эмпирические данные, включает три этапа:

 

· выбор формулы уравнения регрессии;

· определение параметров выбранного уравнения;

· анализ качества уравнения и проверка адекватности уравнения эмпирическим данным и, при необходимости, совершенствование уравнения.

 

В случае парной регрессии выбор уравнения обычно осуществляется по графическому изображению реальных статистических данных - корреляционному полю.

 

Рис.1 Корреляционные поля. А) – линейная регрессия; Б) – квадратичная регрессия; В) – отсутствие выраженной связи Y и X.