Использование функций регрессии

В Excel имеется 5 функций для линейной регрессии (ЛИНЕЙН(...), ТЕНДЕНЦИЯ(...), ПРЕДСКАЗ(...), НАКЛОН(...), СТОШУХ(...)) и 2 функции дня экспоненциальной регрессии - ЛГРФПРИБЛ(...) и POCT(...). Рассмотрим некоторые из них.

1 Функция =ЛИНЕЙН(изв._знач._y;изв. _знач.x;конст;стат)(5)

вычисляет коэффициентm и постоянную b для уравнения прямой (1).

Известные_значения_y и известные_значения_x - это множество значений y и необязательное множество значений x (их вводить необязательно), которые уже известны для соотношения (1).

Константа-это логическое значение , которое указывает требуется ли, чтобы константа b была равна 0. Если константа имеет значение ИСТИНА или опущено, то b вычисляется обычным образом.

Статистика-это логическое значение, которое указывает, требуется ли вывести дополнительную статистику по регрессии.

Если статистика имеет значение ЛОЖЬ(или 0),то функция ЛИНЕЙН возвращает только значения коэффициентов m и b, в противном случае выводится дополнительная регрессионная статистика в виде табл.1:

Таблица 1

mn mn-1 ... m2 m1 b
sen sen-1 ... se2 se1 seb
r2 sev ... #Н/Д #Н/Д #Н/Д
F df ... #Н/Д #Н/Д #Н/Д
ssreg ssresid ... #Н/Д #Н/Д #Н/Д

где

se1,se2,...,sen - стандартные значения ошибок для коэффициентов m1,m2,...,mn.

seb - стандартное значение ошибки для постоянной b (seb равно #Н/Д, т.е. «нет допустимого значения», если конст. имеет значение ЛОЖЬ).

r2 - коэффициент детерминированности. Сравниваются фактические значения y и значения, получаемые из уравнения прямой; по результатам сравнения вычисляется коэффициент детерминированности, нормированный от 0 до 1. Если он равен 1, то имеет место полная корреляция с моделью, т.е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y.

sey - стандартная ошибка для оценки y(предельное отклонение для у).

 

F - F-статистика, или F-наблюдаемое значение. F-статистика используется для определения того, является ли наблюдаемая взаимосвязь между зависимой и независимой переменными случайной или нет.

df - cтепени свободы. Степени свободы полезны для нахождения F-критических значений в статистической таблице. Для определения уровня надежности модели нужно сравнить значения в таблице с F-статистикой, возвращаемой функцией ЛИНЕЙН.

ssreg - регрессионая сумма квадратов.

ssresid - oстаточная сумма квадратов.

#Н/Д – ошибка, означающая “Нет доступного значения”.

· Любую прямую можно задать ее наклоном mи y-пересечением:

Наклон (m):

Для того, чтобы определить наклон прямой, обычно обозначаемый через m, нужно взять две точки прямой (x1,y1) и (x2,y2); тогда наклон равен m = (y2 - y1)/(x2 - x1).

y-пересечение (b):

y-пересечением прямой, обычно обозначаемым через b, является значение y для точки, в которой прямая пересекает ось y.

Уравнение прямой имеет вид y = mx + b. Если известны значения m и b, то можно вычислить любyю точку на прямой, подставляя значения y или x в уравнение. Можно также использовать функцию ТЕНДЕНЦИЯ (см. ниже).

· Если для функции уимеется только одна независимая переменная x, можно получить наклон и y-пересечение непосредственно, используя следующие формулы:

2 Наклон m: