1) В прямоугольной системе координат строим график зависимости переменных и . Для удобства для каждой из переменных выделим по пять интервалов изменения этих переменных, используя формулы:
и .
Для переменной получим
Длину интервала округлим в сторону увеличения, т.е. положим .
В результате получим следующие границы интервалов:
33; 49; 65; 81; 97; 113.
Аналогичные расчеты производим для переменной :
Границы интервалов составят: 13; 18; 23; 28; 33; 38.
На график наносим точки , координаты которых соответствуют значениям переменных и .
Рис.5
Визуально анализируя характер расположения точек на графике (рис.5), приходим к выводу (высказываем гипотезу), что связь между переменными и может быть выражена линейным уравнением регрессии:
2) Параметры уравнения регрессии находим методом наименьших квадратов, путем составления и решения системы нормальных уравнений
решив которую, получаем
; .
Если воспользоваться средними значениями переменных эти уравнения упрощаются к виду:
Подставив все суммы в систему уравнений и, учитывая, что n=15, получим
Решив систему, получим:
Таким образом, уравнение регрессии на имеет вид:
На практике, для удобства, при нахождении уравнений регрессии составляется следующая вспомогательная таблица:
Если в уравнении регрессии подставить фактические значения переменной , то определяются возможные (теоретические) значения переменной , которые наносятся на график прямой регрессии. Одна из таких точек отмечена крестиком на графике (рис 5).
Для того чтобы раскрыть содержательную сторону всех численных характеристик и корреляционной зависимости, придаем переменным и следующий смысл:
— общая площадь квартиры, кв.м.;
— рыночная стоимость квартиры, тыс. у. е.
Анализируется зависимость этих переменных по выборочным данным о стоимости квартир (в некотором городе, в некоторый промежуток времени) и общей их площади.
В этом пункте установлено, что форму связи (линии регрессии на ) можно считать линейной. Определенный коэффициент регрессии переменным показывает, что при увеличении общей площади квартиры на 1 стоимость квартиры в среднем увеличивается на 0,3018 тыс.у.е. или на 301,8 у.е.
3) Качество уравнения регрессии оценивается с помощью средней ошибки аппроксимации:
В нашем случае:
Это означает, что фактические значения стоимости квартир от расчетных по уравнению регрессии в среднем различаются на 9,031%.
Качество уравнения регрессии считается хорошим, если ошибка аппроксимации не превышает 8-10%. С учетом полученных данных можно считать, что предложенное уравнение регрессии вполне адекватно описывает статистическое распределение.
По средним значениям признаков и полученного коэффициента регрессии мы можем предсказать на сколько в среднем возрастет стоимость квартиры, если ее площадь увеличится на 1%.
При этом мы воспользуемся таким параметром . В нашем случае он равен . Это означает, что при увеличении площади квартиры на 1% ее стоимость в среднем возрастет на 0,806%.
4) При линейной зависимости, степень тесноты связи между переменными и определяется с помощью коэффициента корреляции , где - средние квадратические отклонения по и рассчитываем по формулам:
Так как , то между признаками связь очень тесная, близкая к линейной функциональной.
Коэффициент детерминации показывает, что 85% различий в стоимости квартир объясняется вариацией их общей площади, а 15% - другими, неучтенными факторами (месторасположение квартир, их благоустроенность и др.).
5) Так как исходные данные представляют собой случайную выборку, то необходимо оценить значимость коэффициента корреляции.
Выдвигаем нулевую гипотезу – изучаемый фактор – переменная не оказывает существенного влияния на , т.е. проверим гипотезу при .
Для проверки нулевой гипотезы применим t-критерий Стьюдента. Найдем его расчетное значение:
На ,
где согласно таблице значений.
Т.к. , то коэффициент регрессии статистически значим. Подтверждается вывод о значимости влияния площади на стоимость квартир.
6) Статистическая надежность уравнения регрессии проверяется с использованием критерия F-Фишера.
Расчетное (фактическое) значение F-критерия для линейного уравнения регрессии находится по формуле:
При уровне значимости и числе степеней свободы по таблице находится .
Так как ,то уравнение статистически значимое или надежное.
7) Прогнозное значение определяется путем подстановки в уравнение регрессии прогнозного значения , признака .
По условию .
Тогда прогнозное значение стоимости квартиры составит
Значит, при общей площади квартиры 98,5 кв.м возможная ее стоимость 34,5 тыс.у.е.