Решение.

1) В прямоугольной системе координат строим график зависимости переменных и . Для удобства для каждой из переменных выделим по пять интервалов изменения этих переменных, используя формулы:

и .

Для переменной получим

Длину интервала округлим в сторону увеличения, т.е. положим .

В результате получим следующие границы интервалов:

33; 49; 65; 81; 97; 113.

Аналогичные расчеты производим для переменной :

Границы интервалов составят: 13; 18; 23; 28; 33; 38.

На график наносим точки , координаты которых соответствуют значениям переменных и .

 

 

Рис.5

 

Визуально анализируя характер расположения точек на графике (рис.5), приходим к выводу (высказываем гипотезу), что связь между переменными и может быть выражена линейным уравнением регрессии:

 

2) Параметры уравнения регрессии находим методом наименьших квадратов, путем составления и решения системы нормальных уравнений

 

решив которую, получаем

; .

Если воспользоваться средними значениями переменных эти уравнения упрощаются к виду:

 

Подставив все суммы в систему уравнений и, учитывая, что n=15, получим

 

Решив систему, получим:

 

Таким образом, уравнение регрессии на имеет вид:

 

На практике, для удобства, при нахождении уравнений регрессии составляется следующая вспомогательная таблица:

         
         
         
         
         
         

Если в уравнении регрессии подставить фактические значения переменной , то определяются возможные (теоретические) значения переменной , которые наносятся на график прямой регрессии. Одна из таких точек отмечена крестиком на графике (рис 5).

Для того чтобы раскрыть содержательную сторону всех численных характеристик и корреляционной зависимости, придаем переменным и следующий смысл:

— общая площадь квартиры, кв.м.;

— рыночная стоимость квартиры, тыс. у. е.

Анализируется зависимость этих переменных по выборочным данным о стоимости квартир (в некотором городе, в некоторый промежуток времени) и общей их площади.

В этом пункте установлено, что форму связи (линии регрессии на ) можно считать линейной. Определенный коэффициент регрессии переменным показывает, что при увеличении общей площади квартиры на 1 стоимость квартиры в среднем увеличивается на 0,3018 тыс.у.е. или на 301,8 у.е.

3) Качество уравнения регрессии оценивается с помощью средней ошибки аппроксимации:

 

В нашем случае:

 

Это означает, что фактические значения стоимости квартир от расчетных по уравнению регрессии в среднем различаются на 9,031%.

Качество уравнения регрессии считается хорошим, если ошибка аппроксимации не превышает 8-10%. С учетом полученных данных можно считать, что предложенное уравнение регрессии вполне адекватно описывает статистическое распределение.

По средним значениям признаков и полученного коэффициента регрессии мы можем предсказать на сколько в среднем возрастет стоимость квартиры, если ее площадь увеличится на 1%.

При этом мы воспользуемся таким параметром . В нашем случае он равен . Это означает, что при увеличении площади квартиры на 1% ее стоимость в среднем возрастет на 0,806%.

4) При линейной зависимости, степень тесноты связи между переменными и определяется с помощью коэффициента корреляции , где - средние квадратические отклонения по и рассчитываем по формулам:

 

 

 

Так как , то между признаками связь очень тесная, близкая к линейной функциональной.

Коэффициент детерминации показывает, что 85% различий в стоимости квартир объясняется вариацией их общей площади, а 15% - другими, неучтенными факторами (месторасположение квартир, их благоустроенность и др.).

5) Так как исходные данные представляют собой случайную выборку, то необходимо оценить значимость коэффициента корреляции.

Выдвигаем нулевую гипотезу – изучаемый фактор – переменная не оказывает существенного влияния на , т.е. проверим гипотезу при .

Для проверки нулевой гипотезы применим t-критерий Стьюдента. Найдем его расчетное значение:

На ,

где согласно таблице значений.

Т.к. , то коэффициент регрессии статистически значим. Подтверждается вывод о значимости влияния площади на стоимость квартир.

6) Статистическая надежность уравнения регрессии проверяется с использованием критерия F-Фишера.

Расчетное (фактическое) значение F-критерия для линейного уравнения регрессии находится по формуле:

 

При уровне значимости и числе степеней свободы по таблице находится .

Так как ,то уравнение статистически значимое или надежное.

7) Прогнозное значение определяется путем подстановки в уравнение регрессии прогнозного значения , признака .

По условию .

Тогда прогнозное значение стоимости квартиры составит

Значит, при общей площади квартиры 98,5 кв.м возможная ее стоимость 34,5 тыс.у.е.