Результаты регрессионного анализа

 
 

В диапазоне ячеек В4:В8 рисунка 16 расположены данные регрессионной статистики. В ячейке В4 находится коэффициент детерминированности равный 0,96, который вычисляется сравнением реальных данных и значений полученного уравнения. Если этот коэффициент близок к единице, то существует хорошая корреляция данных с уравнением.

В ячейке В5 находится коэффициент корреляции 0,92 равный квадратному корню из коэффициента детерминированности. Полученный коэффициент также близок к единице.

В ячейке В7 находится стандартная ошибка предсказания данных по уравнению 3,59. С учетом фактических значений давления эта ошибка составляет несколько процентов.

В диапазоне А11:F14 расположены результаты дисперсионного анализа регрессионных данных.

В столбце F находится значение F-статистики, а в ячейке F12 вероятность того, что предлагаемое регрессионное уравнение не подходит для описания данных. Полученная вероятность 0,009 показывает, что, скорее всего регрессионное уравнение удачно описывает зависимость давления от температуры.

В ячейках В17, В18 в столбце Коэффициенты находятся коэффициенты уравнения, то есть регрессионное уравнение имеет вид: p = 6,45*t+13, где p – давление, t- температура.

Корреляционный анализ

Сопряженность между переменными величинами X и Y можно установить, сопоставляя значения одной из них со значениями другой. Связь между величинами может иметь однозначный, функциональный характер, когда каждому значению независимой переменной Х можно поставить в соответствие определенное значение зависимой переменной Y. Однако такого рода связи между переменными встречаются далеко не всегда. Например, зависимость между биологическими признаками, например, ростом и массой тела. Хотя между этими показателями имеется положительная связь, однако, из этого правила существуют исключения. Причина таких исключений заключается в том, что каждый биологический признак представляет собой функцию ни одного, а многих переменных. Зависимость между такими признаками носит не функциональный, а статистический характер и называется корреляционной зависимостью. Корреляционная связь между признаками может быть линейной и нелинейной, положительной и отрицательной. Значение коэффициента корреляции может находиться в пределах от -1 до +1.

Корреляционный анализ дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (корреляция близка к нулю). При положительной связи коэффициент корреляции имеет знак “+” и находится в пределах от 0 до 1.

Для вычисления коэффициента корреляции между двумя наборами данных используется статистическая функция КОРРЕЛ или программа Корреляция,входящая вПакет анализа.

В таблице приведены средние баллы контрольных работ по химии и биологии.

химия биология
3,1 3,65
3,17 3,11
3,76 3,57
3,61 3,61
3,27 3,44
3,61 3,71
3,8 3,61
3,65 3,98
3,34 3,36
3,65 3,89
3,45 3,45
4,05 3,79

Рисунок 17

Для вычисления коэффициента корреляции вводим данные в таблицу и вызываем программуКорреляция.В диалоговом окне указываем диапазон входного интервала и адрес верхней левой ячейки выходного интервала. Значения коэффициента корреляции для приведенных данных равно 0,597688.

КОНТРОЛЬНЫЕ ВОПРОСЫ.

1. Какой командой открывается список программ, входящих в пакет анализа данных?

2. Какие статистические характеристики могут быть рассчитаны с помощью программы Описательная статистика?

3. Какая из программ Пакета анализа применима для оценки эффективности экспериментальной работы, проведенной в одной группе?

4. В каких случаях применим однофакторный дисперсионный анализ?

5. Для чего используется регрессионный анализ?

6. Какая связь между признаками называется корреляционной?

7. В каких пределах находится коэффициент корреляции при положительной связи между признаками?

ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ.

1. В группе проводился эксперимент с целью повышения уровня ориентации на художественно-эстетические ценности. С целью проверки эффективности этой работы до и после проведения эксперимента проводилось тестирование. В таблице приведены результаты тестирования

Ученики Баллы
  до эксперимента после эксперимента
Иванов
Новиков
Сидоров
Пирогов
Агапов
Суворов
Рыжиков
Топоров
Серов
Быстров
       

Получить статистический отчет по приведенным экспериментальным данным с помощью программы Описательная статистика,оценить эффективность проведенной работы.

2. На учебно-опытном участке агростанции изучали влияние различных способов внесения в почву органических удобрений на урожай кукурузы. Опыт проводили в трех вариантах, не считая контроля. Каждый вариант имел трехкратную повторность. Результаты приведены в таблице.

Варианты опыта Урожай по повторностям Средний урожай
   
контроль 21,2 28,0 31,2 26,8
ниже семян на 4 см 23,6   22,6 28,0 24,7
в стороне от семян на 4 см 24,0 30,0 29,2   27,7
выше семян на 4 см 29,2 28,0 27,0 28,1

Оценить влияние фактора (место внесения удобрения) на урожайность.

3. В таблице приведены данные, собранные для оценки связи между коэффициентом IQ, определенным по шкале Стенфорда-Бине в шестом классе, и успеваемостью по химии в средней школе.

Номер учащегося Оценка IQ(X) Оценка успеваемости(Y)  
 
 
 
 
 
 
 
 
 
 
 
 

На основании приведенных данных вычислить коэффициент корреляции.

4.Найти уравнение регрессии, выражающее зависимость оценки по математике от IQ.

ЛАБОРАТОРНАЯ РАБОТА №12