Выборочный коэффициент корреляции компонент X и Y двумерной случайной величиной (X, Y) выборочной совокупности объемом n рассчитывается по формуле
где – выборочное среднее для вариант (наблюдавшихся различных дискретных значений) xi компоненты X ( - сумма по индексу i произведений вариант x = xi на соответствующие частоты этих вариант nx); – выборочная средняя вариант y = yj на соответствующие частоты этих вариант ny; ( – сумма по паре индексов ij произведений xi×yj на соответствующие частоты этих пар вариант nxy); – выборочные дисперсии компонент X и Y соответственно;
Выборочное линейное уравнение регрессии Y на X имеет вид
,
где – выборочной коэффициент регрессии Y и X; ; a + bx – линейное приближение условного среднего выборочного , то есть среднего значения случайной переменной Y при условии, что случайная компонента X принимает значение x.
Уравнения регрессии являются математической моделью изучаемой зависимости, исключающей случайные факторы, повлиявшие на полученные результаты.
Рекомендации к решению задачи:
1. Если в корреляционной таблице варианты заданы равноотстоящими соответственно для компоненты X с шагом h1 и для компоненты Y с шагом h2, то для упрощения расчетов следует перейти к условным вариантам , где паре вариант x*, y* соответствует максимальная частота nxy (если максимальная частота nxy соответствует нескольким парам X = x, Y = y , то выбирается ближайшая к центру корреляционной таблицы). Для новых переменных справедливы следующие соотношения: .
2. Расчеты следует выполнять с учетом правил приближенных вычислений, причем в результатах расчетов после соответствующего округления достаточно оставлять не более трех значащих цифр после запятой; результирующее значение r округлить до сотых.
3. При выводе заключения о тесноте линейной корреляционной связи между Y и X предполагается придерживаться следующей градации:
- если r = 0, то между X и Y линейная корреляционная связь отсутствует (при этом не исключена другая форма корреляционной связи);
- если 0 < |r| £ 0,6, то между X и Y линейная корреляционная связь слабая;
- если 0,6 < |r| £ 0,8, то между X и Y линейная корреляционная связь тесная;
- если 0,8 < |r| < 1, то между X и Y линейная корреляционная связь очень тесная;
- если , то между X и Y линейная корреляционная связь функциональная.
Задача. В нескольких одинаковых отрезках проволоки исследуется взаимозависимость силы тока Y и температуры X при заданном напряжении. Полученные значения случайных переменных X и Y в условных единицах сведены в корреляционную таблицу
X/Y | nx | ||||||
1,5 | |||||||
2,5 | |||||||
3,5 | |||||||
ny | n =50 |
Найти выборочное линейное уравнение регрессии Y на X, выборочный коэффициент корреляции и сделать вывод о тесноте линейной корреляционной связи между X и Y.
Решение.
1. Значения как X, так и Y заданы в таблице равноотстоящими, поэтому перейдем к условным вариантам: где учтено, что шаги h1 = 0,5; h2 = 20, а максимальной частоте nxy = 10 соответствует пара x* = 2,5; y* = 80.
2. Составим вспомогательную таблицу для условных вариант с учетом: nu = nx; nv = ny; nuv = nxy. В углах клеток с nuv ¹ 0 укажем отличные от 0 произведения соответствующих вариант ui×vj.
U/V | –3 | –2 | –1 | nu | |||
–2 | 6 | ||||||
–1 | |||||||
–1 | |||||||
nv | n =50 |
3. Находим средние арифметические условных вариант:
и, следовательно,
4. Находим средние арифметические квадратов условных вариант:
И, следовательно, с требуемой точностью среднеквадратичные отклонения условных вариант:
5. Находим среднее арифметическое произведения условных вариант , суммируя произведения значений в углах клеток вспомогательной таблицы на соответствующие частоты в этих клетках:
и, следовательно, выборочный коэффициент корреляции
6. Находим выборочный коэффициент регрессии и параметр b:
7. На основе полученных результатов запишем выборочное уравнение регрессии Y на X
8. Поскольку выборочный коэффициент корреляции с точностью до сотых r = 0,89, то между X и Y линейная корреляционная связь очень тесная.