Статистическая оценка надежности параметров парной регрессии и корреляции

Показатели корреляционной связи, вычисленные по ограниченной совокупности (по выборке), являются лишь оценками той или иной статистической закономерности, поскольку в любом параметре сохраняется элемент не полностью погасившейся случайности, присущей индивидуальным значениям признаков. Поэтому необходима статистическая оценка степени точности и надежности параметров корреляции. Под надежностью здесь понимается вероятность того, что значение проверяемого параметра не равно нулю, не включает в себя величины противоположных знаков.

Вероятностная оценка параметров корреляции проводится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки. Для коэффициента парной регрессии b средняя ошибка оценки вычисляется как:

мости 0,05) 0,3494, то полученное значение ниже критического по модулю. Соответственно гипотеза о связи признаков надежно не доказана. Неверен будет вывод и об отсутствии связи — он также надежно не доказан. Из табл. П.5 приложения видно, что при малой выборке надежно можно установить только тесные связи, а при большой численности совокупности, например 102 единицы, надежно измеряются и слабые связи. Этот вывод важен для практической работы по корреляционному анализу.

Можно рассчитать доверительный интервал оценки коэффициента корреляции с заданной вероятностью, скажем 0,95. При этих условиях и 13 степенях свободы вариации значение /-критерия Стыодента равно 2,16. Тогда доверительный интервал для z составит: 1,564 ± 2,16-0,2774, т.е. от 0,965 до 2,163. Подставив эти граничные значения г в формулу (9.21), получаем границы интервала значений коэффициента корреляции: от 0,747 до 0,974. Как видим, с большой вероятностью связь на самом деле является весьма тесной, коэффициент корреляции не ниже 0,7.