Множественная регрессия

В случае простой регрессии рассматриваются две переменные: предикторная и критериальная. Если оценки SAT (Американский школьный тест проверки способностей – предикторная переменная) коррелируют со средним баллом первокурсников, то их можно использовать для предсказания академической успеваемости. Однако, такой феномен, как «успеваемость в колледже» не так прост, как кажется. Оценки теста SAT могут говорить о будущей высокой успеваемости, но как быть с такими факторами влияния на успеваемость, как «мотивация», «высокие школьные оценки» или «уклонение от занятий физикой»?

Множественная регрессия помогает решить проблему использования более чем одной предикторной переменной. В исследовании, проводимом методом множественной регрессии, применяется одна критериальная, а также две или более предикторных переменных. Такой анализ позволяет не только выяснить, что на основании этих двух или более переменных можно предсказать определенный критерий, но также определить относительную предсказательную силу этих переменных. Эта сила отображается в формуле множественной регрессии для исходных данных, которая представляет собой расширенный вариант формулы простой регрессии:

Простая регрессия: Y = а + bХ. Множественная регрессия: Y= а + b1 Х 1 + b2 X2 +...+ bnХn, где каждый X - это отдельная предикторная переменная, Y – это критериальная переменная, а величина показателей b отражает относительную важность каждой предикторной переменной. Этот показатель называют «весом регрессии». В результате анализа по методу множественной регрессии получают множественный коэффициент корреляции (R) и множественный коэффициент детерминации (R2). R – это корреляция между объединенными предикторными переменными и критерием, a R2 – показатель степени изменчивости критериальной переменной, вызванной объединенными предикторными переменными. Для обозначения многомерных R и R2 используются большие буквы – тем самым их можно отличить от двумерных пирсонова г и r2. Однако их интерпретации весьма схожи. И R, и г обозначают силу корреляции, a R2 и г2 – долю изменчивости, общей для нескольких переменных.

Преимущество анализа методом множественной регрессии заключается в том, что при объединении влияния нескольких предикторных переменных (особенно если они не слишком сильно коррелируют друг с другом) возможность сделать верные предположения заметно увеличивается в сравнении с обычным регрессионным анализом. Высокие школьные оценки уже сами по себе говорят о будущей хорошей успеваемости в колледже, так же как и оценки теста SAT, но на основании двух этих показателей можно делать предсказания с большей уверенностью. Чтобы получить представление о том, в каких исследованиях применяют анализ методом множественной регрессии, рассмотрим следующие примеры.

1. Исследование, предсказывающее развитие эмпатии (сопереживания) на основании двух аспектов событий раннего детства: студенты, сопереживающие другим людям, обычно имели в детстве стрессовые переживания, что сделало их более чувствительными к переживаниям других. Тяжесть полученной в детстве травмы, как признак развития будущей эмпатии, имеет больший вес, чем общее число травматических событий.

2. Исследование, предсказывающее развитие восприимчивости к простуде на основании негативных событий жизни, воспринимаемого стресса и отрицательных эмоций. Можно подумать, что простуда развивается потому, что человек провел какое-то время слишком близко от непрерывно чихавшего человека. Однако специальное исследование показало, что простудные заболевания можно предсказать на основании трех факторов, связанных со стрессом. Чаще всего простужаются те студенты, которые: а) в недавнее время пережили стрессовое событие, б) чувствуют, что к ним предъявляются завышенные требования, и в) описывают свой общий эмоциональный фон как негативный.