Отбор факторов для регрессии

Различают содержательный и формальный отбор. С содержательной точки зрения в перечень факторов включаются причиныизучаемого явления (напр., причиной выпуска продукции является наличие работников). Однако причина может быть представлена различными видами рядов (напр., наличие работников м.б. описано средней численностью, фондом зарплаты, средним стажем, фондом рабочего времени) и различными формами представления (абсолютные, относительные, приростные значения). Кроме того, влияние причины может запаздывать во времени (напр., увеличение основных фондов сейчас, вызовет прирост производства позднее), что приводит к рассмотрению сдвинутых (на период запаздывания) рядов-факторов. Т.о., одна причина даёт множество рядов-факторов.

С формальной точки зрения, лучшими факторами являются те, что больше похожи по своим колебаниям на изучаемый ряд, т.е. наиболее корелирующие с ним. Т.о., из всех рядов-факторов в уравнение регрессии целесообразно включать факторы с наибольшими (по модулю) коэффициентами корреляции [с изучаемым рядом].

Факторные ряды, похожие друг на друга, т.е. высоко корелирующие между собой, отражают одно явление. Учет одного явления дважды и более приводит к неоправданно высоким колебаниям прогнозных значений (т.н. «мультипликативный эффект»). Поэтому из каждой группы высоко коррелирующих между собой факторов, в уравнение регрессии нужно включить один.

Отбор факторов можно начать и с формального способа – оценить корреляцию с изучаемым рядом всех доступныхисследователю рядов. Высокая корреляция служит сигналом того, что соответствующее явление может быть ранее неизвестной причиной изучаемого явления.

Регрессия – это математическая функция от ряда содержательных переменных, каждая из которых зависит от времени, и времени, как отдельного фактора:

Если содержательные переменные убрать, получим зависимость только от времени, т.е. тренд. Тренд – регрессия ко времени.

Фактор времени [самого по себе] представляет совокупное влияние всех прочих причин, не нашедших отражение в модели. Если уравнения регрессий с и без фактора времени существенно расходятся – в перечне факторов пропущены существенные (поиск которых – задача содержательного исследования).