Построение доверительных интервалов

Конечной целью моделирования является оценка или прогнозирование показателя Y в зависимости от значений X.

Прогноз подразделяется на точечный и интервальный и обычно осуществляется не более чем на одну треть размаха:

, (91)

где - точка прогноза.

В точечном прогнозе показателя Y для определяется лишь одно число, которое представляет условное среднее и (при выполнении предпосылок регрессионного анализа) наиболее вероятное значение с точки зрения закономерности, отраженной в модели. В таком прогнозе не учитываются отклонения от закономерностей в результате воздействия случайных и неучтенных факторов.

В интервальном прогнозе отклонения от закономерностей в результате случайных воздействий определяются границами доверительных интервалов.

Доверительным интервалом называется такой интервал, которому с заданной степенью вероятности (называемой доверительной) принадлежат истинные значения показателя при условии, что закономерности, отраженные в модели, не противоречат развитию как на участке наблюдения, так и на участке оценки (или в периоде упреждения прогноза).

Случайные отклонения от модели проявляются в виде ошибок. Поэтому при определении границ, доверительных интервалов необходимо определить из чего складываются возможные ошибки моделирования, оценки и прогнозирования. При условии, что модель адекватна, и возможные ошибки носят случайный характер, следует различать два основных источника ошибок:

1. ошибки аппроксимации (рассеяние наблюдений относительно модели);

2. ошибки оценок параметров модели.

Наличие ошибок первого типа очевидно даже визуально. На рис. 17 видно рассеяние исходных данных относительно модели, и конечно, нельзя предположить, что за границами периода наблюдений фактические значения вдруг подтянуться к модели. Величина ошибок аппроксимации характеризуется остаточной дисперсией или средней квадратической ошибкой . Распределение этих ошибок для адекватных моделей – нормально (нормальность ошибок – одно из условий адекватности).

Ошибки оценок параметров модели обусловлены тем, что их параметры, фиксированные в модели как однозначные, в действительности являются случайными величинами, так как они оцениваются на основе фактических данных, в которых присутствует как закономерная, так и случайная составляющие. Средние значения этих оценок при выполнении предпосылок регрессионного анализа соответствует истинным значениям параметров, а их дисперсии зависят от остаточной дисперсии, числа наблюдений и вида модели.

Общее среднее квадратическое отклонение истинных значений от расчетных может быть представлено как:

(92)

а в точке прогноза:

(93)

Исходя из предпосылки нормального распределения остатков границы доверительных интервалов определяются по формулам:

(94)

Анализ выражений (92, 93) позволяет для моделей парной регрессии сделать вывод, что доверительные интервалы тем шире, чем:

· больше остаточная дисперсия (менее точна модель);

· значение больше удалено от среднего значения ;

· сложнее форма модели;

· больше заданная доверительная вероятность.

Реализацию изложенного алгоритма осуществим с помощью режима «Регрессия». В диалоговом окне данного режима (рис. 18) задаются следующие параметры: