АНАЛИЗ РЕЗУЛЬТАТА ВЕРИФИКАЦИИ МОДЕЛИ

 

Любая предлагаемая математическая модель должна быть адекватна изучаемому явлению. Это основное условие эффективного применения статистической модели. В данном случае адекватность - не отражение в модели всех деталей описываемого явления, а принципиальное соответствие результатов моделирования изменениям и соотношениям, имеющим место в действительности. Для проверки адекватности модели производят верификацию модели на данных, не используемых при построении модели.

Процесс построения модели для прогнозирования всегда основан на анализе исходных данных, так как прогностическая модель должна адекватно отражать закономерности, присущие реальным процессам.
Таким образом, этапы построения математической модели для прогноза и верификация реальных данных должны выполняться параллельно. На рис. 2 приведены основные этапы, связанные с верификацией реальных данных и построением математической модели.

Выполненная верификация реальных статистических данных при построении прогностической математической модели заключалась в следующем.

1. Исследована возможность построения прогноза показателей инвалидности с помощью линейного тренда. Исследование показало, что такое описание динамики удовлетворительно не более чем для 10% районов. В остальных районах линейный тренд оказался незначимым: дисперсия, объясняемая с помощью линейного тренда, оказалась меньше дисперсии, связанной с отклонениями от тренда.

2. С целью выяснения применимости тех или иных статистических процедур изучены законы распределения временных рядов с показателями инвалидности. Анализ реальных данных показал, что их законы распределения в основном отличны от нормального и за редким исключением могут быть хорошо описаны логнормальным распределением. Гистограммы, построенные по реальным данным для нескольких показателей инвалидности, приведены в приложении 2.


 

 

 


Рис.2 Этапы построения математической модели


3. Аналогично исследованы законы распределения внешних факторов. Анализ реальных статистических данных за 1992 год показал, что их законы распределения могут быть приближены либо нормальным, либо логнормальным распределениями. Однако для внешних факторов характер распределения является менее выраженным и во многих случаях приближение тем или иным законом распределения является спорным. Примеры гистограмм для нескольких внешних факторов приведены в приложении 4.

4. Исследовано, являются ли имеющиеся временные ряды стационарными, то есть наблюдается ли изменение во времени таких характеристик как математическое ожидание, дисперсия, мода, медиана, эксцесс, асимметрия. Анализ реальных данных по показателям инвалидности за 1992, 1993 и 1994 годы показал, что эти временные ряды следует в целом считать нестационарными. При этом в соседние годы изменение характеристик незначительно. Поэтому на коротких временных отрезках (порядка 3-х лет) изучаемые временные ряды можно с известной долей приближения рассматривать как стационарные.

5. По реальным рядам динамики (показатели инвалидности) частично исследовано поведение автокорреляции. Анализ статистических данных за 1992 - 1994 годы показал, что корреляции между соседними точками для всех показателей инвалидности выше для интервала 1994-1993 гг., чем для интервала 1993-1992 гг. Однако эта разница не
превышает 0.1.

6. По реальным данным изучена взаимосвязь показателей инвалидности (за 1992, 1993 и 1994 годы) и внешних факторов (за 1992 год). Было выявлено, что каждый показатель инвалидности коррелирует с большим числом внешних факторов, причем коэффициенты корреляции при этом редко превышают 0.5. Кроме того было установлено, что степень взаимосвязи факторов с показателями инвалидности во времени для разных факторов изменяется по-разному.

7. По реальным значениям внешних факторов (за 1992 год) изучен характер взаимосвязи внешних факторов между собой. Внешние факторы, коэффициент корреляции которых превышает 0.07, можно считать коллинеарными и в модели использовать только один фактор из каждой такой пары.

Рассмотренный корреляционно-регрессионный подход к решению задачи прогнозирования инвалидности может дать удовле-творительное качество прогноза по большинству регионов только в случае унимодального характера распределений по пространственным выборкам как показателей инвалидности, так и внешних факторов. Следует отметить, что качество прогноза тем не менее существенно снижается для небольшой группы регионов, в которых значения используемых показателей сильно отличаются от остальных регионов. Поэтому можно сказать, что область применения классической экономико-статистической модели ограничивается однородными пространственными выборками.
Кроме того, классическая экономико-статистическая модель не учитывает случай, когда можно выделить несколько групп регионов со сходными значениями показателей инвалидности и (или) внешних факторов внутри каждой группы и значимыми отличиями между группами. Тем более ситуация усложняется, если с течением времени наблюдается картина перехода отдельных регионов из одной группы в другую. В этом случае потребуется разработка более сложной прогнозной модели, основанной на методах классификации.