Вилучення аномальних об’єктів спостереження

 

 

На полях кореляції об’єкти спостереження можуть мати ознаки аномальності двох родів:

1) занадто велике відхилення від центру двомірного розсіювання з координатами і ;

2) занадто велике відхилення від лінії регресії, що уявляється на полі кореляції у по хі.

Для виявлення об’єктів спостереження з ознаками аномальності 1-го роду на поле кореляції у по хі наноситься прямокутний шаблон двомірного розсіювання з центром в точці , і півсторонами, рівними відповідно і . Коефіцієнти довіри t приймаються залежно від кількості об’єктів спостереження n і ймовірності надійності висновку за спеціальною таблицею. Фрагмент спеціальної таблиці наведено в додатку 2.

Об’єкти спостереження, що знаходяться за межами прямокутного шаблону розсіювання, вважаються аномальними 1-го роду.

У нашому прикладі (див. табл. 1.2 і рис. 1.5) на полі кореляції Р по Е півсторони прямокутного шаблону дорівнюють (зауважимо, що n=30; p=2,45; e=1,88; t=2.08 при =0,95):

по Р = 2,08·2,45=5,09;

по Е =2,08·1,88=3,91.

Враховуючи, що =10,05, маємо: верх шаблону 10,05+5,09=15,14, а низ 10,05–5,09=4,96. Враховуючи, що =4,86 маємо: лівий край шаблону 4,86–3,91=0,95, а правий 4,86+3,91=8,77.

Отже, на полі кореляції Р по Е аномальним 1-го роду виявилось підприємство № 13. На полі кореляції Р по К таким же чином виявлені аномальні підприємства №5 і № 13 (див. рис. 1.6).

Для виявлення об’єктів спостереження з ознаками аномальності 2-го роду на поле кореляції наноситься коридор регресії з півстороною Zy=q. Віссю коридору слугує діагональ прямокутного шаблону розсіювання, вздовж якої розташовуються точки поля кореляції. В даному разі коефіцієнт довіри t приймається по таблиці нормального розподілу (додаток 1). Для ймовірності 0,95 t=1,96.

Множник q призначений для врахування ступеню щільності поля кореляції за шкалою:

дуже щільне………………0,53

щільне……………………..0,72

середньої щільності………0,80

“пухке”…………………….0,92

Об’єкти спостереження, що знаходяться за межами коридору регресії, вважаються аномальними 2-го роду.

В нашому прикладі півширина коридору щільної регресії Р по Е дорівнює Z=1,96·2,45·0,72=3,46, а середньої щільності регресії Р по КZ=1,96·2,45·0,80=3,84. На обох полях кореляції аномальним 2-го роду є підприємство № 13.

Для з’ясування питання що до об’єктів спостереження, які мають ознаки аномальності, необхідно скласти зведення у формі таблиці. У нашому прикладі це зведення таке (табл. 1.4):

Таблиця 1.4

Зведення аномальних об’єктів спостереження

№ аномальних об’єктів 1-го роду 2-го роду
Е К Е К
+
+ + + +

 

Підприємство № 5 має тільки одну ознаку аномальності із чотирьох можливих, а № 13 – всі чотири.

Об’єкти спостереження, що переважно мають ознаки аномальності (у нас № 13) повинні вилучатися із матриці статистичних даних. При рівності кількості ознак аномальності (+) й нормальності (–) вилучають із матриці ті об’єкти, у яких переважають ознаки аномальності 2-го роду. Всі інші об’єкти залишаються в матриці.

У нашому прикладі вилучається об’єкт № 13, вибіркова сукупність відтепер нараховує 29 підприємств.

Без пояснень зрозуміло, що в разі вилучення аномальних об’єктів спостереження, необхідно скоригувати розраховані раніше показники варіації змінних (табл. 1.2). Наводимо для використання далі скориговані показники варіації (табл. 1.5)

 

 

Таблиця 1.5

Скориговані показники варіації змінних

j Р Е К Р2 Е2 К2
           
282,6 136,6 2852,58 754,72
9,7448 4,7103 60,0000 98,3648 26,0248 3729,7931
94,9611 22,1869 3600,0000  
Dx 3,4037 3,8379 129,7931  
x 1,8449 1,9591 11,3927  

 

Зауважимо, що виявлення і вилучення аномальних об’єктів спостереження має велике значення для одержання незміщених обґрунтованих і ефективних оцінок параметрів рівняння регресії.