На полях кореляції об’єкти спостереження можуть мати ознаки аномальності двох родів:
1) занадто велике відхилення від центру двомірного розсіювання з координатами і ;
2) занадто велике відхилення від лінії регресії, що уявляється на полі кореляції у по хі.
Для виявлення об’єктів спостереження з ознаками аномальності 1-го роду на поле кореляції у по хі наноситься прямокутний шаблон двомірного розсіювання з центром в точці , і півсторонами, рівними відповідно і . Коефіцієнти довіри t приймаються залежно від кількості об’єктів спостереження n і ймовірності надійності висновку за спеціальною таблицею. Фрагмент спеціальної таблиці наведено в додатку 2.
Об’єкти спостереження, що знаходяться за межами прямокутного шаблону розсіювання, вважаються аномальними 1-го роду.
У нашому прикладі (див. табл. 1.2 і рис. 1.5) на полі кореляції Р по Е півсторони прямокутного шаблону дорівнюють (зауважимо, що n=30; p=2,45; e=1,88; t=2.08 при =0,95):
по Р = 2,08·2,45=5,09;
по Е =2,08·1,88=3,91.
Враховуючи, що =10,05, маємо: верх шаблону 10,05+5,09=15,14, а низ 10,05–5,09=4,96. Враховуючи, що =4,86 маємо: лівий край шаблону 4,86–3,91=0,95, а правий 4,86+3,91=8,77.
Отже, на полі кореляції Р по Е аномальним 1-го роду виявилось підприємство № 13. На полі кореляції Р по К таким же чином виявлені аномальні підприємства №5 і № 13 (див. рис. 1.6).
Для виявлення об’єктів спостереження з ознаками аномальності 2-го роду на поле кореляції наноситься коридор регресії з півстороною Zy=q. Віссю коридору слугує діагональ прямокутного шаблону розсіювання, вздовж якої розташовуються точки поля кореляції. В даному разі коефіцієнт довіри t приймається по таблиці нормального розподілу (додаток 1). Для ймовірності 0,95 t=1,96.
Множник q призначений для врахування ступеню щільності поля кореляції за шкалою:
дуже щільне………………0,53
щільне……………………..0,72
середньої щільності………0,80
“пухке”…………………….0,92
Об’єкти спостереження, що знаходяться за межами коридору регресії, вважаються аномальними 2-го роду.
В нашому прикладі півширина коридору щільної регресії Р по Е дорівнює Z=1,96·2,45·0,72=3,46, а середньої щільності регресії Р по К – Z=1,96·2,45·0,80=3,84. На обох полях кореляції аномальним 2-го роду є підприємство № 13.
Для з’ясування питання що до об’єктів спостереження, які мають ознаки аномальності, необхідно скласти зведення у формі таблиці. У нашому прикладі це зведення таке (табл. 1.4):
Таблиця 1.4
Зведення аномальних об’єктів спостереження
№ аномальних об’єктів | 1-го роду | 2-го роду | ||
Е | К | Е | К | |
– | + | – | – | |
+ | + | + | + |
Підприємство № 5 має тільки одну ознаку аномальності із чотирьох можливих, а № 13 – всі чотири.
Об’єкти спостереження, що переважно мають ознаки аномальності (у нас № 13) повинні вилучатися із матриці статистичних даних. При рівності кількості ознак аномальності (+) й нормальності (–) вилучають із матриці ті об’єкти, у яких переважають ознаки аномальності 2-го роду. Всі інші об’єкти залишаються в матриці.
У нашому прикладі вилучається об’єкт № 13, вибіркова сукупність відтепер нараховує 29 підприємств.
Без пояснень зрозуміло, що в разі вилучення аномальних об’єктів спостереження, необхідно скоригувати розраховані раніше показники варіації змінних (табл. 1.2). Наводимо для використання далі скориговані показники варіації (табл. 1.5)
Таблиця 1.5
Скориговані показники варіації змінних
j | Р | Е | К | Р2 | Е2 | К2 |
… | ||||||
282,6 | 136,6 | 2852,58 | 754,72 | |||
9,7448 | 4,7103 | 60,0000 | 98,3648 | 26,0248 | 3729,7931 | |
94,9611 | 22,1869 | 3600,0000 | ||||
Dx | 3,4037 | 3,8379 | 129,7931 | |||
x | 1,8449 | 1,9591 | 11,3927 |
Зауважимо, що виявлення і вилучення аномальних об’єктів спостереження має велике значення для одержання незміщених обґрунтованих і ефективних оцінок параметрів рівняння регресії.