Алгоритм 2. Визуальный анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков, их удаление из первичных данных

1. Найти на графике точку, соответствующую аномальному наблюдению. Если таких точек нет, то перейти к действию 7, если есть – к действиям 2–6.

2. Подвести курсор к точке на диаграмме рассеяния, соответствующей аномальному наблюдению. После непродолжительного времени возле точки автоматически появится надпись, содержащая значения признаков (xi,yi) этого наблюдения.

 
 

Для демонстрационного примера такая надпись выглядит следующим образом:

3. В исходных данных визуально найти в табл.1 строку, соответствующую выявленной аномальной единице наблюдения (предприятию) и скопировать её в табл.2.

4. Выделить мышью всю адресную строку (вместе с ее номером) с данными, подлежащими удалению.

Для демонстрационного примера это адресная строка с номером 34, содержащая значения 31, 330 и 53:

  А В С D E
   
33    
   
         

3. Правка=>Удалить.

4. Выполнять действия 1–5 до полного удаления всех аномальных значений признаков.

5. Выделить диаграмму рассеяния и переместить ее, используя прием "захват мышью", в область ячеек, начиная с ячейки F4.

Для демонстрационного примера табл.2, содержащая две единицы наблюдения с аномальными значениями признаков, имеет следующий вид.

    Таблица 2-ДП
Аномальные единицы наблюдения
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн руб. Выпуск продукции, млн руб.
50,00 150,00
330,00 53,00