Метод фокусирования

Важный шаг при решении задачи обобщения понятий – получение решающих правил (продукций, деревьев), которые содержат не только логические функции на конкретных значениях признаков, но включают более общие закономерности, например обобщение значения атрибутов.

В методе фокусирования предполагается, что над значениями каждого из атрибутов Аi построена иерархия типа «класс – подкласс». Элементы нижнего уровня являются значениями атрибутов ci1,ci2,...,cin и встречаются в обучающем множестве S. Элементы верхних уровней соответствуют более общим понятиям, т.е. подмножествам Sij Í Dom(Ai).

Важным требованием к подобной иерархии будет то, что каждые два элемента должны иметь наименьшую верхнюю грань, т.е. это должно быть не просто частично упорядоченное множество, а верхняя полурешетка. Это достигается за счет добавления Dom(Ai) на вершину иерархии.

Каждому элементу иерархии соответствует конъюнкт вида AiÎSij в формируемых правилах, причем правило содержит в точности по одному конъюнкту для каждого предсказывающего атрибута:

A1ÎS1j1 ∩ A2ÎS2j2 ∩...∩ AmÎSmjm à C.

Для работы алгоритма фокусирования необходимо также наличие в обучающей выборке отрицательных примеров. С помощью них учитель ограничивает набор допустимых обобщений и может определить, когда обучение может быть завершено.

Цель алгоритма фокусирования – нахождение конъюнктов в условии правила. В иерархии каждого атрибута алгоритм отслеживает два указателя, называемые нижним и верхним (L и U). Указатель L указывает на наиболее ограничивающее условие, которое может быть конъюнктом правила. Правильный конъюнкт – обобщение любого из конъюнктов, расположенных ниже L. Указатель U отмечает наиболее ограничивающее условие, которое может быть конъюнктом. Все условия, не имеющие специализации U, не могут быть конъюнктами, так как противоречат контрпримерам.