Простая аналогия

Дадим формальные механизмы использования аналогии для решения задач. Пусть существуют два рассуждения: в первое входят два объекта S1 и S2, преобразование F и некоторый вывод D, а во второе – объекты S3, S4 и преобразование F¢. Можем ли мы угадать вывод? Можем, если предположить, что F¢ максимально похоже на F. Такие рассуждения называются рассуждениями по аналогии.

Слово «аналогия» предполагает, что сохраняется суть преобразования, хотя элементы, которыми оперирует преобразование, могут быть различными.

Первая попытка формализации рассуждений по аналогии была предпринята Лейбницем, который ввел понятие пропорции для отношения аналогии, которая формируется следующим образом: вещь А так относится к вещи В, как вещь А¢ к вещи В¢:

 
 

 


 

 

Аналогия основана на том, что сходные в одном отношении вещи, сходны и в остальных. Если А обладает свойствами (a, b, c, x), а В – (a, b, c), то вероятно, что В имеет признак (х) (простая аналогия). Выводы по аналогии всегда только вероятные.

При оценке степени вероятности рассуждений по аналогии нужно учитывать следующие условия:

1. Чем больше известно общих признаков сравниваемых предметов, тем выше степень вероятности вывода по аналогии.

2. Чем существеннее найденные общие свойства у сравниваемых предметов, тем выше степень вероятности вывода по аналогии.

3. Чем лучше изучена взаимная закономерная связь сходных черт, тем выше степень вероятности вывода по аналогии, тем вывод ближе к достоверности.

4. Если предмет, в отношении которого делается вывод по аналогии, обладает каким-либо свойством, несовместимым с тем свойством, о существовании которого делается умозаключение, то общее свойство не имеет никакого значения.

Рассуждения по аналогии не дают ответа на вопрос о правильности предположения, но наводят на догадки. Общим для рассуждений по аналогии является то, что непосредственному исследованию подвергается один объект, а вывод делается в отношении другого. Поэтому в общем случае вывод в рассуждениях по аналогии – это перенос информации с одного объекта на другой. Предмет, который является непосредственным объектом исследования, называется моделью, а предмет, на который переносится информация, называется образцом, оригиналом, прототипом и т. п.

Исходя из этого, аналогия – это вывод от модели к оригиналу, а моделирование, как более широкое понятие, включает в себя выводы по аналогии как неотъемлемую часть.

8.3. Другие виды аналогии

Кроме описанных выше существуют другие виды аналогии – аналогия свойств, аналогия отношений, распространенная, строгая и нестрогая аналогии. Рассмотрим их подробнее.

1. Аналогия свойств. Используется следующая схема рассуждений:

F f (a)P / (b)P,

где F – основание вывода по аналогии;

а – символ модели, которая непосредственно исследуется;

b – символ прототипа, т.е. предмета, на который переносится информация;

(a)P – посылка;

(b)P – заключение;

f – выражение отношения F к выводу.

2. Аналогия отношений. Схема рассуждений:

F f R(a) / R(b),

где F – основание вывода по аналогии;

R – отношение;

а – символ модели, которая непосредственно исследуется;

b – символ прототипа, т.е. предмета, на который переносится информация;

R(a) – посылка;

R(b) – заключение;

f – выражение отношения F к выводу.

3. Распространенная аналогия – аналогия, в которой заключают от сходства явлений к сходству причин, от исходных причин к исходным действиям.

4. Строгая аналогия – это аналогия, основанная на том, что признаки сравниваемых предметов находятся в некоторой зависимости. Умозаключение идет от сходства двух предметов в одном признаке к сходству в другом признаке, который зависит от первого.

5. Нестрогая аналогия – это аналогия, в которой заключение идет от сходства двух предметов в известных признаках к сходству их в таком новом признаке, о котором неизвестно, находится ли он в зависимости от первых или нет.

8.4. Аналогия в доказательстве теорем

Рассуждения по аналогии могут быть использованы в доказательстве теорем. Первым систему для доказательства теорем с помощью правил вывода на основе аналогий создал Клинг в 1971 г. Подобие по Клингу – это образ А во втором из следующих ниже условий для двух заданных теорем Т1 и Т21 – доказана, а Т2 – нет):

1) Т1 и Т2 имеют грамматически одинаковые структуры;

2) существует образ А, который сохраняет словарные значения в обозначениях Т1 и Т2 (обозначениях предикатов, функций, переменных).

Работа системы Клинга начинается с получения А, который расширяется до образа А¢ для используемых аксиом, затем с помощью А¢ доказательство Т1 по правилам вывода преобразуется в доказательство Т2. Однако большинство примеров успешного применения этой системы было связано с Т1 и Т2, которые были почти идентичны, система оказалась недостаточно аргументированной и унифицированной, чего нельзя сказать об используемых понятиях и методах.

Область доказательства теорем одновременно с Клингом исследовал Плейстид. Его исследования были связаны с процедурами для нахождения доказательств актуальных в данный момент теорем с использованием доказательств абстрактных теорем. Существенное отличие от системы Клинга состоит в том, что получается соответствие (подобие) уже доказанной теоремы Т1 и недоказанной теоремы Т2, никакого вывода на основе этого подобия не делается, а с целью упрощения задачи из Т2 строится абстрактная теорема Т2¢. Следовательно, соответствие между Т2 и Т2¢ полностью известно с самого начала, поэтому, получив «абстрактное доказательство» Р2¢ абстрактной теоремы Т2¢, можно из Р2¢ получить доказательство Р2 теоремы Т2.

Подобный метод доказательства теорем по правилам вывода называется стратегией абстрагирования, он показан на рис. 4.

При таком подходе вместо проблемы поиска возникает новая проблема: до какого уровня абстрагировать решение исходной задачи? Плейстид математически определил абстрагирование логических формул и дал одно из решений этой проблемы. Продемонстрируем на простом примере основную идею его решения.

 
 

 


Рис. 4. Стратегия абстрагирования

 

Пример. Пусть G – ограниченное множество высказываний, а С – высказывание. Будем записывать G C, если из G по правилам вывода можно вывести С. Определим вывод G C с помощью стратегии абстрагирования.

Пусть G ={ØP(x) Ú ØQ(x) Ú R(x), P(x), Q(a)}, C = R(а). Для доказательства этой теоремы можно использовать методы исчисления предикатов, однако проще это можно сделать с помощью стратегии абстрагирования. Оставим только обозначения предикатов, а все остальное отбросим, получим абстрактную задачу G¢ :

G¢ ={ØP Ú ØQ Ú R, P, Q}, C¢ = R. Очевидно, что вывод G¢ C¢ сделать легче, чем вывод G C, ему соответствует следующее дерево вывода:

 

Теперь укажем способ вывода G C исходной задачи из вывода G¢ C¢.

P(x), ØP(x) Ú ØQ(x) Ú R(x), Q(а) благодаря пропозициональному абстрагированию связывается соответственно с P, ØP Ú ØQ Ú R , Q . Поэтому рассмотрим метод построения вывода G C, при котором сохраняется каждый вывод, обусловленный абстрагированием (рис. 5). При построении выводимых высказываний С1 и С2 сначала перейдем к выводу С1¢, С2¢, С3¢.

В данном примере начнем с вывода Р, ØPÚ ØQÚ R ØQÚ R, затем, проверив вывод P(x), ØP(x) Ú ØQ(x) Ú R(x), получим:

 
 

 

 


Рис. 5. Перенос вывода на другое множество

 

P(x), ØP(x) Ú ØQ(x) Ú R(x) ØQ(x) Ú R(x).

Обратим внимание на то, что здесь ØQÚ R – это пропозициональное абстрагирование выводимого высказывания ØQ(x) Ú R(x). Далее сделаем выводØQÚ R, Q R и получим ØQ(x) Ú R(x), Q(a) R(a).

Таким образом, отправляясь от дерева вывода G¢ C¢, можно получить дерево вывода G C.

8.5. Формализация аналогии

В общем случае аналогия – это вывод подобного заключения, если справедливы подобные предпосылки. Уинстон, исследуя аналогию, считал предпосылкой и заключением причину и следствие в причинных отношениях.

Пусть существует некоторый объект S1 и множество фактов, справедливых для S1, это множество фактов разделяется на предпосылки и заключения: предпосылки a1…an ® заключение a, а также объект S2: предпосылки b1…b­n, j – отношение между объектами, определяющее подобность – назовем его подобием. Ситуацию, при которой тождественность предпосылок можно рассматривать как подобие j, будем записывать в виде ai j bi (1 £ i £ n). Тогда аналогия – это вывод b в S2 такого, что ajb.

Для строгого определения аналогии необходимо задать:

1. Определение подобия j.

2. Метод получения j из заданных объектов S1 и S2.

3. Операцию для вывода b такого, что ajb, на основе j (рис. 6).

Прежде всего определение подобия j должно зависеть от представления объектов и их смысла. Пусть объекты аналогии – это ограниченные множества Si (множество определенных предложений типа «если … – то…»), которое будем записывать в виде В1…Вn ® А, где А и Вj – положительные литералы.

 

 
 

 


Рис. 6. Принцип аналогии

 

Термы, не содержащие переменных в Si , представляют собой отдельные элементы объектов, предикаты р – отношения между элементами, а порождающие атомы р(t1,…, tn), не содержащие переменных, – отношение р между элементами tj.

Обозначим через Вi множество, состоящее изо всех атомов Si, тогда минимальная модель Mi множества Si – это множество атомов, логически выводимых из Si:

Mi = {aÎBi : Si a},

где обозначает вывод в логике предикатов. Элементы Mi являются фактами в Si.

Для определения аналогии между Mi необходимо рассмотреть отношение пар Mi. С этой целью определим пары термов Si.

Пусть U(Si) – множество термов, не содержащих переменных в Si, тогда конечное множество j такое, что j Í U(S1) ´ U(S2), называется парным соответствием. Здесь знак ´ означает прямое произведение множеств.

Термы представляют собой отдельные элементы Si , поэтому парное соответствие можно интерпретировать как некое парное отношение между элементами. Si в общем случае имеет функции без переменных, поэтому парное соответствие j можно следующим образом распространить на парное отношение j+ между U(Si).

Отношение термов j+Í U(S1) ´ U(S2), порождаемое j, определим как минимальное парное отношение термов, удовлетворяющее условиям:

1. j Í j+.

2. <ti, ti'> Î j+ Þ <f(t1,…, tn), f(t1',…, tn') >Î j+ ,

где f – функция, содержащаяся одновременно в S1 и S2.

Для заданных S1 и S2 в общем случае существует несколько возможных парных соответствий j. Для каждого из них можно определить подобие как совпадение отношений, т. е. совпадение предикатов.

Пусть терм t1 принадлежит U(S1), а t1' принадлежит U(S2) и пусть задано j – парное соответствие, a и a' – соответствующие факты в S1 и S2. Тогда возможность отождествить a и a' с помощью j и для некоторого предиката р можно записать в виде:

a = P(t1…tn), a' = P(t1',…, tn'),

причем (tj, tj')Î j+ . Кроме того, отождествление a и a' с помощью j можно записать как a j a'.

Формализуем аналогию на основе парного соответствия. Пусть в S1 факты b1,…, b­n служат условиями того, что факт a справедлив, а именно в S1 справедливо a ¬ b1,…,b­n . Тогда если в S2 существует факт bi' такой, что bi j bi', то в S2 выводится атом a' такой, что a j a'. Причем атом a' не обязательно является фактом в S2. Следовательно, такая аналогия наводит с помощью j на мысль о возможности существования атома a', который дедуктивно не выводится из S2.

Для определения атома a', который можно вывести по аналогии из правила

R: a ¬ b1,…,b­n с помощью j построим правило R': ¬ b1',…,b­n', затем рассмотрим вывод a' из a' ¬ b1',…,b­n' и известных фактов b1',…,b­n' с помощью правила «модус поненс». Построение R' из R называется преобразованием правила (на основе j), а процесс вывода a' обозначается следующей графической формой (называемой основной графической формой):

(конкретизация) А ¬ В1, …, Вn

(преобразование

правила с помощью j) a ¬ b1, …, b­n

(модус поненс) b1',…, b­n' a' ¬ b1', …, b­n'

a'

Здесь конкретизация и «модус поненс» – это выводы в дедуктивной системе, поэтому если в этой системе можно будет реализовать часть, указанную пунктирной чертой, т. е. преобразование правила, то будет возможным органичное использование аналогии и дедукции.

Факт a' не обязательно является логическим следствием S2, однако, благодаря парному соответствию j, факт a', по крайней мере, справедлив. Поэтому, предположив существование a', можно продолжить процесс вывода.

Пусть в схеме вывода bi – факт в S1, а bi' – факт в S2. Если есть атом, который выведен по аналогии из этих фактов, то допустим, что он тоже является фактом. На основании того же парного соответствия j из bi и bi' выведем новый факт a'. Множество атомов, которые можно вывести таким образом, обозначим Мi*.

Пусть j – парное соответствие; I1, I2 – множество фактов S1, S2, тогда два правила (без переменных) R и R' являются j-подобными, если в этих правилах biÎI1, bi'ÎI2 и a, a' , b, b' являются подобными.

Пример. S1 = {f(b,c),

m(a,b),

gf(X,Z) ¬ p(X,Y), f(Y,Z),

p(X,Y) ¬ f(X,Y),

p(X,Y) ¬ m(X,Y)},

где X, Y, Z – переменные; f, m, gf, p – предикаты; a, b, c – константы.

S2 = {m(a',b'), f(b',c')}.

Рассмотрим парное соответствие j = {<a, a'>, <b, b'>, <c, c'>}.

Фактами в S2 являются только m(a',b') и f(b',c'). Прежде всего из основной графической формы получим:

p(x,y) ¬ f(x,y)

p(b,c) ¬ f(b,c)

p(b',c') ¬ f(b',c').

P(b',c') (запишем в Mi*).

По аналогичной схеме получим P(a',b').

8.7. Методы реализаций рассуждений по аналогии

Рассуждения по аналогии, как и индуктивные рассуждения, можно применять для решения задач диагностики, прогнозирования, классификации, распознавания, обучения, сегментации баз данных (БД), установления ассоциаций в БД, извлечения из данных «скрытых» знаний, интерпретации данных, полуавтоматического приобретения знаний в экспертных системах и др.

Существуют различные реализации подходов рассуждений по аналогии. Рассмотрим некоторые из них.

Системы типа case based reasoning – CBR. Для того чтобы сделать прогноз на будущее или выбрать правильное решение, эти системы находят в прошлом близкие аналоги настоящей ситуации и выбирают тот же ответ, который был для них правильным. Поэтому этот метод еще называют методом «ближайшего соседа» (nearest neighbour).

Системы CBR используют для решения разнообразных задач. Большим недостатком систем, работающих на методе «ближайшего соседа», является то, что они вообще не создают каких-либо моделей или правил, обобщающих предыдущий опыт. В выборе решения они основываются на всем массиве доступных исторических данных, поэтому невозможно сказать, на основе каких конкретно факторов CBR системы строят свои ответы. Другая проблема CBR-систем – выбор меры «близости», которая влияет на объем множества прецедентов, которые нужно хранить в памяти системы для достижения удовлетворительной классификации или прогноза.

Примерами автоматизированных CBR-систем являются KATE tools (Acknosoft, Франция), Pattern Recognition Workbench (Unica, США).

Деревья решений (decision trees) являются одним из наиболее распространенных методов решения задач типа «Data Mining». Они создают иерархическую структуру классифицирующих правил типа «ЕСЛИ... ТО...» в виде дерева или набора продукций. Для того чтобы решить, к какому классу отнести некоторый объект или ситуацию, требуется ответить на вопросы, стоящие в узлах этого дерева, начиная с его корня. Вопросы имеют вид «значение параметра A больше Х?». Если ответ положительный («ДА»), осуществляется переход к правому узлу следующего уровня, если отрицательный («НЕТ») – то к левому узлу, затем снова следует вопрос, связанный с соответствующим узлом.

Данный метод обладает наглядностью и понятностью. Для метода деревьев решений необходимо решение проблемы значимости. Отдельным узлам на каждом новом построенном уровне дерева соответствует меньшее число записей данных – дерево дробит данные на большое количество частных случаев. Чем больше этих частных случаев, чем меньше обучающих примеров попадает в каждый такой частный случай, тем менее уверенной становится их классификация. Если построенное дерево слишком «кустистое» – состоит из неоправданно большого числа мелких веточек, оно не будет давать статистически обоснованных ответов.

Как показывает практика, в большинстве систем, использующих деревья решений, эта проблема не находит удовлетворительного решения. Кроме того, деревья решений дают хорошие результаты только в случае независимых признаков. Самыми распространенными автоматизированными системами такого типа являются See5/С5.0 (RuleQuest, Австралия), Clementine (Integral Solutions, Великобритания), SIPINA (University of Lyon, Франция), IDIS (Information Discovery, США).

При использовании логических методов возникает проблема перебора вариантов за приемлемое время. Известные методы либо искусственно ограничивают такой перебор (алгоритмы КОРА, WizWhy), либо строят деревья решений (алгоритмы CART, CHAID, ID3, See5, Sipina и др.), дающие полезные результаты только в случае независимых признаков. Методы поиска логических правил также не поддерживают функцию обобщения найденных правил и функцию поиска оптимальной композиции таких правил. Результатом работы этих алгоритмов обычно является полученное множество правил, но их интерпретация и анализ не производится, а возлагается на проектировщика.

Таким образом, является актуальной разработка новых методов и алгоритмов поддержки рассуждений по аналогии и создание автоматизированных систем, использующих эти методы.

8.8. Проблемы рассуждений по аналогии

Выше были рассмотрены принципы аналогии для логической импликации и показана возможность унифицированной реализации аналогии. Однако в процессе теоретических исследований и практической реализации, начало которому положила связь логики равенств и аналогии, возникло немало проблем. Вот некоторые из них:

1. В схеме рассуждений по аналогии хорошо изучены аналогии для импликаций, но необходимо изучить логические отношения более высокого уровня, т.е. необходимо создание теории типов отношений.

2. Аналогия была формализована в рамках хорновской логики, поэтому не была описана обработка негативных знаний.

3. Одна из главных целей исследований аналогии – ее приложение к автоматическому синтезу и преобразованию программ. Это связано с проблемой создания пакетов программ и их повторного использования. На практике повторно используемые программы можно рассматривать как программы, в которых абстрагируются некоторые общие стороны нескольких программ, следовательно, теория и методология абстрагирования подобных программ может строиться на основе теории аналогии.

4. Не изучена связь аналогии с другими системами выводов, хотя возможно построение единой системы выводов (дедуктивные, индуктивные, по аналогии). Например, можно повысить эффективность индуктивных выводов, используя аналогию при генерации гипотез.

Таким образом, можно привести ряд разнообразных проблем как с теоретической, так и с практической точки зрения, поэтому исследования аналогии нуждаются в продолжении.

8.9. Контрольные вопросы и упражнения

1. Что такое аналогия?

2. Какие виды аналогий существуют?

3. Приведите примеры схемы рассуждений по аналогии.

4. В чем отличие индуктивных рассуждений от аналогичных?

5. Какие существуют приемы работы с аналогией?

6. Какие задачи можно решать с помощью методов рассуждений по аналогии?

7. Какие методы, использующие рассуждения по аналогии, вы знаете?

8. В чем заключаются проблемы использования методов, реализующих рассуждения по аналогии?


9. Автоматизация нечетких рассуждений

В окружающем нас мире очень редко приходится сталкиваться с задачами, лишенными какого-либо элемента неопределенности. Управленческое решение практически всегда приходится принимать в условиях частичного отсутствия необходимой информации. Г. Шакл пишет: «В предопределенном мире решение было бы иллюзорным, в абсолютно предугадываемым мире – пустым, в мире без естественного порядка – бессильным. Наше интуитивное представление о жизни предполагает неиллюзорное, непустое и небессильное решение… . Поскольку в этом смысле решение исключает как абсолютное предсказание, так и абсолютную случайность в природе, решение следует определить как выбор в условиях ограниченной неопределенности».

Все ранее изученные логики являлись монотонными, т.е. множество теорем в этих логиках растет с увеличением множества основных аксиом. Все дедуктивные системы обладают этим свойством, они специально предназначены для формализации общезначимых рассуждений.

Но рассуждения, которые желательно моделировать в приложениях искусственного интеллекта, не всегда общезначимы, часто они приблизительны и неопределенны. Выведенные из неопределенных рассуждений заключения должны допускать возможность отказа от них, если, например, новая информация блокирует вывод. Поэтому логическая система, которая формализует такие модифицируемые рассуждения, должна быть немонотонной, т.е. число теорем, которые можно получить, может уменьшаться с ростом числа аксиом или предпосылок. Немонотонные логики должны иметь системы вывода для моделирования модифицируемых (необщезначимых в классическом смысле) рассуждений. Формализующая эти рассуждения система вывода должна давать «правдоподобные» формулы.

Основными характерными особенностями немонотонных логик являются следующие:

1. Структура множества выведенных формул – из немонотонной системы можно получить, используя правила вывода, различные несовместные множества формул, причем отдельно взятое множество заключений существенно зависит от порядка применения формул. Если выведена правдоподобная формула, то следует запретить вывод других правдоподобных, но невыполнимых вместе с первой формулой формул.

2. Устранение несовместимых заключений – в немонотонных системах предусмотрено устранение несовместных заключений.

3. Отказ от собственных выводов – немонотонная система должна сама обеспечивать отказ от своих выводов, т.е. ее правила вывода должны быть модифицируемыми, применение некоторых правил в нужный момент может блокироваться. Для этого правила оснащаются условиями применения этих правил. Эти условия (точнее, предусловия) позволяют проверять выполнимость утверждения до вывода.

Пример. Рассмотрим следующее правило: «Если Х – птица, то Х летает».

Сделаем правую часть выводимой, когда она всего лишь выполнима вместе с посылками и другими ранее выведенными формулами.

Для этого нужно преобразовать правило: «Если Х – птица и выполним вывод, что Х летает, то Х летает».

В таком виде правило может динамически меняться.

Выделяются два основных класса немонотонных рассуждений:

1. Рассуждения, модифицируемые из-за неопределенности и гипотетичности, например, рассуждения типа: «Объекты типа Х имеют свойство Р. Если А – объект типа Х, то делается вывод, что А, по-видимому, обладает свойством Р».

2. Рассуждения, модифицируемые по интроспективе, т. е. зависящие от текущего состояния знаний субъекта, который делает вывод, например, рассуждения типа: «Исходя из состояния моих знаний, я могу сделать вывод, что …».

Пример.«Мне ничего не известно о старшем брате, поэтому я делаю вывод, что у меня нет старшего брата».

Существуют различные способы автоматизации немонотонных рассуждений, рассмотрим некоторые из них.