рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Дерево непосредственных составляющих

Дерево непосредственных составляющих - Дерево Непосредственных Составляющих (Днс) Обеспечиваает Структорное Описани...

Дерево непосредственных составляющих (ДНС) обеспечиваает структорное описание предложений.Граматика непосредственных составляющих (ГНС) характеризует ДНС. И то и другое поэтому играют важную роль в обработке естественного языка для создания структурных описаний предложения, которые могут быть использованы в обработке систем понимания или порожления речи. Дерево непосредственных составляющих: ДНС кодирует иерархическую структуру предложения. Эта информация двух видов: иерархическая структура группирования и синтаксические категории этих группирований.

Предложение John wanted to publish the paper. (1) имеет следующую структуру: (2) John wanted to publish the paper Эта структура может быть представлена и в скобочной конструкции: [[John][[wanted][[to][publish][[the][pap er] (3) (2) и (3) описывают группирование без идентификации составляющих.Такие конструкции называются “скелетом”. Скелеты характеризуют фразу без обозначения вершин дерева. Скелет с обозначением категорий является ДНС, для фразы (1) это будет выглядеть так S NP VP VP NP (4) NPR V P V DET N John wanted to publish the paper “John” является здесь именем собственным, которое является также группой подлежащего, “wanted” и “publish” - глаголы, “to”- предлог (точнее говоря “to” должно быть названо частицей или временем), “the” - детерминатор, “paper” - существительное, “the paper” - группа существительного, “to publish the paper” - группа сказуемого, “wanted to publish the paper” - тоже группа сказуемого, и наконец, “John wanted to publish the paper” - предложение.

Соответственно скобочная конструкция (3) будет выглядеть так: [S[NR[NPR John]][VP[V to][V publish][NP[DET the][N paper] (5) Конструкции (4) и (5) обычно (но не всегда) используются в системах обработки естественного языка.

Грамматика непосредственных составляющих (ГНС) ГНС состоит из набора нетерминальных символов (таких как N, V, NP, VP, S и т.д.) и из набора терминальных символов (таки лексические единицы как John “wanted”, “to”, “publish”, “the”, “paper” и т. д. и из набора правил, которые позволяют переписывать нетерминальные символы в цепочку терминальных и нетерминальных симвлов.

Если это переписывание не зависит от контекста, то это контексто-независимая грамматика (КНГ), в противном случае - это контекстозависимая грамматика (КЗГ). Правило перезаписи имеет следующую форму: А > Х (6) где Х - последовательсть терминальных и нетерминальных символов, а А - нетерминальные.КЗГ имеет иследующее правило перезаписи: ZAW > ZXW (7) где X, Z, W - цепочки терминальных и нетерминальных символов, а А - нетерминальные.

В (7) А и Х находятся в окружении Z и W. Часто эта формула пишется в виде A > X кZ — W (8) Деревация в КНГ начинается с начального символа S и далее идет до тех пор, пока не будет применено последнее правило. Порядок применения правил не важен.S —> NP VP NP —> NPR NP —> DET N VP —> V VP VP —> P V NP NPR —> John, Mary, Bill N —> paper, man, cow V —> wanted, meet, want P —> to DET —> the Несколько формальных свойств ГНС: Если все правила некоторой ГНС G являются контекстно сводными, то G называется контекстно свободной грамматикой (КСГ). Если некоторые правила ГНС являются контекстно зависимыми, то G разывается КЗГ. Строчный язык некоторой ГНС G определяется как набор всех конечных строк, полученных из G и этот набор обозначается L(G). Строка w считается полученной из G, если w можно получить при последовательном переписывании начального символа S, используя правила грамматики G. Строчный язык L (т.е. набор конечнных строк) называется контексто свободным языком (КСЯ), если существует такая КСГ, что L(G)=L. L называется “строго контекстно зависимым языком”, если не существует такой КСГ, что КСГ, что L(G)=L, и существунт такая КЗГ, что L(G)=L. Заметьте, что грамматика G может быть контекстнозависимой, но ее строчный язык L(G) не обязательно должен быть КЗЯ. Класс КЗЯ включает класс КСЯ. В этом смысле, КЗЯ являются более мощным чем КСЯ. Однако есть и другой случай, когда КЗЯ не являются более мощными чем КСЯ. Если некоторая КЗГ, G, используется для “анализа”, в этом случае язык анализируемый при поиощи G - контекстносвободный (6, 7). Для того чтобы объяснить использование КЗГ G для анализа данного дерева t, определим анализ t следующим образом.

Груба говоря анализ t представляет собой некий срез дерева.

Дадим более точное определение: Набор (Pt) для анализа дерева t определяется следующим образом 1. Если t=f (пустое дерево), тогда Pt = f 2. Если t= A t0 t1 tn тогда Pt={A} v P(t0)P(t1) P(tn) где t0, t1 tn - деревья, А “ . “ обозначает соединение; например: S A B C d E c e Pt = {S, AB, AE, Ae, CdB, CdE, Cde,cdB, cdE, cde} Пусть G - контекстно зависимая грамматика, т.е. ее правила имеют форму А >w/p - f где А О V - S (V - алфавит, и S набор терминальных символов), w О V+ (набор ненулевых строк на множестве V) и p, f О V* (набор всех строк на V). Если p и f - равны нулю, то такое правило называется контекскносвободным.

Дерево t называется “анализируемым ” в терминах грамматики G, если для каждого узла дерева t выполняются правила G. Контекстно зависимое правило А > w/p - f выполняется для узла А, если строка соответствующая ответвлению от узла А, является w и существует анализ t вида r1pАfr2 , где r1, r2 О V*. Контекстное условие p - f называется анализом предиката.

Наряду с контекстозависимымми правилами правилами, позволяющими специфицировать “правый” и “левый” контекст, часто необходимо иметь правила специфицирующие “верхний” и “нижний” контекст.

Имеем узел А дерева t, область (p - f), p, f О V*, содержит узел А, если существует путь от корня до края дерева, и этот путь имеет форму r1pАfr2 (r1, r2 О V*). Контекстное условие, связанное с таким “вертикальным” анализом называется “господствующим предикатом”. В общем виде правило имеет форму А >w/СА где СА - булева комбинация анализа и господствующих предикатов. Пусть G - конечный набор правил и t(G) - набор деревьев, анализируемый G. Предполагается, что деревья t(G) - предложения; т.е. корневой узел дерева t(G) обозначен начальным символом S, а конечные узлы - терминальными символами.

Покажем, что строчный язык L(t(G)) = {xЅx, где х терминальная строка дерева t, и t О t(G)} контекстно свободен (7). Пример: Пусть V = {S, T, a, b, c, e} и S = {a, b, c, e}, и G - конечный набор строгих правил. 1. S >e 2. S > aT 3. T > aS 4. S > bTc / (a_()) Щ DOM (T_) 5. T > bSc / (a_()) Щ DOM (S_) Для правил 1, 2, 3 имеет место нулевой контекст и эти правила - контекстносвободные.

В четвертом и пятом правиле по условию требуется а слева и узел подчиняется Т (в пятом правиле S). Язык, порожденный G, может быть порожден G1: S > e S > aT1 S > aT T > aS1 T > aS T1 > bSc S1 >bTc Грамматика G1 содержит дополнительные нетерминальные символы S1 и Т1 для проверки локального контекста при порождении.

Легко заметить, что при помощи S1 и Т1, достигается гомоморфизм, позволяющий анализировать любое дерево G1 при помощи G и обратно - любое дерево G имеет гомоморфный прообраз в G1. Рассмотрим еще раз контекстно зависимое правило (10). V > wantedЅ -VP когда (10) интерпретируется как ложное правило, как описано выше, лексема “wanted” появляется над узлом V, только если узел VP находится справа от нее (в дереве, где появляется V). Справа от V существует строка, имеющая VP “анализ”. Контекстно-зависимые правила в КГЗ используются для анализа обычных грамматик, а не есть правила простого переписывания строк.

Терминальные символы в ГНС. До этого момента терминальные символы были представлены как нереализуемые элементы.

Это было сделано для простоты изложения. Терминальные символы представляют собой наборы топологических, синтаксических и семантических признаков (4, 8). [В принципе возможно ликвидировать все эти признаки посредством введения новых нетерминальных символов.Однако их количество будет слишком велико (в соответсвии с большим количеством всех возможных комбинаций этих признаков). Это также повлечет значительное усложнение грамматики]. Например, терминальные символы в (4) заменяются на составные (комплексные) символы и получаем (4’ ). S NP VP NPR V VP NP John wanted P V +N +V DET N -DET- + - NP [to] publish +Animate . +V the paper + - NP + DET +N +Definite + DET - + Singilar Здесь не обсуждается возможность связи комплексных символов и промежуточных узлов. Форма (4’) является структурным описанием (СО) предложения (1): John wanted to publish the paper ГНС в трансформационной грамматике (ТГ). ТГ также не обсуждаются в этой статье.

Однако важно заметить, что ГНС (и деревья НС) играют важную роль в ТГ. Основная идея заключается в том, что некоторые структурные описания (СО)описываются в базовом компоненте ТГ, а все остальные выводятся из них при помощи специальных правил, называемых трансформациями.

Базовым компонентом является ГНС, которая определяет набор деревьев НС. Деревья, полученные при помощи трансфомаций также являются деревьями НС. Такой взгляд на ТГ является классическим и, конечно, упрощенным, хотя и достаточен для данного описания.

Так, например, дерево НС для предложения (11), показанное на диаграмме (12) - является базовым. Дерево НС (14) для предложения (13), получается при применении трансформационного правила. John saw Mary S NP AUX VP NPR V NP John past see NPK Mary Mary was seen by John. S NP AUX VP NPR.

– Конец работы –

Используемые теги: Дерево, непосредственных, составляющих0.064

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Дерево непосредственных составляющих

Что будем делать с полученным материалом:

Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Еще рефераты, курсовые, дипломные работы на эту тему:

Дерево непосредственных составляющих
Предложение John wanted to publish the paper. 1 имеет следующую структуру 2 John wanted to publish the paperЭта структура может бытьпредставлена и в… Соответственно скобочнаяконструкция 3 будет выглядеть так S NR NPR John VP V… Еслиэто переписывание не зависит от контекста, то это контексто-независимаяграмматика КНГ , в противном случае - это…

Обобщенная грамматика непосредственных составляющих
Синтаксческий признак- это определение, состоящее из двух символов, определяющих сам признак например,падеж и его значение родительный , либо это… Внутреннее составление категорий ограничивается возможными… Построение дереваосуществляется по определенным правилам правила зависимости, правила линейногопредшествования,…

Основные составляющие самоменеджмента
Мастерство влечет за собой признание окружающих, что возвышает человека, утверждает его в жизни, помогает реализовать себя. Самообразование — это… Самообразование может проводиться в обычных формах общественного обучения… Самопознание имеет своей целью познание себя как личности, как руководителя, своих свойств и способностей, своих…

Дерево
Многие определения устанавливают минимальную высоту растения, которое можно назвать деревом, но у разных авторов этот показатель колеблется от 2 до… В других случаях растение не превышает в высоту нескольких дециметров,… Для некоторых целей могут потребоваться довольно жесткие определения, однако в целом термин «дерево» предполагает…

Строение и свойства компонентов, фаз и структурных составляющих железоуглеродистых сплавов
Д.К. Чернов дал первое представление о диаграмме Fe – C. 2. Компоненты железоуглеродистых сплавов Железо (Fe): №26 (Периодическая система элементов… Рисунок 1. Связь свободной энергии с типом кристаллической решетки железа -Fe… Зерна -Fe имеют ограненные края с наличием двойников: = 8,0–8,1 г/см3 I полиморфное превращение) обозначается…

Категории сферы непосредственного
Важно различать философскую категорию Мера есть конкретный синтез качества и количества как противоположностей.Переход из одной меры в другую как… Лишь только совпадение, согласование внешней меры с внутренней, т. е. с… Становление есть единство исчезновения и возникновения. Возникшее новое качество очень хрупко и неустойчиво, оно в…

Определение величины допуска на составляющие звенья размерной цепи
Определение предельных отклонений. Назначаем предельные отклонения на все размеры (кроме ), как на основные валы… Принимаем Проверим правильность решения прямой задачи: Таким образом, Данный вариант не удовлетворяет условию …

"Мягкие" составляющие конкурентоспособности
В промышленно развитых странах эти составляющие играют, как правило, большую роль, чем в развивающихся.В то же время “мягкие” составляющие не… Среди них можно выделить следующие: • Трудовая этика. Конкурентоспособность во… Безусловно, приверженность традициям, выверенным вариантам решений и т.п. имеют свои преимущества.Однако в борьбе с…

Разглашение сведений военного характера, составляющих государственную тайну. Утрата документов, содержащих военную тайну
Хотя, по существу, говорить на данном примере о декриминализации уголовного законодательства не совсем уместно, так как сами составы преступлений в… Подобные нововведения и изменения структуры кодекса представляются вполне… Нахождение статей, предусматривающих ответственность за такие составы преступлений как разглашение военной тайны или…

"Интегральные микросхемы (аналоговые и импульсные), как одна из составляющих частей РЭА"
При машинном моделировании на ЦВМ используются арифметические операции сравнения, перебора. При расчетно-теоретическом моделировании в качестве… С ростом числа полюсов конструктивная сложность элемента и его возможности… Элементы делятся на пассивные и активные.Пассивные элементы, обладающие положительным сопротивлением ( ), расходуют…

0.034
Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • По категориям
  • По работам