Парадигматика и дистрибуция

Парадигматика и дистрибуция. Существует много проблем, относящихся к языку Ф, которые могут успешно изучаться без какого-либо специального уточнения структуры Ф, т.е. только при том предположении, что Ф - определенное подмножество Т над, и мы можем сказать для каждой последовательности, принадлежит ли она Ф или нет. Однако для исследования проблем грамматического рода и падежа необходимо иметь больше информации о структуре языка.

Такую информацию в аналитических моделях обычно несут разбиения. Разбиением словаря называется система непустых взаимно не пересекающихся подмножеств. Обычной лингвистической интерпретацией разбиения является выделение парадигм, т. е. совокупностей форм одного слова, различающихся флексией. В частности, парадигма слова Buch состоит из форм Buch, Buchs, Bcher, а парадигма gro - gro, grer, grt. Строго говоря, парадигмы не образуют разбиения, поскольку существуют отдельные парадигмы, которые пересекаются друг с другом.

Однако такие несоответствия модели и действительности неизбежны. Парадигматическое разбиение словаря будем обозначать буквой P. Через Px будем обозначать парадигму слова x, то есть множество слов из, каждое из которых отличается от x флексией. Двусмысленности не возникнет, так как в каждом конкретном случае будет ясно, какое из обозначений используется.

Другим важным разбиением, которое нам понадобиться в дальнейшем, является так называемое разбиение на дистрибутивные классы. Оно определяется следующим образом. Два слова a и b принадлежат одному дистрибутивному классу, если для каждой пары последовательностей x, y из xay Ф следует xby Ф и обратно. Понятие дистрибутивного класса станет интуитивно более понятным, если мы введем понятие контекста. Контекст может быть определен, как упорядоченная пара последовательностей над. Будем обозначать контекст x, y, где x Т и y Т. Будем говорить, что слово a допустимо в контексте x, y, если существует такое слово a Pa, что последовательность xay принадлежит Ф. Слово a непосредственно допустимо в контексте x, y, если последовательность xay принадлежит Ф. Обозначим через Sa множество всех контекстов, в которых a непосредственно допустимо, через A - множество слов, допустимых, а через B - множество слов непосредственно допустимых в контексте x, y. Отсюда сразу получаем, что два слова a и b принадлежат одному дистрибутивному классу тогда и только тогда, когда Sa Sb, то есть тогда и только тогда, когда a и b непосредственно допустимы в одних и тех же контекстах.

Если мы будем интерпретировать как словарь немецкого языка, а Ф - как множество правильно построенных немецких предложений, то слова Buch и Fenster попадут в один и тот же дистрибутивный класс, тогда как Buch и Bcher в разные.

Как легко видеть, два различных дистрибутивных класса не пересекаются.

Таким образом, эти классы определяют разбиение, которое мы будем называть дистрибутивным разбиением и обозначать S. Как и в случае с парадигматическим разбиением будем обозначать через Sa дистрибутивный класс, содержащий a. Свойства и понятия, определяемые исключительно в терминах дистрибутивных классов и парадигм являются самыми простыми и самыми изящными в лингвистике. Одним из таких понятий является понятие грамматического рода. 4. Грамматический род Ранее исследовались различные аспекты проблемы грамматического рода такие, как связь между значением существительного и его родом 9, соотношение между родом существительного и его окончанием 10, соответствие рода в плане содержания и в плане выражения 11,12,13, с точки зрения синтаксических и контекстуальных связей 14,15,16, с точки зрения его происхождения и эволюции, т.е. в диахроническом аспекте 17,18,19,20,21,22, наконец проблема рода изучалась синхронически 23,24,25,26,27. Некоторые из этих вопросов, разумеется, тесно связаны другие, напротив, решаются независимо. К настоящему времени, почти все авторы сходятся на том, что только семантических критериев явно недостаточно для понимания сложной природы грамматического рода и необходимо использовать все лингвистические факты, относящиеся к этой категории.

По этому поводу L. Hjelmslev 28 пишет Мы нередко отдаем предпочтение семантическим определениям или определениям через субстанции, которые чаще всего неоднозначны и трудно применимы.

Вряд ли можно найти лучший пример этого, чем пример грамматического рода здесь семантическое определение недостаточно и даже невозможно, и лишь функциональное определение рода как показателя соответствия позволяет получить твердую и надежную точку зрения.

Очевидно, что если мы принимаем, что грамматический род не совпадает с естественным т.е. с полом, то мы должны признать, что форма, а не значение является решающим фактором в рассматриваемой проблеме. 5. От естественного рода к грамматическому Попытаемся сначала объяснить не слишком строго, а в расчете на интуитивное понимание, какова формальная природа соотношения между естественным и грамматическим родом.

Это объяснение предваряет построение математических моделей. Рассмотрим некоторый естественный язык. Возьмем в качестве исходного два существительных и, представляющих собой прототип естественного рода например, man и woman в английском языке. В некоторых языках даже эта операция, столь простая на первый взгляд, требует осторожности в немецком языке, например, существительное Weib женщина не может быть использовано в качестве исходного слова в такого рода построении, поскольку его грамматический род средний.

Стоящая перед нами задача заключается в том, чтобы найти такое определение мужского и женского грамматических родов, которое бы в явной форме представило тот механизм, те операции, посредством которых эти категории получены из соответствующих естественных родов.

Будем исходить из того, что любое существительное мужского рода должно находиться в строго формальном отношении с существительным и любое существительное женского рода должно находиться в подобном же отношении с существительным. Чтобы получить такое отношение используем понятие, введенное Ревзиным 23, а именно, понятие цепи. Это понятие хорошо известно в математической лингвистике. Здесь мы дадим неформальное определение с примерами и комментариями. Всякое слово входит в два множества множество словоформ данного слова и множество слов, встречающихся с ним в одних и тех же контекстах.

Первое из этих множеств является парадигмой данного слова, второе - его дистрибутивным классом. Например, парадигмой слова Haus является PHaus Haus, Huser, тогда как дистрибутивным классом является SHaus Haus, Tisch, Buch, Считается, что словоформы каждого слова заданы и определены однозначно следовательно, и парадигмы считаются заданными. Что касается дистрибутивных классов, то их состав зависит от того, каково исходное множество предложений.

Под предложением было бы желательно понимать всякую грамматически правильную последовательность слов. Однако такое понимание приводит к созданию слишком сложных моделей. Поэтому, если специально не оговаривается противное, то всюду в дальнейшем, при исследовании грамматического рода, под предложением будем понимать дишь синтагмы типа существительное качественное прилогательное в положительной степени или качественное прилогательное в положительной степени существительное.

Рассмотрим теперь следующие четыре последовательности латинских слов 1 dies день, diem днем, rem 2 lupi волчий, lupus волк, urceolorum, librorum, libros 3 vir мужчина, viro, puero 4 mulierem, aestatem, aestates, instructiones. Для всех этих последовательностей слов характерно то, что в каждой из них два соседних слова либо входят в одну парадигму т.е. являются словоформами одного слова, либо принадлежат одному дистрибутивному классу другими словами встречаются в одних и тех же контекстах.

Так, например, lupi и lupus относятся к одной парадигме, urceolorum и librorum относятся к одному дистрибутивному классу и т.д. Такая последовательность слов иллюстрирует понятие цепочки P является разбиением латинского словаря на парадигмы, а S на семейства. Число элементов в цепи будем называть е длиной. Так цепи 1 и 3 имеют длину 3, цепь 4 длину 4, а цепь 2 - длину 6. Цепи 1, 2, 3 и 4 показывают, что слова dies и rem могут быть соединены цепью длины 3 lupi и libros могут быть соединены цепью длины 6 и т.д. Использование цепей для определения грамматических родов очень естественно, так как понятие цепи является не чем иным, как объединением двух фундаментальных сторон грамматики - парадигматики и синтагматики.

Именно такое объединение и необходимо для теории рода, потому что говоря неформально из того, что два существительных относятся к одному и тому же роду, не следует, что они принадлежат к одной и той же парадигме, либо к одному и тому же дистрибутивному классу.

И лишь установив взаимосвязь парадигм с дистрибутивными классами, можно решить эту проблему. Понятия цепи и длины цепи позволяют получить такое определение мужского и женского грамматических родов, которое предполагает переход от естественного рода к грамматическому. Сформулируем сейчас правила, которые являются нестрогими и неформальными, но они позволяют объяснить многие конкретные факты английского, французского, итальянского, испанского, румынского, русского и немецкого языков.

Все эти факты будут проинтерпретированы как иллюстрации нижеследующих правил. Существительное относится к мужскому грамматическому роду, если любая словоформа его парадигмы может быть соединена с любой словоформой парадигмы слова посредством цепи, длина которой не превышает 3. Из этого непосредственно следует, что и принадлежит мужскому грамматическому роду. Существительное относится к женскому грамматическому роду, если любая словоформа его парадигмы может быть соединена с любой словоформой парадигмы слова посредством цепи, длина которой не превышает 3. Из этого непосредственно следует, что и принадлежит женскому грамматическому роду. Существительное относится к среднему роду, если оно не относится ни к женскому ни к мужскому роду. Существительное относится к общему роду, если оно принадлежит как мужскому, так и женскому роду. Эти правила характеризуют категорию грамматического рода во многих естественных языках.

Считается, что эта категория является невырожденной для существительных данного языка в том случае, когда в этом языке существует по крайней мере одно существительное мужского рода, которое нельзя отнести к женскому роду, и по крайней мере одно существительное женского рода, которое нельзя отнести к мужскому роду. 6.