рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Остаточная энтропия языка и сложность.

Остаточная энтропия языка и сложность. - раздел Лингвистика, Лингвистика третьего тысячелетия: вопросы к будущему   Начало Второй Половины Xx-Го Века Ознаменовалось Несколькими ...

 

Начало второй половины XX-го века ознаменовалось несколькими крупными открытиями, которые обозначили новый этап в развитии науки в целом. Назову те из них, которые вошли в научный обиход на моих глазах в период моего научного становления и подтвердили важность дешифровочного подхода (который стал моделью всех крупных научных достижений): для меня самыми значительными были обнаружение в 1953 г. генетического кода[92] (результат подготовивших работу Крика и Уотсона исследований, с самого начала, в поисковых работах Гамова, ориентировавшихся на лингвистическую модель), выявление реликтового излучения (подтвердившего надежность методов реконструкции исходного состояния в физике и космологии: между высказанным тем же Гамовым в 1948 г. предположением о возможности этого излучения и его открытием в 1965 г. прошло 17 лет), дешифровка в 1952 г.[93] письменности майя Ю.В.Кнорозовым (основанная на его теории коммуникации, тем самым прошедшую проверку опытом) и в 1956 г. крито-микенской письменности Вентрисом и Чедвиком (которые убедительно показали значимость выявления формальных структур[94]). Но едва ли не самым поразительным для всего моего поколения было знакомство с теорией информации, которая дала возможность измерять то, что относится к духовной деятельности человека, необычайно раздвинув тем самым границы точного человеческого знания. Меня заинтересовала работа Шеннона о теоретико-информационном подходе к дешифровке (вскоре удалось вместе со Шрейдером и Пробстом приступить к реализации кнорозовского проекта дешифровки с частичной помощью компьютеров). Мне кроме того еще повезло в том отношении, что я в 1960 –1963 гг. принимал участие в тех занятиях А.Н. Колмогорова[95] стихом и языком, которые привели к созданию его теоретико-информационной модели стиха, а потом и к идее сложности.

Энтропия языка по А.Н. Колмогорову складывается из чисто смысловой информации или информационной емкости (h1) и гибкости или остаточной энтропии (мера синонимии g= h2):

(1) H= h1 + h2 .

Поскольку второе из этих слагаемых может быть получено из энтропии в целом путем вычитания другой составляющей - информационной емкости, в том же смысле можно говорить об остаточной энтропии: та энтропия, которая остается после выражения определенных мыслей, может быть затрачена на избранный метр, переносы, характер рифмовки и другие особенности художественной формы. Эти затраты энтропии на поэтическую форму могут быть точно подсчитаны. Если коэффициент b, характеризующий ограничения, налагаемые стихотворной формой, и определяющий соответствующую свободу обращения поэта со словесным материалом, больше гибкости языка или остаточной энтропии g:

(2) b > g ,

то выражение заданной мысли в данной форме невозможно. Поэтому неравенство

(3) g < b

является необходимым условием для осмысленного поэтического творчества и стихотворного перевода.

Энтропия языка в общем случае при комбинаторном подходе понимается Колмогоровым как «показатель разветвленности возможностей продолжения речи при данном словаре и данных правилах построения фраз»[96]; для русского языка в целом она была оценена сотрудниками Колмогорова как

(4) H= 1,9 ± 0,1.

Однако стилистические ограничения, характеризующие литературный жанр, снижают оценку энтропии, получаемой при угадывании последующих букв, до

(5) Hlit= 1,1 ± 0,1.

Для русского классического рифмованного ямба затраты остаточной энтропии по Колмогорову составляют

(6) h2= 0, 4.

В таком случае информационная емкость для этого жанра русского языка предположительно характеризуется как

(7) h1= Hlit - h2= 1,1-0, 4= 0,7 .

Эту последнюю величину можно также оценить экспериментально, сравнив между собой разные русские переводы одного и того же иностранного текста или разные русские словесные описания ситуации, изображенной на одной и той же картине, схеме или географической карте. Исследованием синонимии в последние десятилетия также занимались специалисты по лексической семантике, которые (иногда - как Анна Вержбицкая - прямо следуя за давней мыслью Лейбница) пробовали ввести набор основных семантических единиц. С их помощью можно описать более отвлеченную часть обиходного словаря языка и синонимические преобразования, его характеризующие. Можно надеяться, что развитие исследований синонимии естественного языка (в частности, русского, для которого в последнее время выполнены работы по синонимическому словарю, идущие в том же направлении) может привести и к оценке той остаточной энтропии, которая характеризует гибкость языка. При усложнении поэтической формы и соответственном повышении затрат на нее остаточной энтропии гибкость поэтического языка может быть увеличена путем более широкого употребления слов в метафорических значениях. Семантическая структура языка запрещает только смешение значений слов внутри одного конкретного семантического поля (например, названий музыкальных инструментов или растений и их частей), но в поэтическом языке любое слово одного семантического поля может быть использовано как метафорическое обозначение денотата слова другого семантического поля (Стволы извилисты иголы Как будто арфы и виолы у Мандельштама). Поэтому повышенная образность произведений с особенно изощренной поэтической формой (например, «Божественной комедии» и продолжающих ту же традицию терцин Пушкина и Блока) легко объясняется в соответствии с неравенством (3).

С этой точки зрения для сравнительно-исторической поэтики значительный интерес может представить техника древнеисландских кеннингов, для которых в работах по реконструкции индоевропейской поэзии указаны прообразы в кеннингах общеиндоевропейских (отраженных уже у Гесиода и Гомера). Логическая структура кеннингов изучалась Ю.И. Маниным. Значительное повышение гибкости языка древнеисландских аллитеративных стихов, достигаемое благодаря систематическому использованию кеннингов, указывает на то, что при жесткости формальных ограничений, наложенных на стих, оказывалось необходимым повышение остаточной энтропии.

Обе введенные Колмогоровым величины - чисто смысловая информация (h1) и гибкость или остаточная энтропия (мера синонимии g= h2) могут быть оценены количественно, что представляет собой значительный шаг вперед по пути создания эстетики как экспериментальной научной дисциплины, о чем мечтал еще Андрей Белый. Сама необходимость и возможность дать оценку каждой из этих двух величин в их взаимозависимости обусловлены двусторонним знаковым характером поэтического текста - наличием в нем плана содержания (семантики) и плана выражения, в письменном языке кодируемого буквенным письмом (отсюда расчеты количества информации, приходящегося на одну букву текста). Занятия этой областью стохастической семиотики подвели Колмогорова к выработке теории сложности, представляющей также крупный шаг в развитии тех аспектов математического знания, которые важны для науки в целом. В частности, им были предложены методы исследования уникального сообщения, не входящего в совокупность других сообщений, подобных данному, а стоящего вполне особняком (случай, особенно важный для истории художественной литературы и других видов искусства).

Отчетливое понимание этой особенности словесного и других искусств привело Колмогорова к такому изложению основ теории информации, которое строится вне обращения к теории вероятностей. Вместе с тем понятия «энтропии» и «количества информации» оказываются применимыми к индивидуальным объектам, в частности, таким, которые являются произведениями художественной литературы или других видов искусства.

Благодаря этому толкованию теории информации в контексте теории алгоритмов центральным становится понятие сложности программы P, по которой строится индивидуальное сообщение. Сложность определяется длиной этой программы.

Современная математическая теория стиха, позволяющая приближенно оценить сложность программы построения cтихотворного текста, может быть одной из иллюстраций подобного подхода к индивидуальным сообщениям.

– Конец работы –

Эта тема принадлежит разделу:

Лингвистика третьего тысячелетия: вопросы к будущему

На сайте allrefs.net читайте: "Лингвистика третьего тысячелетия: вопросы к будущему"

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Остаточная энтропия языка и сложность.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Вопросы к будущему
Хотянаучное языкознание, достаточно cтрогая система которого была представлена уже у Панини[1], существует более 3 тысяч лет, главные его проблемы только еще начинают формулироваться. Их подробное

Насколько линейна реализация фонем в речи? Психофонетика и письмо.
В начале лета 1961 г. мне предоставилась возможность поработать в лаборатории Л.А. Чистович в ленинградском Институте физиологии. Я пользовался только что разработанным В.А. Кожевниковым прибором,

Субморфы и их значимость.
В работе А.А.Зализняка о русском именном словоизменении , представляющей вместе с его грамматическим словарем одно из наиболее полных и четких морфологических описаний целой системы форм, получила

Сокращение и изнашивание морфов.
  Как заметил еще Поливанов[18] и показал Аллен в работе об абазинском глагольном комплексе, сходные с инкорпорацией структуры возникают в абхазо-абазинском. Еще до знакомства с этой

Из скольких частей состоит предложение? Проблема начальной группы частиц.
Одним из важных открытий развившегося за последние десятилетия исследования разных индоевропейских анатолийских языков (северных или по их доисторическому расположению восточных, к которым относятс

Грамматические универсалии. Глагол и имя.
В какой мере описание каждого отдельного языка может опираться на принципы общей грамматики, считающиеся выясненными? Большинство авторов руководств по языковедческой теории учит, что категории гла

Пути семантических исследований. Распределение семантических и грамматических типов значений в мозге.
Лет сорок с небольшим назад нашу тогда дружно работавшую группу совсем молодых лингвистов привлекала задача автоматического (машинного, как мы тогда говорили)перевода (в полном виде, о котором мы т

Мы занимались, напр., тем, как соотносится
1) санскрит. dharma «закон, учение» - одно из основных трех «сокровищ» (ratna-)или «прибежищ» (śarana-), на которых основан буддизм, = пали dhamma =тох. A mä

Какие грамматические структуры совпадают в разных языках?
При подвижности границ между грамматическими и лексическими морфемами набор тех категорий, которые выражаются с помощью обязательных морфологических или аналитических синтаксических средств в разны

Что создается заново и что запоминается? Текст как целое. Данные нейролингвистики.
Бахтин был первым, кто настаивал на необходимости «металингвистики» (Р.Барт предложил позднее термин «транслингвистика») - науки, которая занимается текстом и выходит за пределы предложения, на кот

Языковая ситуация мира и прогноз на ближайшее будущее.
  Всего в мире в конце завершившегося века было больше 6000 языков[69]. Согласно часто высказывавшемуся прогнозу, в ближайшие десятилетия останется не более десятой их части- около 60

По-просту»: языки Великого княжества Литовского.
Одним из особенно интересных примеров взаимодействия многих языков, систем письма, вероисповеданий, этнических групп на территории одной страны была на протяжении нескольких столетий (с XIV и XVI I

Языки большого города.
  Большие языки современности сохраняются в диаспоре и в сочетании с другими в многоязычии при наличии компактных этнических групп. На всем протяжении многотысячелетней истории городо

Языковая биография личности.
  Нейролингвистические данные показывают, что новорожденный уже отличает голос матери от других звуков, в частности, музыкальных. Можно думать, что языковое развитие начинается еще в

Методы реконструкции и их роль.
  Проблема реконструкции представляет интерес для всех наук, исследующих изменение во времени[80] и имеющих дело с косвенными данными, по которым можно пытаться восстановить прошлое (

Связи между макросемьями
  Особенностью того развития, которое сравнительно-историческое языкознание получило на протяжении прошлого века, в особенности благодаря работам В.М. Иллича-Свитыча и его последовате

Аффективная сторона текста. Уменьшительность: четверостишие Бунина и тохарские параллели.
Несколько течений в лингвистике начала прошлого века (Бальи и Вандриеc, школа Фосслера и Шпитцер) правильно отмечали значимость аффективной стороны языка. Это направление не получило значите

Парные слова с начальным губным носовым.
Одной из наиболее впечатляющих программ будущих возможных исследований связи звучания и значения в языке (особенно поэтическом) для меня остается глава к последней книге Романа Якобсона (написанной

Синэстезия: Хлебников, Рембо, Скрябин.
  Цветовые соответствия фонемам языка меня начали занимать (а в каком-то смысле и мучить) достаточно рано, когда (начиная с 1944 г., т.е. с четырнадцати с лишним лет; для желающих исс

Замечания к проблеме методологии гуманитарных наук.
С самого начала моих размышлений о языке и языкознании (после того как я в 1947 г. прочитал Соссюра и Сепира), я стал думать о соотношении этой науки с более общим занятиями знаками (семиологией Со

Иванов, Вяч. Вс., Избранные труды по семиотике и истории культуры, тт. I- I I. М. : Языки русской культуры. 1998, с. 52-58; 2000.
Иванов, Вяч. Вс., Хеттский язык. М.: УРСС, 2001 (2 изд.). Иохельсон, В.И., Алеутский язык в освещении грамматики Вениаминова.-Известия Российской Академии Наук, 1919, №№ 2, 4

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги