Насколько линейна реализация фонем в речи? Психофонетика и письмо.

В начале лета 1961 г. мне предоставилась возможность поработать в лаборатории Л.А. Чистович в ленинградском Институте физиологии. Я пользовался только что разработанным В.А. Кожевниковым прибором, который давал исключительно точную картину движений разных органов речи при произнесении русской фразы. Целью моей поездки было обсуждение теории соотношения артикуляции и распознавания речи, предложенной Чистович. Но попутно мы хотели уточнить и понимание временной организации речи, для чего я старался возможно тщательнее измерить длину соответствующих отдельным фонемам отрезков на кривых, начерченных прибором при записи многократных произнесений одного и того же предложения (вычисления мы еще делали вручную на логарифмической линейке и тратили массу времени на то, что сейчас бы за нас быстро посчитал компьютер). В некоторых случаях обнаружилось несовпадение того, что я видел и измерял на лабораторных кривых, и линейного представления последовательности фонем, с которым мы оперируем теоретически и в так называемой «фонологической транскрипции». Например, в такой русской форме, как швы [švy], две первые согласные фонемы в своей речевой реализации не следуют друг за другом, а произносятся одновременно. Незадолго до того, живя летом в Пицунде, я брал уроки абхазского у одного из местных жителей и среди прочего пытался правильно научиться произносить огубленные шипящие спиранты. Разглядывая и измеряя записи движений языка и губ при произнесении сочетания русских шипящих с губными, я убедился, что произносим мы почти то же, что абхазы. Но фонологическая функция различна.

Если движения органов речи, нужные для реализации двух или больше фонем, совместимы друг с другом, они и совершаются в одно время — параллельно, а не последовательно[3]. Мы часто говорим об отдельных явлениях, которые объясняются взаимовлиянием следующих друг за другом фонем; для этого есть обозначения — ассимиляция, лабиализация, палатализация, в более широком понимании — умлаут, сингармонизм. Меньше изучено то, в какой мере одна фонема перетекает в другую, как они сплавляются друг с другом[4], а также и с суперсегментными (просодическими, в частности, тоновыми и акцентуационными, характеризующими целый слог или целое слово) признаками. В те годы (еще перед своей эмиграцией) А.С.Либерман (отчасти продолжая направление последних исследований С.Д.Кацнельсона) начал изучать придыхание и ларингализацию (прежде всего — исландскую) в связи с германской акцентуацией. Еще не зная об этих работах, я в нескольких статьях пытался увидеть связь гортанной смычки или глоттализации с определенным тоном на материале разных языков- от латышского, где я впервые это заметил, еще занимаясь им в студенческие и аспирантские годы (происхождение латышской прерывистой интонации из акутового тона в парадигмах с подвижным ударением обнаружил патриарх балтийского языкознания Я. Эндзелин, с которым я обсуждал эти вопроcы в его поместье «Нака» на Даугаве летом 1953 г.), до енисейских — кетского и вымиравшего югского, которые я изучал во время экспедиции в Западную Сибирь в 1962г. А еще позднее типологией взаимозависимости глухости-звонкости и высокого- низкого тона, описанной в некоторых языках Новой Гвинеи, да и в нескольких других, я пытался объяснить явления, отвечающие закону Венера в германском (в частности, звонкость начального согласного в готской приставке ga-, немецк. ge-, родственной лат. com).

Находившаяся в становлении область занятий, которая увлекала в ту пору меня и Чистович, была по сути современным вариантом «психофонетики» Бодуэна[5] и Поливанова, который уже писал о возможной одновременности кинем – произносительных единиц, выделявшихся им (вслед за Бодуэном) внутри фонемы[6]. Несколько позднее я пришел к двойственному пониманию этой науки. Звуки речи можно рассматривать по меньшей мере с двух совершенно разных точек зрения. Одна – внешнего наблюдателя, который слышит речевой поток, записывает его или производящие его движения, как прибор Кожевникова или спектрограф, пробует, как любой фонетист, сегментировать этот поток или его запись прибором и описать их согласно принятой общефонетической схеме. Для такого стороннего наблюдателя в принципе безразлично, кто или что произносит анализируемые звуки – человек, синтезатор речи или компьютер. Другая точка зрения – изнутри говорящего, который знает, какие слова и в каких сочетаниях он хочет произнести. Этот последний взгляд – субъективный, он и касается фонологической структуры языка как такового[7]. Само разбиение непрерывного звукового потока на фонемы определяется унаследованными характеристиками памяти человека: фонологическая система зависит от ограничений, наложенных эволюцией на устройство, которое этой системой пользуется. Позднее, участвуя в совместных обсуждениях с теми, кто готовился к возможному общению с внеземными цивилизациями, я пробовал им объяснить, что система с другими параметрами могла бы и не делить речевой поток на части так, как мы это делаем. Какие отделы центральной нервной системы во взаимодействии друг с другом отвечают не только за речевые движения, но и за построение и использование всей системы фонем и других уровней языка, начинает открывать нейролингвистика. Кроме заинтересовавшего нас вслед за Якобсоном и Лурия (в лаборатории которого с его сотрудниками в Институте нейрохирургии я с начала 1960-х годов занимался лингвистическим анализом афазий) патологического материала, относящегося к нарушениям этих систем, в последнее время становится доступной для наблюдения (по мере внедрения новых и пока еще весьма несовершенных методов получения образов мозга и кровотока в нем) и обычная работа речевых зон мозга в норме[8].

Удивительность человеческого языка с эволюционной точки зрения состоит и в том, как органы, ставшие нужными для речи (но в начале имевшие другие функции), были использованы в качестве клавиатуры столь сложно построенного инструмента. Рядом с этим шло и развитие управляющих ими систем. Новые исследования позволяют отнести формирование таких частей нейролингвистической организации человека, как речевая зона Вернике, по меньшей мере на 8 миллионов лет вглубь нашей эволюционной предыстории[9]. А cпецифический нервный путь фильтрования звуковой информации с целью обнаружения в ней полезных коммуникационных сигналов (в отличие от других, в частности, от используемых для ориентации в пространстве) восходит к гораздо более ранней предыстории приматов (он был обнаружен сперва у обезьян и лишь недавно получил подтверждения в исследования параллелизма оптического и акустического восприятия у человека[10]). Среднее число фонем в языках мира (от 11-15 в языках тихоокеанского и частично южноамерикиканского[11] ареала – типа айнского и полинезийских с минимальным числом согласных, о чем в свое время специально писал Одрикур, – и до 81 в абхазском) соответствует среднему числу сигналов у приматов и других млекопитающих. Развитие у человека пошло по пути не увеличения числа элементов системы, а введения иерархических уровней, надстроенных над запасом, который унаследован от более ранних этапов эволюции. Если успехи гуманитарного знания в наступившем веке будут зависеть (как предполагали многие) от соединения достижений естественных наук, прежде всего биологии, с еще мало изученным с этой точки зрения материалом наук о человеке, то нейролингвистика и психофонетика окажутся теми областями, где продвижение в этом направлении уже начинается.

Одной из первых работ, где убедительно была показана психологическая реальность фонем (или «звукопредставлений» в ранней терминологии Бодуэна и Поливанова), была статья Сепира, который пользовался в качестве аргументов примерами того, как индейцы записывают фонемы своих языков (я бы мог привести аналогичные примеры из наблюдений над тем, как кеты, после ареста создателя их первого лaтинского алфавита Каргера не имевшие своего признанного советской властью письма, тем не менее, успешно записывали свой язык в 1960-е годы). Письмо представляет значительную ценность для понимания психологии фонологического анализа у того, кто им пользуется, как показал Лурия в пионерских исследованиях, где на материале аграфии он сравнил (мор)фонологическое письмо (русское) с полуиероглифическим или полулогографическим (французским).

Кажется возможным обратить внимание по меньшей мере на две средневековые евразийские системы письма, в которых отражены существенные свойства взаимодействия фонем на протяжении сингармонического слога и слова (а иногда и более длинной последовательности). Я имею в виду тот вариант курсивного письма брахми, которым пользовались во второй половине I тыc. до н.э. для записи тохарских (А и B) текстов, а также древнетюркское руническое письмо, вероятно испытавшее структурное влияние тохарского варианта брахми (хотя возможно, что сами по себе рунические тюркские знаки были заимствованы из согдийского письма). В тохарском письме кроме перенятых из древнеиндийского знаков в форме, обычной для центральноазиатского брахми, есть ряд дополнительных cлоговых знаков, в том числе для передачи гласного переднего ряда ’ä, и целый класс «чужих знаков». Последние в соответствии с их истолкованием Дж. Рейтером и Н.Д.Мироновым могут пониматься как обозначение палатализованных фонем [k’], [t’], [p’], [s’], [ş’], [ŝ’], [ts’], [n’], [m’], [l’] либо в сочетании с последующим гласным переднего ряда ä , либо в позиции в конце слова и в некоторых других не перед этим гласным. Признак палатализации может при этом распространяться и на соседние слоги и слова, а не на один только слог, обозначаемый данным «чужим знаком» в комбинациях с другими (при чем, как и во всех лигатурах в древнеиндийских системах письма, расположение элементов не линейное, а вертикальное, что при строго фонетическом характере письма иконически вопроизводит одновременность произнесения). Образуется длинная последовательность, которая вся в целом обладает различительным признаком палатализованности. Так, например, сплошной последовательностью «чужих знаков» передается числительное тохарск. B pañ känt [12]«500» (родственно рус. пятьсот).

Точно так же построена система тюркского рунического письма, делящая все согласные в зависимости от того, следуют ли за ними гласные переднего или заднего ряда: в пределах сингармонического слова соблюдается и слоговой сингармонизм. Типологически сходное явление, отраженное и в старославянском письме (но без введения специальных отдельных знаков для большинства палатализованных согласных и при наличии лишь дополнительных знаков их смягчения) дало основание Роману Якобсону реконструировать слоговой сингармонизм для славянского, входившего, как и тюркский и тохарский, в выявленный тем же Якобсоном евразийский языковой союз. Важнейшей приметой этой языковой зоны было наличие парных противопоставлений палатализованных и непалатализованных согласных. Для теории языка кажется важным то, что распространение признака палатализованности на длинную последовательность фонем препятствует дискретному восприятию каждой из них. В сингармоническом палатализующем («палатализованном» по терминологии Поливанова) языке слог и слово, а не фонема, становятся основными фонологическими единицами, а признак палатализованности может охватывать целую слоговую и словесную цепочку.