close

Вход

Забыли?

вход по аккаунту

?

Кодзасов С.В., Кривнова О.Ф. - Общая фонетика - 2001

код для вставкиСкачать
В основе учебника лежат курсы лекций по общей фонетике, которые читались авторами на отделении теоретической и прикладной лингвистики филологического факультета МГУ и на лингвистическом факультете РГГУ. Одинаковое внимание уделено как субстанциально
Москва 2001 Общая фонетика ОГЛАВЛЕНИЕ
ПРЕДИСЛОВИЕ 13 1 ПРЕДМЕТ ФОНЕТИКИ 17 Звуковой механизм речевой коммуникации 17 1.2. Звуковые единицы в языке и речи 22 Представление звуковой информации в словаре знаков 23 Связь звуковых единиц языка с артикуляцией и восприятием речи 25 1.3. Звуковые средства языка и фонетическая характеристика сообщения 26 Сегментные и звуковые средства 26 1.3.2. Признаковое строение звуковых единиц 28 1.4. Разделы фонетики 29 Литература к главе 1 2 АРТИКУЛЯЦИОННЫЕ МЕХАНИЗМЫ РЕЧИ 33 Фазы речепроизводства и задачи артикуляционной фонетики 33 2.2. Основные процессы речепроизводства и их анатомо-
физиологическая база 35 Дыхательная система 36 2.2.2. Гортань 36 Строение гортани 37 Речевые функции гортани 38 Гортань как модулятор воздушного потока 2.2.3. Надгортанные разделы речевого тракта 44 Глотка 44 Ротовая полость 44 Артикуляционные функции надгортанных органов 49 2.2.4. Вторичные функции речевых органов 49 2.3. Эволюционный аспект артикуляционной фонетики 52 2.4. Описание звука в артикуляционной фонетике 53 2.4.1. Основные типы звуковых артикуляций 53 Понятие целевой артикуляции звука Целевые артикуляции основных типов звуков 55 2.4.2. Двигательная реализация целевой артикуляции звука 62 Понятие артикуляционного жеста 62 Степень достижения артикуляционной цели в потоке речи 65 2.4.3. Взаимодействие звуков в потоке речи 67 Коартикуляция и аккомодация 67 Проблема фонетической сегментации речевого потока 71 2.4.4. Универсальные и конкретно-языковые черты коартикуляции 72 2.5. Элементы динамической модели речепроизводства 78 5 Оглавление 2.5.1. Управляющий компонент модели речепроизводства 78 Понятие координационной двигательной структуры 78 Координационные структуры артикуляции 80 Организация управляющего компонента и двигательные цели артикуляции 83 программы артикуляции 86 Роль обратных связей в управлении артикуляцией 90 2.5.2. Исполняющий компонент речепроизводства 92 2.5.3. Артикуляция как частный случай двигательной активности 93 2.6. Методы исследования артикуляции 93 Литература к главе 2 97 3 АКУСТИКА РЕЧИ 99 Акустическая фаза речевого процесса и задачи акустической фонетики 99 3.2. Элементы акустической теории речеобразования 100 3.2.1. Основные положения акустической теории речеобразования 101 3.2.2. Источники звука в речи 105 Голосовой источник звука 105 Турбулентный источник звука Импульсный источник звука 114 Комбинаторика источников звука в речи 3.2.3. Частотно-избирательные свойства речевого тракта 115 Конфигурация речевого тракта и его передаточная функция Передаточная функция тракта при производстве ротовых гласных 120 Передаточная функция тракта при производстве согласных 133 Квантальная теория 140 Источники сведений о резонансной системе речевого тракта 142 3.3. Методы и средства акустического анализа речи 143 3.3.1. Осциллографическая запись речевого сигнала 144 3.3.2. Спектральное представление речевого сигнала 146 Мгновенные и динамические спектрограммы 147 Узкополосные и широкополосные спектрограммы 148 3.4. Акустические характеристики основных классов звуковых единиц 155 3.4.1. Фонетическая сегментация речевого сигнала 156 3.4.2. Зависимость акустических характеристик звуков от контекста Акустические характеристики гласных 3.4.4. Акустические характеристики шумных согласных 163 Шумные взрывные Фрикативные согласные 173 6 Общая фонетика Аффрикаты 176 3.4.5. Акустические характеристики сонорных согласных 177 Носовые согласные 177 Неносовые сонорные согласные 178 3.5. Акустические характеристики звуковых средств 183 3.5.1. Акустическая база супрасегментных звуковых средств 183 3.5.2. Акустические корреляты слоговой, словесной и фразовой просодии Слоговая просодия (слоговые тоны) 187 Словесная просодия Фразовая просодия Литература к главе 3 193 Глава 4 ВОСПРИЯТИЕ РЕЧИ 196 4.1. Этапы восприятия речи и задачи перцептивной фонетики 196 4.2. Прием и первичный слуховой анализ речевого сигнала в органах слуха 198 4.2.1. Наружное ухо 198 4.2.2. Среднее ухо 199 4.2.3. Внутреннее ухо 201 Фильтрующая функция базилярной мембраны 203 Рецепторный орган слуха 207 4.2.4. Кодирование звуковой информации в слуховом нерве 208 Общие характеристики слуха и основные психоакусти­
ческие шкалы 218 4.3. Обработка звуковых сигналов в центральных отделах слуховой системы 225 4.3.1. Выделение акустико-слуховых признаков звукового сигнала 226 4.3.2. Функциональная схема слуховой системы человека 230 4.4. Фонетически полезные признаки речевого сигнала 230 Методы исследования звукового восприятия речи 4.4.2. Акустические ключи для распознавания фонем и их последовательностей 235 Акустические ключи для слухового членения речевого сигнала 235 Основные акустические ключи для фонемной идентификации 238 Категориальность восприятия 247 Акустические ключи для идентификации супрасегментных звуковых средств 250 4.5. Лингвистическая интерпретация речевого сообщения 254 Восприятие речи и фонологическая интерпретация сообщения 254 4.5.2. Фонемная идентификация в условиях чисто звукового восприятия речи 256 7 Оглавление 4.5.3. Фонемная идентификация в обычных условиях восприятия речи 263 Литература к главе 4 265 УНИВЕРСАЛЬНЫЕ ФОНЕТИЧЕСКИЕ КЛАССИФИКАЦИИ 267 Базовые понятия классификационного описания 267 Понятие классификации 267 5.1.2. Понятие классификационного признака 267 5.1.3. Классификационный класс (категория) 268 Описание звуков через классификационные признаки 268 Устройство признаковой матрицы и классификационной таблицы 269 5.2. Фонетические возможности человека и их отражение в универсальных фонетических классификациях 271 5.2.1. Задачи универсальных фонетических классификаций 271 5.2.2. Артикуляционная и акустическая ориентация УФК 272 5.3. Универсальная фонетическая классификация МФА (сегментные звуковые единицы) 273 5.3.1. Классификация согласных 274 Признаки главных классов 274 Признаки инициации (способы формирования воздушного потока) 274 Признаки фонации 275 Признаки основной артикуляции у согласных 277 Сложные консонантные артикуляции 282 Согласные с количественно-динамическими контрастами 285 5.3.2. Классификация гласных 285 Признаки фонации 286 Признаки основной язычной артикуляции у гласных 286 Сложные вокальные артикуляции 287 Система кардинальных гласных 5.3.3. Об универсальности фонетической классификации МФА 294 5.4. Универсальная акустическая классификация звуков 295 5.4.1. Общая характеристика признаковой базы 5.4.2. Признаки главных классов звуков 297 5.4.3. Признаки, обусловленные источниками звука 298 5.4.4. Резонансные признаки, обусловленные основным резонатором 300 5.4.5. Признак назализации 303 5.5. Классификация супрасегментных звуковых средств 304 5.5.1. звуковые составляющие 304 5.5.2. Супрасегментные звуковые средства 307 Слоговые тоны 307 Словесное ударение Фразовая интонация 312 Интегральные фонетические установки 312 8 Общая фонетика 5.6. Универсальная фонетическая транскрипция 313 5.6.1. Транскрипция Международной фонетической ассоциации 313 Буквы для согласных Буквы для гласных 317 Диакритики 317 единицы 5.6.2. Другие транскрипции 319 5.6.3. Фонетическая и фонематическая транскрипции 321 Литература к главе 5 Глава 6 ТРАДИЦИОННЫЕ ФОНОЛОГИЧЕСКИЕ МОДЕЛИ 325 6.1. Классическая фонология. Теория Трубецкого 325 Звуки и фонемы 325 Правила фонематического анализа 331 Критерии дополнительного распределения и фонетической близости 331 Свободное варьирование 333 Критерии однофонемности/многофонемности 334 Проблема признака 335 6.1.3. Варианты понимания фонемы в традиционной фонологии 336 6.2. Морфологически ориентированная фонология (московская фонологическая школа) 338 Основные положения МФШ 338 Определение фонемы 338 Типы модификаций фонем 340 Сопоставление МФШ с другими традиционными фонологическими школами Трудности фонемной транскрипции 342 Понятия "звук языка" и "звукотип" 344 6.2.2. Поздние варианты теории МФШ 345 6.3. Транскрипция текста в традиционных фонологических школах 345 Литература к главе 6 347 ОПИСАНИЕ ЗВУКОВОЙ СИСТЕМЫ ЯЗЫКА В ТРАДИЦИОННОЙ ФОНОЛОГИИ 349 7.1. Принципы системного описания фонемного инвентаря 349 Классификация оппозиций 349 7.1.2. Корреляции и пробелы в системе фонем 352 7.1.3. Типы позиционной нейтрализации оппозиций 354 Нейтрализации, чередования и фонотактика 356 7.2. Структура фонологического описания 357 7.3. Примеры описания фонологических систем 358 Русский язык 359 Система согласных 359 9 Оглавление Система гласных 363 Фонотактика 366 Ударение 366 7.3.2. Английский язык 367 Система согласных 367 Система гласных 370 Фонотактика 371 Ударение 372 7.3.3. Арчинский язык 373 Система согласных 373 Система гласных 375 Фонотактика 375 Просодия слова 376 7.4. Особые фонетические подсистемы 377 Литература к главе 7 Глава 8 ИНТОНАЦИЯ 380 Принципы описания интонационной системы языка 382 Общие сведения об интонации 382 8.1.2. Специфические проблемы описания интонации 387 Интонационные единицы 387 "Сфера действия" интонемы 388 8.1.3. Исследовательские процедуры в интонологии 390 8.2. Система русских интонационных единиц 392 Акцентные средства 392 8.2.2. Интегральные интонационные средства 396 Интонационная система английского языка 397 8.3.1. Структура интонационной группы 398 8.3.2. Ядерные тоны 399 8.3.3. тональные структуры 400 8.3.4. Комбинаторные возможности 401 8.3.5. Функции интонации 401 Литература к главе 8 402 ФОНОЛОГИЧЕСКАЯ ТИПОЛОГИЯ 404 Фонологическая типология как предмет 404 9.1.1. Глобальная типология или частные типологии? 404 Типологическое и универсальное 406 9.1.3. Об инвентаре фонологических признаков 407 9.2. Типология вокалических систем 409 Вокалические параметры 409 9.2.2. Базовые типы систем 410 Треугольные системы 410 Прямоугольные системы Линейные системы 421 Промежуточные типы 422 10 Общая фонетика 9.2.3. Дополнительные признаки 423 Количественно-динамические признаки 423 Резонансные признаки 425 Сочетаемость дополнительных признаков 429 9.2.4. Сложные гласные 429 9.2.5. Вокалические универсалии 430 9.3. Типология консонантных систем 432 Шумные согласные 433 Основные признаки 433 Дополнительные признаки 444 Количественно-динамические признаки 444 Тембровые признаки 446 9.3.2. Сонорные согласные 447 Основные классы 447 Фонационные и дополнительные признаки 449 9.3.3. Большие и малые консонантные системы 450 9.3.4. Универсалии в области консонантизма 452 9.4. Структура звуковых цепей 452 Звуковые цепи в слоговых и неслоговых языках 455 9.4.2. Сегментная структура слова 460 9.4.3. Линейная тактика 462 9.5. Просодия 463 Просодия слога 463 Тон 463 Тембровые признаки 469 Примыкание 470 9.5.2. Просодия слова 471 Ударение 471 Тембровые просодии Литература к главе 9 482 Глава 10 ДИНАМИЧЕСКИЕ МОДЕЛИ В ФОНОЛОГИИ 485 Стандартный вариант порождающей фонологии 486 10.1.1. Функции фонологического компонента 487 10.1.2. Формирование фонологической репрезентации 488 Фонетическая репрезентация 490 10.1.4. Форма и организация фонологических правил 491 10.1.5. Оценка раннего варианта порождающей фонологии 494 10.2. Тенденции развития современной западной фонологии 495 10.2.1. Модификации генеративной фонологии 495 10.2.2. Развитие просодической фонологии 497 Интегральная модель звукового поведения 504 Компьютерная революция и новые задачи фонетики 504 10.3.2. Устройство интегральной фонологической модели 505 10.3.3. Формальные свойства модели 509 Структура словаря знаков 509 Структура единиц фонетического словаря Уровни представления Литература к главе 10 513 11 Оглавление Глава ЭЛЕМЕНТЫ ПРИКЛАДНОЙ ФОНЕТИКИ 514 Прикладная фонетика в компьютерную эпоху Области применения речевых технологий 515 Автоматический синтез речи 516 11.2.1. Немного об истории "говорящих" машин 516 Современное состояние автоматического синтеза речи 520 Лингвистический этап синтеза в системах Речь" 522 Акустический этап синтеза в системах 526 Автоматическое распознавание речи 529 Этапы развития 529 Распознавание ограниченного набора слов Распознавание слитной речи 532 11.2.3. Современное состояние проблемы 536 Лингвистический подход 536 Статистический подход 538 Общая оценка современного состояния автоматического распознавания речи 542 Литература к главе 543 ПРИЛОЖЕНИЕ 544 Физическая природа звуковых колебаний 544 Образование и распространение звуковых колебаний 544 Скорость распространения звука, длина волны и период колебаний 545 Распространение звуков в пространстве 547 1.2. Источники звука 548 1.3. Физический диапазон звуковых волн 549 2. Важнейшие типы звуковых колебаний 550 Чистый тон (простое периодическое колебание) 550 Основные физические величины, определяющие простые колебания 552 2. 2. Сложные звуковые колебания 557 Сложные периодические колебания 557 Сложные непериодические колебания 564 3. Свободные и вынужденные колебания 567 Свободные колебания 568 3.2. Затухающие колебания 571 3.3. Вынужденные колебания. Явление резонанса 573 Понятие резонансной кривой 575 Примеры различных резонансных систем 578 3.4. Функциональная характеристика фильтров и их типы 580 Литература к приложению 583 Предметный указатель 584 Общая фонетика Предисловие Настоящая книга входит в серию новых учебников для университетов России, подготовленных в рамках программы Института открытого общества (фонд Дж. В осно­
ве учебника лежит многолетний опыт чтения авторами кур­
са "Общая фонетика" на отделении теоретической и при­
кладной лингвистики филологического факультета (ОТиПЛ) Московского государственного университета им. Ло­
моносова. Система преподавания дисциплин, составляющих курс общей лингвистики, имеет на определенные осо­
бенности. Они обусловлены задачей подготовки лингвиста-
профессионала, обладающего широкими знаниями в облас­
ти как лингвистической теории, так и современных при­
кладных направлений. Объем сведений о звуковом поведе­
нии человека в семестровом курсе фонетики на превышает то, что дают обычные общефонетические курсы на филологических факультетах, не имеющих лингвистиче­
ской Необходимость в более широких фоне­
тических знаниях связана с бурным развитием современной фонетики, которое не позволяет ограничиться изложением известных прежде фактов и устоявшихся представлений. Фонетика конца XX века существенно отличается от фонетики середины века, на которую в основном ориентиро­
ваны существующие русские учебники. Это особенно хоро­
шо заметно при обращении к трудам международных фоне­
тических конгрессов последних лет: очевидно, ныне аб­
солютно преобладают естественно-научные и психологиче­
ские методы исследования звуковой коммуникации. Фонети­
ка все в большей степени становится точной наукой, напра­
вленной на изучение субстанции звуковой речи и компью­
терное моделирование ее порождения и восприятия. Для со­
временной фонетики характерен выход за пределы исследо­
вания смыслоразличительных противопоставлений речевых звуков и нарастание интереса ко всем аспектам звукового по­
ведения — интонации, экспрессивным функциям речи, ин­
дивидуальным и социальным особенностям произношения. Преобладающее внимание к естественно-научным ас­
пектам звукового общения находит отражение и в зарубеж­
ных учебниках по общей фонетике. В некоторых из них до-
13 Предисловие минирует информация о физиологии речи, в других деталь­
но рассматривается ее акустическая сторона, в третьих доста­
точно подробно описываются артикуляционные параметры всех звуковых противопоставлений, обнаруженных в языках мира. Общей чертой этих трудов является недостаточное ос­
вещение фонологической проблематики. Фонология не включается в общую фонетику, оказываясь разделом теоре­
тической лингвистики. Это отчасти связано с абстрактностью современной западной фонологии, а отчасти отражает разме­
жевание областей исследования и специализацию методов, которые сопровождают интенсивный рост любой науки. В своем учебнике мы попытались совместить естест­
венно-научную и технологическую ориентации современной фонетики и традиционный подход, придающий большее значение лингвистическим аспектам звукового поведения человека. Первая доминанта проявляется в более подробном (по сравнению с другими отечественными руководствами) изложении физиологической базы фонетики и физической стороны звучащей речи. Одна из главных целей учебника — научить студента "читать" акустические графики (осцилло­
граммы и спектрограммы) образцов звучащей речи и давать артикуляционную интерпретацию наблюдаемых акустиче­
ских различий. К субстанциально ориентированным главам примыка­
ет изложение современной признаковой классификации, отражающей смыслоразличительные звуковые возможности языков мира. Оно сопровождается описанием новейшего ва­
рианта универсального алфавита транскрипционных знаков, принятого Международной фонетической ассоциацией Вторая доминанта книги определяется традицией лин­
гвистического описания звукового строя языка. Здесь в цен­
тре внимания находится изложение идей классической фо­
нологии. В главах, посвященных традиционной фонологии, объясняется, как строится фонологическое описание, а в ка­
честве образцов обсуждаются звуковые системы русского, английского и арчинского языков. На материале этих язы­
ков рассматриваются и методы изучения интонации, кото­
рая начинает играть все большую роль в исследованиях зву­
чащей речи. Теория описательной фонетики теснейшим образом связана с типологией, поскольку типологические характери-
14 Общая фонетика стики (тип вокализма, характер консонантных противопос­
тавлений, звуковая структура слога и слова) существенны для описания любой языковой системы. В лингвистике по­
следних десятилетий резко возрос интерес к типологической проблематике. Этому способствовало получение новых фо­
нетических сведений об "экзотических" языках. Важное зна­
чение имеет и создание компьютерных баз данных, содержа­
щих представительную информацию о всех языковых семь­
ях мира. В типологической главе учебника мы используем эти новые информационные источники. В современную эпоху традиционные фонологические модели, ориентированные на классификационные задачи описательного языкознания, оказываются недостаточными. На первый план выдвигается моделирование реальных про­
цессов производства и восприятия звуковой речи. Многие из них получают естественное переосмысление в прикладных разработках, связанных с компьютерной имитацией звуко­
вых процессов, - синтезом и распознаванием речи. Неслу­
чайно учебник завершается главами, посвященными дина­
мическим моделям в фонологии и современным компьютер­
ным приложениям фонетики: за ними стоит будущее этой стремительно развивающейся научной дисциплины. Хотя мы стремились пропорционально отразить в учеб­
нике разные области фонетического знания, все же личный исследовательский опыт каждого из нас сказался на объеме разделов. Активная вовлеченность О.Ф. Кривновой в при­
кладные исследования способствовала детальности изложе­
ния в главах, касающихся звуковой субстанции речи. На объем и содержание типологической главы повлияли много­
летние полевые исследования разнообразных языков Рос­
сии, в которых участвовал Кодзасов. Такое распределе­
ние акцентов обусловлено не только личными интересами авторов — оно отражает два главных фокуса в учебной и ис­
следовательской деятельности ОТиПЛа: это прикладные разработки и изучение языков разного типологического строя. Подобная научная направленность, несомненно, свя­
зана с личностью руководителя отделения и заведующего ка­
федрой теоретической и прикладной лингвистики МГУ -
Кибрика. Мы выражаем глубокую признательность ему, всему коллективу кафедры и многим коллегам за поддержку нашей работы и плодотворные обсуждения программы кур­
са "Общая фонетика" и рукописи данного учебника. 15 Предисловие Мы хотели бы также с глубочайшим уважением упо­
мянуть тех замечательных ученых, труды которых сыграли наибольшую роль в становлении нашего научного мировоз­
зрения и так или иначе повлияли на содержание данной книги. Это Щерба, Трубецкой, Аванесов, Зиндер, Л.А. Чистович, Г. Фант, П. Ладефогед. Наша искренняя благодарность рецензентам Ви­
ноградову, Р.К. Потаповой, Златоустовой и Князе­
ву за ценные замечания, которые помогли нам устранить ряд недостатков рукописного текста книги. Учебник не мог быть написан без многократной "об­
катки" курса общей фонетики на ОТиПЛе. Взаимодействие со студентами, возможно, было главным фактором, способ­
ствовавшим лучшему изложению многих тем. Спасибо на­
шим ученикам, их уроки были для нас особенно полезны. Глава 1 ПРЕДМЕТ ФОНЕТИКИ Слово фонетика происходит от греческого слова что означает "звук, звучание". Современная фонетика - это научная дисциплина, которая занимается изучением звуко­
вой стороны речевой коммуникации. Она представляет со­
бой огромную область знания, в создании и развитии кото­
рой принимают участие представители самых разных наук: лингвисты, физиологи, психологи, физики-акустики, специ­
алисты в области компьютерных речевых технологий. Уче­
ные единодушны во мнении, что только в результате совме­
стных усилий удастся понять сложнейшие механизмы звуко­
вой речи. На международных конгрессах фонетических наук в равной степени представлены результаты исследований во всех указанных областях. В данной книге будет рассмотрен прежде всего лингви­
стический аспект звуковой коммуникации, однако зачастую трудно отделить собственно языковые механизмы от взаимо­
действующих с ними общепсихологических и физиологиче­
ских механизмов речевой деятельности. Звуковой механизм речевой коммуникации Речевая коммуникация представляет собой особый вид взаимодействия людей, который связан с передачей разнообразной информации, относящейся как к внешне­
му, так и к внутреннему миру человека. От других спосо­
бов передачи информации, например, с помощью жестов, мимики, речевая коммуникация отличается тем, что ис­
пользует очень мощный и гибкий инструмент человеческо­
го языка. Коммуникативная функция языка базируется на его знаковой природе. Знаковые единицы языка, среди которых центральной является слово, имеют значение (означаемое) и звуковую форму (означающее). Означаемым слово обраще­
но к миру понятий, а означающим — к миру произнесений и звучаний. Слова являются основным строительным мате­
риалом речевых сообщений, и, как писал замечательный русский лингвист Л.В. Щерба, "некоторый их репертуар не-
17 Глава 1. Предмет фонетики обходимо иметь в памяти для осуществления речи" [Щерба 1974 а: 43]. Исходной формой речевой коммуникации является звучащая речь, в которой информация физически передает­
ся от одного человека к другому в виде звуковых колебаний. Однако во всяком цивилизованном обществе используется и коммуникация с помощью письма. В письменной речи ин­
формация физически воплощается в различных графических символах, обычно базирующихся на единицах звуковой фор­
мы речи. Письменная речь основывается на навыках письма и чтения, устная — на навыках произношения и звукового вос­
приятия. Специфические для каждой формы коммуникации умения совмещаются в сознании человека с общими мысли­
тельными и языковыми механизмами, которые позволяют формулировать и передавать информацию в процессе рения и извлекать ее в процессе понимания речи. Навыки письменной и устной речи, будучи тесно связанными, обла­
дают в то же время определенной автономностью. Поэтому возможны комбинации в их использовании: человек может читать вслух письменный текст с разной степенью проник­
новения в его внутреннее содержание (разной глубиной по­
нимания), может записывать звучащую речь, следуя прави­
лам письменной речи, и т. д. (рис. 1.1). Навыки общения с помощью звуков формируются у че­
ловека в раннем детстве вместе с усвоением родного языка. Для этого не требуется, в отличие от письма и чтения, какое-
либо специальное обучение. У взрослого человека навыки звукового общения настолько автоматизированы, что по­
строение речевых высказываний и их понимание не вызыва­
ет, как правило, никаких затруднений. При говорении нуж­
ные слова как бы сами собой "выскакивают" из памяти, при­
чем в нужной последовательности и форме, затем сами собой приводятся в движение речевые органы и возникают звуко­
вые При восприятии и понимании происходит обратный процесс, в ходе которого слушающий производит реконструкцию высказывания, произнесенного говорящим. Однако при попытке представить себе в деталях, какие задачи решают говорящий и слушающий, становится ясно, что эта простота кажущаяся: за ней скрываются весьма сложные языковые и внеязыковые явления. 18 Звуковой механизм речевой коммуникации 1 — Мозг 4 — Визуальный вход 8 — Письменный 2 - Мыслительные 5 - Глаз выход процессы 6 — Фонетический 9 — Речевой сигнал 3 - Языковые выход 10 — Слуховой вход процессы 7 — Речевой сигнал 11 — Ухо Рис. 1.1. Физические "входы" и "выхо­
ды" информации в устной и письмен-
ной формах речевой коммуникации • Рассмотрим на упрощенном примере, что происходит в единичном акте звуковой коммуникации. Допустим, что вы вместе с собеседником рассматриваете книгу с рисунками, на которых изображены различные животные и птицы. Ваш собеседник, увидев изображение незнакомой для него пти­
цы, спрашивает: "А это что за и вы ему отвечаете: "Это цапля". Что же скрывается за ответной репликой гово­
рящего? И как реагирует на нее ваш собеседник — слушаю­
щий? Общая схема этой коммуникативной ситуации пред­
ставлена на рис. а, на котором условно изображены уча­
стники коммуникации (говорящий и слушающий) и акусти­
ческий сигнал, выполняющий роль связующего физическо­
го звена в передаче информации от говорящего к слушаю-
19 Глава 1. Предмет фонетики щему. На рис. 1.2 б показаны основные этапы процессов го­
ворения и понимания речи. Говорящий вначале должен понять, что к нему обраща­
ются с вопросом о наименовании птицы, изображенной на рисунке. В соответствии с этим он формулирует свою собст­
венную коммуникативную задачу — сообщение о названии. Эта задача относится к этапу формирования коммуникатив­
ной цели сообщения на рис. 1.2 б. Далее на лингвистическом этапе (2) говорящий обра­
щается к своим языковым знаниям и строит языковое выра­
жение, передающее нужную информацию. Для этого из сло­
варя знаков извлекаются нужные слова в нужных граммати­
ческих формах и выбирается определенный порядок их сле­
дования. Конструируя языковое выражение, говорящий од­
новременно строит его фонетическую форму. Для этого ис­
пользуются означающие активированных языковых знаков и ряд фонетических правил. Полученную фонетическую стру­
ктуру можно рассматривать как лингвистическую програм­
му произнесения создаваемого речевого сообщения. О том, что представляет собой эта структура, будет сказано ниже, здесь же достаточно отразить ее с помощью обычной фоне­
тической транскрипции, принятой для русского языка: На артикуляционном, или речепроизводящем, этапе (3) на основе построенной фонетической формы вырабаты­
вается программа управления движениями речевых органов. Реализация двигательной программы приводит к образова­
нию артикуляционного потока — совокупности координиро­
ванных движений речевых органов, которые можно наблю­
дать и фиксировать с помощью специальных инструментов. На рис. 1.2 б приведена запись активности различных арти-
куляторов в реальном произнесении слова [цапл'ъ], осуще­
ствленная с использованием специальной регистрирующей аппаратуры [Чистович и др. 1965]. Движения речевых органов ведут к возникновению определенных аэродинамических и акустических процессов, что, в конечном счете, создает акустический речевой сигнал, который и является результатом речевой деятельности гово­
рящего Речевой сигнал может быть легко зафиксирован с помощью различных электротехнических средств (микро­
фона, магнитофона, компьютера). 20 Звуковой механизм речевой коммуникации Слушающий а) Участники коммуникативного акта б) Основные этапы коммуникативного акта ( пояснение к (3): г.г — губной контакт; к (1+2) — контакт кончика языка с нёбом; к.З — контакт перед­
ней части языка с нёбом; в.р. и в.н. — поток воздуха через рот и нос; лар. — сигнал с ларингофона; микр. — сигнал с микрофона; — отметчик времени) Рис. 1.2. Функциональная схема звуковой коммуникации Глава Предмет фонетики С этапа (5) начинается деятельность слушающего. Ре­
чевой сигнал достигает внутренних органов слуха, которые производят первичный анализ звуковых колебаний, превра­
щая звуковую волну в особое слуховое представление (слу­
ховую спектрограмму). Слуховая система далее выделяет в этом представлении акустические признаки, которые ис­
пользуются для идентификации (опознания) звуков языка. Эта идентификация осуществляется слушающим на лингвистическом этапе (6), в результате чего реконструиру­
ется исходная фонетическая характеристика высказывания, в частности его звуковой состав На основе рас­
познаваемой фонетической информации, словаря знаков и грамматики языка восстанавливается и все языковое выра­
жение. На последнем этапе который можно назвать собст­
венно пониманием, слушающий соотносит реконструиро­
ванное языковое выражение со своим запросом и формиру­
ет в памяти новое слово для обозначения птицы. Рассмотренная нами упрощенная схема показывает, что информация на пути от говорящего к слушающему про­
ходит целый ряд преобразований, которые касаются также и звуковой стороны речевого сообщения. Звуковые преобразо­
вания осуществляются особым механизмом, включающим три относительно самостоятельные, но в то же время тесно взаимодействующие подсистемы: звуковую систему языка (набор звуковых средств и правил формирования фонетиче­
ской характеристики высказывания), речепроизводящую (совокупность речевых органов и артикуляционно-двига-
тельных навыков) и (совокупность слуховых органов и перцептивно-фонетических навыков). Звуковые единицы в языке и речи Удобно начать изложение предмета и задач фонетики с краткого рассмотрения ее основных понятий. Предваритель­
ное знакомство с ними необходимо для введения в пробле­
матику фонетической науки. В последующих главах эти по­
нятия будут рассмотрены более детально. 22 Звуковые единицы в языке и речи Представление звуковой информации в словаре знаков В словаре знаков, хранящемся в человеческой памяти, информация о звуковой стороне слов и морфем записывает­
ся в виде последовательности минимальных звуковых еди­
ниц языка — фонем. Для языковой интуиции носителя язы­
ка кажется совершенно естественным представление звуча­
щего и произносимого слова в виде линейной цепочки от­
дельных звуков. Интуиция подсказывает также, что количе­
ство таких звуков в языке невелико (обычно 30-40), и с их помощью может быть представлено означающее любого языкового Сейчас фонетика уже знает, что ключ к пониманию этой интуиции лежит не в наблюдаемых формах речевых со­
общений (артикуляционных или акустических), которые бесконечно разнообразны и членятся физически по своим а в скрытых механизмах их интерпретации. Выда­
ющиеся лингвисты конца XIX — начала XX в. И.А. Бодуэн де Куртене, Щерба, Ф. де Соссюр, Трубецкой по­
казали, что бесконечно разнообразный звуковой поток в языковом сознании человека членится и организуется в не­
большой набор различаемых звуков-фонем. Ведущим мо­
ментом этой организации является оценка звуковых разли­
чий с точки зрения их значимости для построения и диффе­
ренциации языковых знаков. Только соединив воспринима­
емые звуковые различия со смысловыми, можно понять, как устроены означающие знаков и звуковая система языка в це-
С опорой на эту интуицию построено одно из величайших изобретений че­
ловечества — письмо, которое в вв. до н. за­
долго до возникновения лингвистики, реализовало на практике идею о воз­
можности представления звучащей речи небольшим набором звуков. Л.В. Щерба писал в 1912 "Изощряя наше самонаблюдение и в особенно­
сти наблюдая произносимое посредством приборов, можно констатировать, что разнообразие элементов акустических представлений ( фонем. — O.K.)
чрезвычайно велико, во всяком случае бесконечно больше, чем это обыкновенно Можно с уверенностью сказать, что число наблюдаемых оттенков будет все увеличиваться по мере усовершенствова-
средств наблюдения" [Щерба 1974 б: Время полностью подтвер-
дило этот прогноз Щербы: в современных автоматических системах синте­
за и распознавания речи, которые имеют дело с речевыми реализациями фонем, оказывается необходимым различать более 2 ООО контекстных оттен-
ков фонем. 23 Глава Предмет фонетики лом. Например, выделению согласного в слове [цапл'ъ] помогает наличие слов, в которых между звуками [ц] и [а] проходит морфемная граница: ср. лиц­о ~ лиц­а, а фонем­
ному членению слова [ул'ицъ] способствует наличие таких слов, как у (предлог), ли (частица), и (союз) и т. д. Для установления состава фонем в языке важно оце­
нить звуковые различия с точки зрения их обусловленности теми фонетическими контекстами, в которых они наблюда­
ются. Так, ударные гласные в русских словах сеть ~ сетка, эти ~ это, в плаще ~ в душе звучат по­разному, но обычно их различие носители русского языка даже не замечают (это не значит, что не воспринимают на Оно обусловлено влиянием окружающих согласных, их твердостью или мяг­
костью, и поэтому в русском языке не может быть самосто­
ятельной основой для различения слов. Во всех этих словах присутствует одна и та же фонема /е/. Однако во многих других языках такое же или очень близкое звуковое различие используется для различения слов: ср.
men
"люди" ~
man
"человек" в английском языке, Ehre
~
Ähre
"колос" в немецком,
et
~
est
"есть" во французском. В этих языках звуковое противопоставле­
ние между более закрытым и более открытым гласным не связано с фонетическим контекстом, оно самостоятельно и соотносится в каждом из этих языков с двумя разными фо­
немами. Таким образом, язык навязывает любому человеку, го­
ворящему на нем, совершенно определенную и одинаковую схему интерпретации звукового материала, основанную на связи смыслов и звучаний. В этом отношении звуковые средства языка не отличаются от лексических: известно, на­
пример, что эскимосский язык заставляет носителя языка различать лексически несколько видов снега, а в русском языке специальных слов для их обозначения нет. Точно так же русский язык вынуждает носителя языка различать 5 гласных фонем, а английский — 12 (не считая дифтонгов). Звуковые средства языка, несмотря на их кажущую близость к непосредственно наблюдаемому речевому мате­
риалу (артикуляции и акустическому сигналу), являются аб­
страктными образованиями, звуковыми представлениями В фонетике принято обозначать фонемы в косых скобках, а элементы фо­
нетической транскрипции — в квадратных. 24 Звуковые единицы в языке и речи или образами, принадлежащими языковому сознанию. Пси­
хологи говорят, что язык в целом — это прежде всего симво­
лы, с помощью которых фиксируется человеческий опыт, в том числе и опыт звуковой коммуникации на основе Поэтому звуковые средства языка можно рассматривать как смыслоориентированную систему звуковой транскрипции, которая вырабатывается в мозге человека в процессе обуче­
ния языку и используется далее в звуковой коммуникации. Фонемы являются минимальными смыслоразличительными единицами этой "транскрипционной" системы. Подчерк­
нем, что в процессе звуковой коммуникации носитель язы­
ка пользуется знанием фонемной системы неосознанно. За­
дачей фонетики является обнаружение и описание этой скрытой системы. Для решения указанной задачи использу­
ются специальные процедуры лингвистического анализа, позволяющие переходить от простой фиксации звучания к фонемному коду языка. 1.2.2. Связь звуковых единиц языка с артикуляцией и восприятием речи В процессе звуковой коммуникации фонемный сим­
вольный код взаимодействует с механизмом артикуляции и механизмом речевосприятия. Тот факт, что в речевой дея­
тельности эти механизмы обслуживают реализацию и вос­
приятие языковых выражений, не означает, что у них не мо­
жет быть собственных законов и "языков". В этой области пока больше вопросов и предположений, чем ответов и ус­
тоявшихся теорий. Однако для наших целей достаточно вы­
делить наиболее важные моменты взаимодействия систем, обеспечивающих звуковое общение. В процессе говорения, как уже отмечалось, строится фонетическая характеристика сообщения, которая является лингвистической программой произнесения. Фонетическая характеристика задается в терминах звуковых символов. При Психологическая сущность звуков человеческой речи рассматривается во многих работах Бодуэна де Куртене и Л.В. Щербы, которые не только не утратили актуальности, но поражают своей прозорливостью в настоящее время, когда лингвистика перешла от задачи описания языковых систем к исследованию реальной речевой деятельности. В частности, Щерба говорил о фонетике в ее собственно языковой части как о науке, которая "изучает звуковые символы" [Щерба 1974 в: 150]. 25 Глава 1. Предмет фонетики переходе к артикуляции это символьное фонетическое пред­
ставление необходимо перевести в двигательную программу, т. е. на "язык" движений речевых органов. Слушая речевое сообщение, мы восстанавливаем исходную фонетическую характеристику по результатам слухового анализа, или, ина­
че, осуществляем перевод с "языка" слуховых признаков на язык звуковых символов. Для лингвистической фонетики важно, что в звуковой коммуникации используются два ви­
да языков (кодов): символьный (языковой) и субстанциаль­
ный причем последний в двух раз­
новидностях — двигательной и слуховой. Ясно, что должны существовать какие-то правила переходов из символьного описания звучания в артикуляционное и из слухового опи­
сания снова в символьное. Для понимания звукового механизма речи необходимо также знать, чем отличаются преобразования звуковой ин­
формации на лингвистических этапах речевой деятельности от процессов, которые действуют в области артикуляции и слухового восприятия. Только так можно выяснить, как, где и почему возникает то многообразие различных физических реализаций одной и той же фонемы, которое столь характер­
но для человеческой речи. Звуковые средства языка и фонетическая характеристика сообщения Сегментные и звуковые средства Звуковая информация об означающем языкового знака не может быть сведена только к его фонемному составу, по­
скольку существуют звуковые явления, сферой реализации которых служат фонемные цепочки: слоги или слова. Такие явления относят к (от лат.
supra
"над") звуковым средствам языка, в отличие от фонем — сегмент­
ных единиц. Супрасегментные звуковые средства называют также просодическими (от греч.
prosodia
"ударение, при­
Они часто совмещают смыслоразличительную и орга­
низующую функции и могут использоваться как в словаре знаков, так и при построении фонетической характеристики высказывания. 26 1.3. Звуковые средства языка и фонетическая характеристика сообщения К наиболее известным просодическим средствам, кото­
рые реализуются в пределах слова, относятся словесное уда­
рение и слоговые тоны тональных Словесное уда­
рение хорошо знакомо носителям русского языка. В русском языке достаточно легко найти слова, имеющие одинаковый фонемный состав, но различающиеся местом ударного слога (ср. /мука/ ~ /пили/ ~ Но главная функция ударения состоит не в смыслоразличении, а в объединении слова в единый фонетический блок. Это осуществляется пу­
тем выделения одного из слогов в качестве фонетической вершины и подчинения ему остальных слогов слова. Таким образом, ударение есть своего рода ритмическая схема, сфе­
рой действия которой является звуковая оболочка слова, а регулируемым фонетическим признаком — степень выделен-
ности в слове. В полной мере эта схема реализуется при слова в фонетическую характеристику вы­
сказывания, т. е. в процессе говорения. В словаре знаков до­
статочно использовать свернутую символьную информацию в виде просодического маркера на ударном гласном, как это обычно и делается в произносительных или грамматических словарях для языков со свободным ударением. Пример словесного ударения показывает, что в языке, кроме минимальных смыслоразличительных звуковых еди­
ниц — фонем, могут использоваться схемы построения фонетических единств. Еще более широко, чем в словаре знаков, супрасег­
ментные звуковые средства используются при построении высказывания. В его фонетической характеристике обычно можно выделить несколько фонетических объединений — составляющих. Звуковые сегменты объединяются в слоги, слоги — в ритмические труппы (или фонетические слова), фонетические слова тоже группируются ритмически в более крупные отрезки — фонетические синтагмы. В высказыва­
нии может быть несколько фонетических синтагм, и в этом случае вся последовательность также будет иметь фонетиче­
ские показатели объединения. Таким образом, существует несколько ритмических схем, на основе которых в речи об­
разуются фонетические составляющие разной размерности. Кроме того, любое высказывание имеет определенную интонацию, которая не только скрепляет фразу фонетиче­
ски, но и указывает на общую коммуникативную цель гово­
рящего, его отношение к сообщаемым фактам и т. д. 27 Глава 1. Предмет фонетики Итак, в высказывании типы используемых звуковых средств существенно расширяются по сравнению со слова­
рем знаков. Если вернуться к высказыванию это цапля, то его полная фонетическая характеристика может быть пред­
ставлена как многослойная структура: Фраза Интонация Фоносинтагма Ударение синтагмы Фонетические слова Словесное ударение Слоги - - - -
Слоговая схема Сегменты [э цап л'ъ] 1.3.2. Признаковое строение звуковых единиц Все звуковые единицы, начиная со звуковых сегментов и кончая большими фонетическими составляющими, имеют сложную внутреннюю структуру, которая в языке является отражением комплексной природы артикуляции и слуховых признаков речи. Минимальная звуковая единица языка — фонема — в артикуляции всегда представлена как сложный артикуляци­
онный комплекс, в реализации которого участвуют разные органы речи (голосовые связки, нёбная занавеска, язык, гу­
бы). В восприятии также соответствует определен­
ный набор акустических признаков, выделяемых слуховой системой. Эта субстанциальная комплексность является ос­
новой признакового, компонентного строения фонемных единиц. Однако лингвистические признаки фонемы нельзя считать простым перенесением артикуляционных и перцеп­
тивно-акустических различий в языковую сферу. Для линг­
вистической характеристики фонемы важны прежде всего такие ее свойства, которые отражают взаимосвязи данной фонемы с другими фонемными единицами того же языка, т. е. то, что делает набор фонем упорядоченной звуковой си­
стемой. Среди этих взаимосвязей наиболее существенными являются отношения сходства и различия между фонемами 28 1.3. Звуковые средства языка и фонетическая характеристика сообщения как элементами функционально однотипного набора (ин­
вентаря). Например, сравнивая между собой фонемы рус­
ского языка, можно выделить такие признаки согласных, как "губной/переднеязычный/среднеязычный/заднеязыч­
ный", "твердый/мягкий", "глухой/звонкий" и т. д. Отличи­
тельные свойства фонем называются их дифференциальны­
ми, или различительными, признаками. В звуковой комму­
никации такие признаки играют решающую роль: в артику­
ляции они задают определяющие черты соответствующих артикуляционных комплексов, а в восприятии служат целям идентификации фонем и опознавания слов и других языко­
вых знаков. Признаки необходимы не только для описания систем­
ных отношений между фонемами как единицами инвентаря. С их помощью описываются контекстные ограничения на употребление фонем и связанные с ними чередования. На­
пример, в русском языке перед паузой не употребляются звонкие шумные согласные, в связи с чем в этой позиции возникают чередования звонких с соответствующими глухи­
ми - са[т], - лу[г]а - фонетические составляющие также имеют особые (просодические) признаки, которые либо рас­
пространяются на всю составляющую (ср. уровень громко­
сти, темп, ширина голосового диапазона, голосовой тембр), либо значения этих признаков образуют упорядоченную схе­
му (конфигурацию), которая реализуется на последователь­
ных частях соответствующего фонетического блока. Напри­
мер, фразовое ударение можно рассматривать как конфигу­
рацию степеней выделенности словесных ударений в выска­
зывании. Разделы фонетики Как было показано, звуковая речь — очень сложное, многоплановое явление. Хотя в ее основе лежит целостный механизм, отдельные его части могут быть предметом само­
стоятельного изучения. Поэтому в фонетике выделяются от­
дельные разделы со своими объектами и методами исследо­
вания. Функциональная фонетика (фонология) изучает звуко­
вые средства языка, их функции и системную организацию, 29 Глава 1. Предмет фонетики а также правила формирования фонетической структуры ре­
чевых сообщений. В нашей книге вопросам функциональ­
ной фонетики посвящены вводные параграфы главы 1, а также главы 6-8 и глава 10. Артикуляционная фонетика рассматривает анатомо-
базу артикуляции (речевой аппарат) и ме­
ханизмы речепроизводства. Основы артикуляционной фоне­
тики излагаются в главе 2. Акустической фонетике посвящена глава 3. В ней рас­
сматриваются физические характеристики звуковых средств языка (от фонемы до интонации) в тесной связи с их арти­
куляцией и восприятием. Перцептивная фонетика исследует, каким образом осу­
ществляются слуховой анализ и опознание (идентификация) звуковой оболочки речевого высказывания и его фонетиче­
ских составляющих. Эти вопросы обсуждаются в главе 4. Перечисленные разделы составляют ядро общей фоне­
тики как науки о звуковой стороне речевой коммуникации. Наряду с общей фонетикой имеются частные фонети­
ки, которые изучают звуковую структуру конкретных язы­
ков. Между общей фонетикой и частными фонетиками су­
ществует очень тесная связь. Наиболее отчетливо она прояв­
ляется в универсальных фонетических классификациях, по­
строение которых долгое время считалось главной задачей общей фонетики. В универсальных классификациях еумми-
руются сведения о звуковых средствах всех языков мира. Универсальные фонетические классификации рассматрива­
ются в главе 5. Важным разделом общей фонетики является типологи­
ческая фонетика. Типологический анализ направлен на изу­
чение сходств и различий в устройстве звуковых систем раз­
ных языков. Он создает базу для различных содержательных обобщений, которые касаются звукового устройства челове­
ческого языка вообще и его конкретно-языковых проявле­
ний в частности. Вопросы типологической фонетики осве­
щаются в главе 9. Давнюю традицию в области фонетики имеют сравни­
тельно-исторические исследования. Их целью является опи­
сание исторических изменений звуковых систем родствен­
ных языков, реконструкция звуковой системы языка-источ­
ника (праязыка), а также описание исторических изменений в звуковой системе конкретных языков и диалектов. Эта об-
30 1.4. Разделы фонетики ласть является специфическим разделом общей фонетики, который обычно не включается в учебники по этой дисцип­
лине. В нашей книге этот раздел также отсутствует. Знания о звуковой стороне речевой коммуникации, по­
лучаемые как общей, так и частными фонетиками, исполь­
зуются в разных областях человеческой деятельности. Прак­
тическим применением фонетических знаний занимается прикладная Ее разделы отражают многообразие использования языка в человеческой жизни. Поэтому к при­
кладной фонетике относятся столь разные дисциплины, как методика преподавания фонетики конкретного языка, прие­
мы выразительной речи (фонетическая риторика), орфо­
эпия, устанавливающая различные произносительные нор­
мы, и т. д. В настоящее время благодаря бурному развитию компьютерной техники большую значимость приобретают такие направления прикладной фонетики, как автоматиче­
ский синтез и распознавание речи. Краткое изложение эле­
ментов прикладной фонетики приводится в главе В книгу включено также приложение, в котором рас­
сматриваются базовые понятия теории колебаний и физиче­
ской акустики, знание которых необходимо при изучении акустики речи. Литература к главе 1 Бондарко Л.В., Вербицкая Л.А., Гордина М.В. Основы общей фонетики. 1993. Общая фонетика. 1979. Златоустова Потапова Р.К., Потапов В.В., Трунин-Донской В.Н. Об­
щая и прикладная фонетика. 1997. Матусевич Введение в общую фонетику. 1959. Реформатский А.А. Введение в языковедение. 1996. Чистович Кожевников Алякринский и др. Речь. Артику­
ляция и восприятие. 1965. Щерба Л.В. 1974 а. О трояком аспекте языковых явлений и об экспе­
рименте в языкознании Щерба Л.В. Языковая система и речевая де­
ятельность. 1974. Щерба Л.В. гласные в качественном и количественном ос­
вещении Щерба Л.В. Языковая система и речевая деятельность. 1974. Щерба Л.В. в. Из лекций по фонетике Щерба Л.В. Языковая сис­
тема и речевая деятельность. 1974. J.
С.
Fundamental problems in phonetics. 1977. Clark An introduction to phonetics and phonology. Oxford
& Cambridge,
1990. 31 Глава 1. Предмет фонетики M. Psycholinguistics. Cambridge, P. Preliminaries to linguistic phonetics. Chicago, Ladefoged P. A course in phonetics. London, 1982. Laver J. Principles of phonetics. Cambridge, 1994. B. Phonetics. N.Y., 1963. Глава 2 АРТИКУЛЯЦИОННЫЕ МЕХАНИЗМЫ РЕЧИ Фазы речепроизводства и задачи артикуляционной фонетики Производство речи представляет собой чрезвычайно сложный многоступенчатый процесс. Сообщение начинает формироваться на доязыковом уровне и заканчивается (в случае устной речи) созданием акустического сигнала, про­
ходя через множество промежуточных стадий. Большая часть активности говорящего в ходе этого процесса может быть описана как последовательное построение все новых характеристик высказывания на основе предшествующих. Разумеется, к фонетике относится только часть этой дея­
тельности. Однако и в ней можно выделить несколько стадий. Наиболее важным членением внутри фонетической ча­
сти является разграничение деятельности, связанной с по­
строением лингвистической программы произнесения, и де­
направленной на реализацию этой программы в виде движений речевых органов, которые приводят к обра­
зованию акустического сигнала. В данной главе мы рассмо­
трим механизмы, обеспечивающие второй блок фонетиче­
ской активности. Внутри него также можно выделить не­
сколько фаз 1977). Начальной является фаза моторного (двигательного) программирования того задания на произнесение, которое получено на собственно лингвистическом этапе построения высказывания. Здесь выбирается конкретный способ дости­
жения требуемого состояния речевых органов, координиру­
ется действие мышц, участвующих в выполнении задания, определяется временная программа движений. Далее следует нейромышечная фаза, на которой про­
исходит передача нервных импульсов к мышечным волок­
нам, приводящая к сокращению отдельных мышц или их групп. В результате этого речевые органы выполняют опреде­
ленные движения и занимают положения, предусмотренные Двигательной программой. На этом уровне происходит пере­
ход от активности мышц к активности таких органов, как 33 Глава 2. Артикуляционные механизмы речи легкие, гортань, язык и т. д. Эту фазу можно назвать орга­
нической. Речевой аппарат включает не только определенные ор­
ганы, но и ряд соединенных между собой воздушных поло­
стей (емкостей) — полость легких, трахеи, гортанную по­
лость, глотку, ротовую и носовую полости. Последователь­
ность указанных полостей, участвующих в производстве ре­
чевых звуков, образует особую аэродинамическую структуру, которая называется речевым, или голосовым, трактом (англ. vocal tract).
При артикуляции в речевом тракте происходят сжатие и выталкивание воздуха, возникают воздушные им­
пульсы, завихрения и т. д. Все это характеризует аэродина­
мическую фазу продукции речи. Аэродинамические процессы вызывают колебания воз­
душного давления, которые могут восприниматься органа­
ми чувств человека. Трансформация аэродинамических яв­
лений в звуковые волны, которые распространяются от го­
ворящего к слушающему, образует акустическую фазу речи. Акустический сигнал занимает особое положение в речевой коммуникации, являясь своеобразным мостом, соединяю­
щим производство и восприятие речи. Описание производства речи было бы неполным, если бы мы не упомянули о наличии обратной связи, которая по­
зволяет говорящему контролировать свое произношение. Это не только слуховая, но также тактильная, и обратные связи, основанные на информации от рецепторов, встроенных в органы речи. Нейрофизиологи указывают также на наличие внутренних связей между структурами головного мозга, участвующими в управлении произносительной деятельностью. Суммируем изложение процессов, связанных с рече­
производством, с помощью таблицы. Описания звуковой стороны речи традиционно опира­
ются на характеристики, связанные с произношением. При этом обычно используются термины артикуляция, артикуля-
тор и производные от них. Они восходят к латинскому
artic­
ulo
"расчленяю, произношу Какие же фа­
зы артикуляционного процесса они характеризуют? В пер­
вую очередь, органическую фазу: слово "артикулятор" ука­
зывает на орган речи, участвующий в произношении (язык, губы и т. п.), а слово "артикуляция" - на его положение или движение. Однако современная фонетика рассматривает не 34 речепроизводства и задачи артикуляционной фонетики только анатомию и двигательные возможности артикулято­
ров, но и физиологию речепроизводства, т. е. моторное про­
и нейромышечные процессы, в результате которых достигаются определенные состояния речевых орга­
нов. Так будет построено изложение и в данной главе: мы будем рассматривать не только артикуляционные органы и их двигательные возможности (речевой человека), но и физиологическую основу артикуляционных процессов. Фаза Результат процесса Обратная связь Моторное программирование Нервные импульсы Внутримозговая Нейромышечная Мышечные сокращения Проприоцептивная Органическая Движения артикуляторов и их пространственное положение Проприоцептивная Тактильная Аэродинамическая Изменения воздушного давления Барорецепторная Акустическая Речевой сигнал Слуховая Обсуждение собственно артикуляционных процессов будет тесно скоррелировано с описанием их аэродинамиче­
ских следствий. Это позволит нам впоследствии естественно перейти к характеристике акустической стороны речи. Обратим внимание на то, что термин "артикуляция" неоднозначен. Он использоваться для обозначения: 1) речепроизводства в целом, 2) органической фазы речепро­
изводства, 3) положения надгортанных артикуляторов при производстве конкретного звука. Такая неоднозначность обычно не вызывает затруднений, так как из контекста, как правило, ясно, что имеется в виду. 2.2. Основные процессы речепроизводства их анатомо-физиологическая база Звучащую речь можно рассматривать как продукт трех базовых процессов: создания воздушного потока (инициа­
ции), голосовой модуляции этого потока (фонации) и фор­
той или иной конфигурации речевого тракта (ар-
35 Глава 2. Артикуляционные механизмы речи в узком смысле слова). В первом приближении эти процессы могут быть соотнесены с тремя отделами рече­
вого тракта: легкими, гортанью и надгортанными органами (рис. 2.1). Ниже следует описание анатомического устройст­
ва и функций этих частей механизма. Дыхательная система Легкие используются как своеобразные меха, создаю­
щие поток воздуха, который является источником аэродина­
мических и акустических процессов в речи. Забор воздуха в этом случае не отличается от того, что происходит при обычном дыхании. Вдох совершается в результате расшире­
ния грудной клетки, которое является следствием сокраще­
ния межреберных мышц. Имеется и другой механизм увели­
чения воздушного объема легких — опускание диафрагмы. Выдох происходит в основном благодаря действию эластиче­
ских сил, заставляющих легкие сжиматься. Усилению выдо­
ха способствует действие межреберных мышц-антагонистов, а также подъем диафрагмы. Возникновение воздушного потока при вдохе и выдохе физически обусловлено разницей атмосферного и внутриле-
гочного давлений. В речи дыхание имеет некоторые особен­
ности. Для нормального звукообразования необходимо под­
держивать относительно постоянную скорость потока возду­
ха на всем протяжении отрезка речи, оформляемого одним дыхательным циклом. Отсутствие резкого начала выдоха обеспечивается сохранением некоторого уровня активности расширяющих межреберных мышц, тогда как относительно постоянный поток воздуха поддерживается активностью сжимающих межреберных мышц. Тем не менее автоматиче­
ское понижение скорости потока воздуха к концу произне­
сения полностью не компенсируется. Это приводит к посте­
пенному понижению громкости звучания речевого отрезка. Воздушный поток в речи создается не только легкими. Ниже будут рассмотрены и другие, более редкие способы инициации. 36 Легкие Рис. Базовые компоненты речепро-
изводящего механизма 2.2.2. Гортань Строение гортани Гортань (или от греч.
larynx)
представляет со­
бой сложную совокупность хрящей, мышц и соединитель­
ных тканей, расположенных между трахеей и глоткой. Хря­
щевая основа гортани образована тремя непарными хряща­
ми — щитовидным, перстневидным и надгортанником — и парой черпаловидных хрящей. Самым крупным является щитовидный хрящ, имеющий
V
-образную форму, его угол (адамово яблоко, или кадык) выступает на шее. К верхней части этого хряща изнутри прилегает надгортанник; его эла­
стичный лепесток выступает над щитовидным хрящом и примыкает к корню языка. Под щитовидным хрящом круговой перстневидный хрящ с утолщением ("печат­
кой") в задней части. На этом утолщении помещаются ма­
ленькие подвижные хрящи, которые за свою форму получи­
черпаловидных. В целом гортань представляет собой трубку, которая, кроме хрящевой основы, содержит мягкие ткани, соединяющие хрящи, и мышцы, сокращение которых меняет относительное положение хрящей. Схемати­
ческое изображение хрящевой основы гортани дается на 2.2. 37 Глава 2. Артикуляционные механизмы речи б 1— черпаловидный хрящ; 2 — перстневидный хрящ; 3 — голосовой отросток 2 3 хряща; 4 — щитовидный хрящ; 5 - голосовой проход; 6 — слизистая ткань связки; 7 — мышца связки; 8 — сухожильная часть связки; а — б — — векторы смещения черпаловидного хряща 4 5 6 7 Рис. 2.2. Поперечный разрез гортани Гортанная трубка частично перегорожена так называе­
мыми голосовыми связками. Связки могут быть сведены и в этом случае перекрывают гортанный проход полностью. Ка­
ждая связка состоит из трех частей: ее центральный край, мимо которого проходит воздушный поток, представляет со­
бой тонкое сухожилие, далее следует голосовая мышца, еще далее вниз и вбок — слизистая ткань, край которой прикре­
пляется к перстневидному хрящу. В гортани имеются также "ложные" голосовые связки, которые расположены несколь­
ко выше истинных; они не участвуют в голосообразовании. На рис. 2.3 схематически представлено вертикальное сече­
ние гортанной трубки в передне-задней проекции. Спереди голосовые связки прикреплены к внутреннему углу щитовидного хряща, а сзади — к голосовым отросткам черпаловидного. Щель между краями связок (и частично ме­
жду черпаловидными хрящами) называется голосовым про­
или голосовой щелью (иначе от лат.
glottis). Речевые функции гортани Рассмотрим теперь артикуляционные возможности гортани и их использование в речи [Кодзасов, Кривнова Наиболее важным параметром является форма голо­
совой щели. Она изменяется при разведении и сведении хрящей. При дыхании эти хрящи широко разведены, соответственно разведены и голосовые связки. Аналогичное положение голосовой щели (при несколько 38 Основные процессы Истинные голосовые Ложные голосовые Перстневидный хрящ Трахея хрящ Надгортанник Рис. 2.3. Вертикальное сечение гортан­
ной трубки в передне- задней проекции меньшей степени разведения хрящей и связок) наблюдается и при произнесении глухих согласных. Когда голосовые от­
ростки черпаловидных хрящей сведены (без плотного смы­
кания), голосовые связки примыкают друг к другу. Это ис­
ходное положение характерно для произнесения гласных и звонких согласных. Возможно также состояние плотного смыкания голосового прохода. Различия в конфигурации го­
лосовой щели приводят к разным видам модуляции воздуш­
ной струи, протекающей через гортань, о чем пойдет речь ниже. Другой важный параметр гортани, управляемый в ре­
чи, — это степень напряженности голосовых связок. Она контролируется двумя независимыми артикуляционными механизмами. Первый из них — активное сокращение голо­
совых мышц, волокна которых проходят по всей длине свя­
зок. Увеличение напряженности голосовой мышцы вызыва­
ет "отвердение" связки, что меняет ее колебательные харак­
теристики. Второй механизм связан с изменением расстоя­
ния между щитовидным и перстневидным хрящами за счет сокращения соединяющей их мышцы. Принцип действия этого механизма схематически представлен на рис. 2.4 (по а1. 1980). Приближение передней части перстневидного хряща к Щитовидному сопровождается смещением назад-вниз его задней части, на которой находятся черпаловидные хрящи. 39 Глава 2. Артикуляционные механизмы речи А АХ -
- длина голосовой связки до сокращения щито-
перстневидной мышцы — длина голосовой связки после сокращения щитоперстневидной мышцы хрящ А — длина голосовой связки после сокращения щитоперстневидной мышцы Рис. 2.4. Щитоперстневидный меха­
низм изменения длины голосовых свя­
зок В результате голосовые связки натягиваются. Это пассивный механизм изменения напряженности голосовых связок. Раз­
личия в степени напряженности, создаваемые обоими опи­
санными механизмами, отражаются прежде всего на высоте голосового тона. Есть и другие параметры работы гортани, которые мо­
гут иметь лингвистическое применение. Во-первых, это опу­
скание надгортанника, приводящее к прикрытию входа в гортань. Такое движение обычно выполняет чисто физиоло­
гическую задачу (предотвращение попадания пищи в дыха­
тельную систему), однако оно может выступать и как эле­
мент звуковых противопоставлений. Во-вторых, это общее сжатие гортани. Оно осуществляется круговыми мышцами (сфинктерами), волокна которых проходят сквозь мягкие ткани, соединяющие хрящи гортани. Наконец, вся гортань может смещаться в вертикальном измерении как вверх, так и вниз за счет сокращения мышц, соединяющих ее с други­
ми органами. 40 2.2. процессы речепроизводства... Гортань как модулятор воздушного потока С аэродинамической точки зрения гортань представля­
ет собой модулятор воздушного потока, генерируемого ды­
хательными органами; разные виды модуляции зависят от параметров, описанных в предыдущем разделе. Рассмотрим сначала механизм образования голоса, т. возникновения периодических колебаний воздушного дав­
ления в гортани. Для образования голоса голосовые связки сводятся благодаря сближению черпаловидных хрящей, к которым они прикреплены. Это приводит к запиранию по­
тока воздуха и возникновению разницы давлений под и над связками. Перепад давлений разбрасывает связки в стороны, и воздух начинает протекать через голосовую щель. Этот по­
ток создает в ней отрицательное давление, вызывающее вса­
сывающий эффект (так называемый эффект Воз­
врату связок в исходное состояние способствуют и возника­
ющие при их смещении эластические силы. В результате го­
лосовой проход вновь запирается и колебательный цикл по­
вторяется. Его фазы схематически представлены на рис. 2.5. В результате периодических раскрытий и замыканий голосовой щели воздушный поток преобразуется в цепочку импульсов воздушного давления (рис. 2.6). Возникающая модуляция потока воздуха и есть голос. Таким образом, периодические смыкания и размыка­
ния голосовых связок представляют собой автоколебатель­
ный процесс, а не реакции на импульсы из центральной нервной системы. При голосообразовании говорящий упра­
вляет не отдельными колебаниями, а положением видных хрящей, от которых зависит форма голосовой щели, и напряженностью голосовых связок. Разные конфигурации голосовой щели дают разные виды колебаний голосовых связок, что отражается в изме­
нении формы импульсов воздушного давления на выходе из гортани. Это так называемые фонации (англ.
phonations). При нейтральной фонации (англ.
modal voice)
черпаловид-
ные хрящи сведены, и голосовые связки колеблются по всей длине. При разведении черпаловидных хрящей шири­
на щели в прилегающей к хрящам части превышает предел, при котором действует закон Бернулли. Поэтому смыкают­
ся и размыкаются лишь передние части голосовых связок. Протекание же воздуха через заднюю (открытую) часть ще-
41 Глава 2. Артикуляционные механизмы речи Голосовые связки в покое 2. Связки сводятся 3. Подсвязочное давление начинает Разница в давлении разбрасывает превышать надсвязочное связки 5. Связки размыкаются 6. Возникает воздушный импульс 7. Связки сближаются в результате Связки сомкнуты, снова ствия эластических сил и эффекта ливается подсвязочное давление нулли Рис. 2.5. Последовательные стадии колебательного цикла голосовых связок 42 2.2. Основные процессы а — фазы раскрытия — смыкания — раскрытия голосовой щели б — импульсы воздушного давления над голосовой щелью Рис. 2.6. Колебания голосовых связок и импульсы воздушного давления над го­
лосовой щелью а - вдох б — шепот в — нейтральная фонация г - придыхательный голос д — скрипучий Рис. 2.7. Конфигурации щели и типы фонации ли создает шумовую составляющую, отчего голос становит­
ся придыхательным (англ.
breathy voice).
Возбуждение коле­
баний в задней части голосовой щели предотвращается и в случае плотного смыкания черпаловидных хрящей. При этом условии связки также могут колебаться только в пе­
редней части, и голосообразование требует увеличения ды­
хательного усилия. Это механизм образования так называе-
43 Глава 2. Артикуляционные механизмы речи мого голоса (англ.
creaky voice).
Две конфигура­
ции голосовой щели полностью исключают возникновение колебаний ("озвончение"). Во-первых, связки не колеблют­
ся при значительном разведении черпаловидных хрящей; во-вторых, при их плотном смыкании, которое сопровожда­
ется увеличением жесткости голосовых связок. Возможна также такая конфигурация, при которой задние части чер­
паловидных хрящей разведены, тогда как голосовая щель сомкнута. В результате создается межхрящевой проход, при протекании воздуха через который возникает шум. Таков механизм образования фонации шепот. Схематическое изо­
бражение разных фонационных состояний голосовой щели дается на рис. 2.7 et 1980). 2.2.3. Надгортанные разделы речевого тракта Глотка Глотка (или фаринкс от греч.
pharynx)
— это протяжен­
ная часть речевого аппарата, имеющая форму трубки с "выре­
зом" в ротовую полость. Она начинается от гортани и продол­
жается до носовой полости. Глотка состоит из трех отделов: нижнего, примыкающего к гортани (гортанноглотка), средне­
го, открытого спереди в сторону рта и верхнего, ограниченного снизу нёбной занавеской (носоглотка). Главная функция глотки в речи — служить резонатором, размеры и форма которого зависят от состояния примыкаю­
щих речевых органов, предопределяющих ее объем. Так, сме­
щение языка вперед приводит к расширению глотки, а на­
зад — к ее сужению. Имеется и другой, собственно глоточный механизм ее сужения. Он обеспечивается тем, что задняя и боковые стенки глотки пронизаны круговыми мышцами-
сфинктерами, сокращение которых изначально служит фи­
зиологическим целям — проталкиванию пищи в пищевод. Длина глотки зависит от положения гортани: опускание гор­
тани увеличивает объем глотки, а подъем уменьшает. Ротовая полость Абсолютное большинство артикуляционных процессов происходит в ротовой полости. Она ограничена сверху нё­
бом, снизу языком, а с боков — зубами и щеками. Сзади ро­
товая полость выходит в глотку, а спереди ограничена зуба-
44 Основные процессы речепроизводства... Кончик языка 2. Ламина (лопаточка) 3. Спинка языка За. Передняя часть спинки Задняя часть спинки 4. Корень языка 5. Надгортанник Рис. 2.8. Артикуляционные зоны языка ми и губами. Большинство ротовых артикуляций связано с движениями языка, значимость которого для речи можно сравнить со значимостью кисти руки для двигательной дея­
тельности человека. Язык Язык делится на четыре части: переднюю, или лопатку (лат.
lamina),
которая заканчивается кончиком (лат.
среднюю часть, заднюю часть и корень (лат.
radix).
Средняя и задняя части образуют спинку языка (лат.
dorsum).
Указан­
ные зоны языка представлены на рис. 2.8. Для звуков, артикулируемых передней частью языка, используется термин переднеязычный. Если необходимо описать переднеязычную артикуляцию более детально, ис­
пользуют термины апикальный (в артикуляции использует­
ся кончик) и ламинальный (в артикуляции используется ло­
патка Звуки, которые артикулируются с использо­
ванием средней части языка, называются среднеязычными, а артикулируемые задней частью — заднеязычными. Корень языка не функционирует как независимый артикулятор. Звуки, образуемые сужением прохода между корнем языка и задней стенкой глотки, называются фарингальными, так как ведущую роль в формировании сужения играют мышцы глотки (фаринкса). Язык представляет собой сложную мышечную структу­
ру, объединяющую несколько внутренних мышц и содержа­
щую волокна нескольких внешних мышц. Мышечное стро-
45 Глава 2. Артикуляционные механизмы речи Внутренние мышцы языка — верхняя продольная — нижняя продольная В — вертикальная - поперечная Внешние мышцы языка ЧЯ — ГГЯ — подъязычно-язычная — палатоязычная — ШЯ — шилоязычная Рис. 2.9. Внутренние и внешние мыш­
цы языка ение языка схематически представлено на рис. 2.9 (по et 1980). Рассмотрим, к каким результатам приводит активность мышц языка. Сокращение верхней продольной мышцы ведет к втягиванию средней части спинки (ложко­
образная форма), а сокращение нижней продольной мыш­
цы— к выпячиванию спинки. Сокращение вертикальной мышцы уплощает язык, а сокращение поперечной — сужает. При этом возникают боковые от англ.
lateral) проходы в ротовой Покажем теперь, как действуют внешние мышцы язы­
ка. Сокращение язычно-челюстной мышцы приводит к сме­
щению языка в передне-верхнем направлении. При этом кончик языка может опускаться (если сокращается передняя часть этой К смещению языка в задне-нижнем на­
правлении приводит сокращение язычно-подъязычной мышцы, которая соединяет язык с подъязычной костью. Подъем задней части языка связан с сокращением палато-
язычной мышцы (она проходит через щеки), а движение в 46 2.
2. Основные процессы речепроизводства... направлении вызывается шилоязычной мыш­
цей, идущей от языка к нижнечерепным отросткам. Нако­
нец, в результате сокращения подъязычно-челюстной мыш­
цы происходит общее смещение базы языка вперед с сопут­
ствующим выпячиванием его вперед-вверх. Как видим, язык обладает огромными артикуляторны-
ми возможностями, и его сходные формы и положения в ре­
чевом тракте могут достигаться разными средствами. Пред­
полагается, что во многих случаях действуют законы двига­
тельной синергии, т. е. активность разных мышц объединя­
ется в целях получения такого состояния языка, которое не­
обходимо для произнесения данного звука. Нижняя челюсть Вертикальные движения нижней челюсти, как предпо­
лагается, находятся в тесной координации с движениями языка: при подъеме языка челюсть поднимается, а при его опускании - опускается. Однако в общем случае эти арти­
куляционные параметры независимы, и, возможно, раствор рта (положение нижней челюсти относительно верхней) и подъем языка (его вертикальное положение относительно нёба) могут использоваться как независимые артикуляцион­
ные характеристики. Нужно учесть также, что двигательные возможности нижней челюсти позволяют ей смещаться как параллельно верхней, так и под углом к ней. Кроме того, че­
люсть может смещаться в горизонтальной плоскости. Нёбо Нёбо представляет собой перегородку между ротовой от англ.
oral)
и носовой (назальной от англ.
nasal) полостями. Оно состоит из двух частей: твердого нёба (пала-
тум от лат.
palatum)
и мягкого нёба (велум от лат.
velum). Твердое нёбо — это куполообразное костное образование, обрамленное верхней челюстью. На границе между деснами и твердым нёбом находится ряд небольших бугорков - так называемые альвеолы (от лат.
alveoli).
Мягкое нёбо — это мышечное образование, задняя подвижная часть которого называется нёбной занавеской. Нёбная занавеска заканчива­
ется маленьким язычком (увулой от лат.
uvula),
который можно наблюдать в зеркале. В результате действия мышц 47 Глава 2. Артикуляционные механизмы речи 1. Зубные 1 2 3 4 2. Альвеолярные 1 2а. Альвеолярные собственно Постальвеолярные 3. Палатальные J За. Препалатальные V I ! 36. Палатальные собственно \ 4. Велярные 4а. Велярные собственно 2а За
j
36 4а 46 Поствелярные 2а За
j
36 4а 46 (увулярные) Рис. 2.10. Артикуляционные зоны нёба мягкое поднимается или опускается. В первом случае нёбная занавеска перекрывает проход в носовую полость, во втором случае проход в носовую полость открыт. Увула мо­
жет выступать как отдельный активный артикулятор, кон­
тактирующий с задней частью языка. Фонетически ориентированное членение нёба на ком­
поненты представлено на рис. 2.10. Нёбо (с прилегающей спереди частью) делится на три основные артикуляционные зоны: зубно­альвеолярную, пала­
тальную и велярную. Внутри них соответственно выделяются подзоны: зубная (или дентальная от лат.
альвеолярная и постальвеолярная; препалатальная и палатальная, велярная и поствелярная (или увулярная). Существует тесная взаимо­
связь между активной артикуляцией языка и ее нёбной ори­
лопатка или кончик языка может контактировать с зубной и альвеолярной зонами, средняя часть языка ­ с па­
латальной зоной, а задняя — с велярной. Следует отметить, что контакт задней части языка с увулой обычно предполага­
ет ее прижатие к задней стенке глотки, т. е. соответствующие звуки квалифицировать либо как увулярные, либо как Классификация язычных звуков может быть ориентирована как на активный орган (например, апи­
кальный), так и на пассивный (дентальный), иногда исполь­
зуется комбинированная характеристика Губы Мышечная система, управляющая изменениями фор­
мы губ, чрезвычайно сложна. Рассмотрим основные параме­
тры, которые характеризуют губные (или лабиальные от 48 2.2. Основные процессы речепроизводства... англ.
labial)
артикуляции. Во-первых, может происходить ок­
ругление (англ.
rounding)
ротового отверстия, что противо­
поставлено его растягиванию (англ.
spreading)
по горизонта­
ли. Обычно эти движения скоррелированы с разными зна­
чениями другого артикуляционного параметра — с вытягива­
нием губ вперед (англ.
protrusion)
и их оттягиванием назад (англ.
retraction).
Может меняться и размер губного прохода (англ.
lip aperture)
— от узкой трубочки до широкой. Все это дает много комбинаторных возможностей, часть из которых используется для смыслоразличения. Артикуляционные функции надгортанных органов Надгортанные органы выполняют две артикуляцион­
ные функции. Во-первых, преграды в надгортанной полости выступают в качестве шумовых источников: когда голосовой тракт перекрывается полностью, действует импульсный ис­
точник, при частичном перекрытии (щелевая преграда) — источник турбулентного шума. Во-вторых, эти органы фор­
мируют в речевом тракте воздушные полости, выступающие в роли акустических резонаторов. Подробнее эти артикуля­
ционные механизмы и соответствующие типы звуков рас­
сматриваются ниже. 2.2.4. Вторичные функции речевых органов Выше были описаны базовые функции речевых орга­
нов в артикуляционных процессах. Однако в речепроизвод­
стве возможны отступления от естественной функциональ­
ной специализации гортани и надгортанных органов. Гор­
тань, являясь в первую очередь модулятором воздушного по­
тока, может выступать как инициатор и артикулятор, а над­
гортанные органы, будучи по природе артикуляторами, мо­
гут использоваться также для инициации воздушного пото­
ка. Рассмотрим сначала особые случаи инициации воздуш­
ного потока. Первый нестандартный случай инициации связан с производством согласных (англ.
При артикуляции этих согласных в речевом тракте имеются две В кавказоведении для этих согласных используется также термин ные (от англ.
abrupt
"резкий"). 49 Глава 2. Артикуляционные механизмы речи Задняя часть языка образует смычку с мягким нёбом. Голосовой проход закрыт 5. Голосовой проход раскрывается 4. Задняя часть языка опускается, открывая путь компрессиро­
ванному воздуху Воздух в глотке сжимается 2. Закрытая гортань поднимается Рис. Фазы произнесения эйектив-
ных согласных (на примере велярного преграды: плотно смыкается голосовой проход в гортани и создается преграда в надгортанной части. Сомкнутая гортань поднимается вверх и, как поршень, нагнетает воздушное да­
вление в замкнутой надгортанной полости. Быстрое размы­
кание ротовой смычки сопровождается резким шумовым импульсом, и только после возвращения гортани в нейт­
ральную позицию начинается нормальная легочная инициа­
ция. Фазы произнесения велярного эйективного согласного представлены на рис. Другой нестандартный способ формирования воздуш­
ного потока имеет место при произнесении так называемых имплозивных согласных (англ.
В этом случае также создается преграда в ротовой полости и в роли ини­
циатора выступает гортань со сведенными, но не сомкнуты­
ми голосовыми связками. При производстве имплозивных согласных, в отличие от эйективных, гортань опускается, со­
здавая разрежение воздуха в замкнутой надгортанной поло­
сти. Это приводит к образованию воздушного потока через голосовую щель, который возбуждает голосовые колебания. Фазы артикуляции губного имплозивного согласного [6] по­
казаны на рис. Еще более экзотический механизм инициации исполь­
зуется при артикуляции щёлкающих звуков (англ.
ко­
торые в большинстве языков используются как экспрессив-
50 2.2. Основные процессы Губы смыкаются 4. Губы размыкаются 3. Давление воздуха в ротовой слегка уменьшается 2. Гортань с колеблю­
щимися связками опускается Рис. 2.12. Фазы произнесения импло­
зивных согласных (на примере лабиаль­
ного ное средство, а в языках Южной Африки выполняют смыс-
лоразличительные функции. В этом случае также создаются две преграды: одна в велярной или поствелярной части ро­
товой полости, другая в более передней ее части. Далее про­
исходит смещение тела языка в задне-нижнем направлении (при сохранении обеих смычек). Это движение приводит к разрежению воздуха в замкнутой ротовой полости и созда­
нию в ней отрицательного давления. Последней фазой арти­
куляции является размыкание более передней смычки, кото­
рое сопровождается всасыванием воздуха. В результате воз­
никает звук, подобный щелчку. Фазы щелчковой артикуля­
ции представлены на рис. 2.13. Рассмотрим теперь случаи функционирования гортани как артикулятора. Во-первых, голосовая щель может плотно смыкаться и создавать при раскрытии шумовой импульс, по­
добный импульсам от размыкания ртовых смычек. Таков ме­
ханизм образования так называемой гортанной смычки (англ.
glottal stop).
Во-вторых, в голосовой щели может воз­
никать слабый турбулентный шум — так называемая аспира­
ция (англ.
В качестве артикулятора в некоторых языках используется также надгортанник — с его помощью производятся как смычные, так и проходные согласные. 51 Глава 2. Артикуляционные механизмы речи Кончик языка подни­
мается и образует смычку с зубами Задняя часть языка поднимается и образу­
ет смычку с нёбом 2. Тело языка опускается 4. Кончик языка опуска­
ется, и воздух устрем­
ляется в рот 3. Давление воздуха между двумя смыч­
ками уменьшается Рис. Фазы щелчковой артикуля­
ции (на примере дентального 2.3. Эволюционный аспект артикуляционной фонетики Речевые органы до сих пор сохраняют свои исконные неречевые функции: легкие, гортань и носовая полость яв­
ляются частями дыхательной системы, а глотка и рот — час­
тями пищеварительного тракта. Однако у человека произош­
ла существенная эволюционная адаптация некоторых орга­
нов к речевым функциям. Наиболее фундаментальное изме­
нение связано с положением гортани: у человека она нахо­
дится значительно ниже, чем у животных, в частности чело­
векообразных обезьян. У последних гортань выходит непо­
средственно в носовую полость, а вода и пища изо рта про­
ходят вокруг гортанной трубки прямо в пищевод. Глотка практически отсутствует. Эти особенности морфологии обезьян хорошо видны на рис. 2.14. Интересно, что филогенетическая стадия развития от­
ражается в онтогенезе: у младенца гортань находится выше, чем у взрослого человека, поэтому кончик надгортанника виден через открытый рот. Опускание гортани и возникновение протяженной глотки создает принципиально новую конфигурацию рече­
вого тракта: он приобретает вид согнутой двухрезонаторной 52 2.3. Эволюционный аспект артикуляционной фонетики 2.14. Верхние части дыхательных путей человека и шимпанзе трубы с потенциально разными соотношениями глоточного и ротового резонаторов в зависимости от положения языка. Речевой тракт с такими характеристиками имеет весьма зна­
чительный артикуляционный потенциал. По мнению Ф. Ли-
бермана, именно это эволюционное изменение определило преимущество
homo sapiens
перед неандертальцами [Lieberman
1975]. Отметим, наконец, что сравнительные ис­
следования речевого аппарата у представителей разных рас не обнаружили сколько-нибудь заметных различий между ними
[Brosnehan
2.4. Описание звука в артикуляционной фонетике Основные типы звуковых артикуляций Понятие целевой артикуляции звука Производство любого звука человеческого языка пред­
полагает знание говорящим того, какую работу и ор­
ганами речи он должен осуществить, чтобы в результате воз­
ник такой акустический сигнал, который позволит слушаю­
щему опознать этот звук. Современные модели речепроиз­
водства, которые будут подробно рассмотрены ниже, исхо-
53 Глава 2. Артикуляционные механизмы речи дят из допущения, что в памяти человека в процессе усвое­
ния языка и развития речевых навыков формируется набор целевых артикуляций (ЦА), которые обладают следующими свойствами: с собственно артикуляционной точки зрения они пред­
ставляют собой ментальные образы, которые фиксируют оп­
ределенное положение произносительных органов в про­
странстве речевого тракта (это статические артикуляцион­
ные позы, которыми должен владеть носитель языка); с целевой точки зрения они выступают как стандарт­
ные средства достижения определенного слухового эффекта (это значит, что слуховой образ звука связан с целевой арти­
куляцией самым тесным образом); с функциональной точки зрения (роль в процессе ком­
муникации) они служат мостиком между абстрактными зву­
ковыми символами (фонемами) и физическими звуковыми колебаниями, с помощью которых передаваемая информа­
ция становится доступной слушающему. Предполагается, что каждой фонеме соответствует своя целевая артикуляция. Более кратко можно сказать, что ЦА — это статическая единица речепроизводства, внутренне зада­
ваемая артикуляционная "поза", в результате достижения которой порождается нужный звук. Набор таких целевых поз, используемых в данном языке, образует своего рода словарь глубинных артикуляций. Связи ЦА с другими эле­
ментами звукового механизма речи показаны на рис. Артикуляционный профиль и функциональная схема целевой артикуляции звука Обычным способом представления целевой артикуля­
ции, которым пользуются в фонетике очень давно, является артикуляционный профиль Это идеализированное графическое изображение уклада речевых органов, необхо­
димого для производства данного звука. Сведения о целевых артикуляциях и профилях звуко­
вых единиц получают с помощью различных средств: инт­
роспективных наблюдений, тактильно-мышечных и слухо­
вых ощущений, а также в результате инструментальных ис­
следований артикуляции. Как было показано выше, речевые органы выполняют разные функции в формировании звуковых колебаний. По-
54 2.4. Описание звука в артикуляционной фонетике Звуковые единицы языка ФОНЕМА Целевая артикуляция Движения речевых органов Звуковые колебания Рис. 2.15. Связи целевой артикуляции звука с другими элементами звукового механизма речи Целевой слуховой образ Акустические признаки, выделяемые слухом лезно иметь такое изображение которое отражало бы функции речевых органов, принимающих участие в созда­
нии соответствующего звука. Для этого можно использовать функциональную схему (ФС) речевого тракта, которая часто применяется в фонетических работах. В отличие от артику­
ляционного профиля на функциональной схеме в общих чертах отображается акустическая картина звукопроизводст-
ва: инициация, типы и местонахождение источников звука, примерное соотношение размеров резонансных полостей речевого тракта. На рис. 2.16 приводится общий вид подоб­
ной схемы, на ее базе далее будут строиться ФС конкретных целевых артикуляций. Базовая схема взята из [Чистович и 1976: 13]. Целевые артикуляции основных типов звуков Артикуляционная цель типового гласного состоит в придании речевому тракту такой формы, которая не создает какого-либо препятствия для прохода воздушного потока, идущего из гортани. Разные гласные характеризуются раз­
личной конфигурацией передней и задней частей фарин-
гально-ротовой полости. Граница между указанными частя-
55 Глава 2. Артикуляционные механизмы речи Рис. 2.16. Функциональная схема рече­
вого аппарата. А: 1 — сила дыхательных мыщц; 2 — объем легких; 3 — трахея; 4 — голосовые связки; 5 — гортанная трубка; 6 — полость глотки; 7 — нёбная занавеска; 8 — полость рта; 9 — полость носа; 10 — излучение из ротового отвер­
стия; — излучение из носового отвер­
стия Б: 2, 3 — емкость легких и трахеи; 4 — голосовой источник; 5, 6 - емкость гор­
тани и глотки; 7 — механизм нёбной за­
навески; 8 — емкость полости рта; 9 - емкость полостей носа; 10 - выход­
ной сигнал ротового тракта; — выход­
ной сигнал носового тракта; 12 — шумо­
вой ми условно определяется областью максимального сближе­
ния тела языка с пассивными артикуляторами — нёбом и задней стенкой глотки. Положение этой границы относи­
тельно общей длины речевого тракта непосредственно свя­
зано с его резонансными свойствами, поэтому можно ска­
зать, что артикуляционная цель гласного заключается в соз­
дании конфигурации речевого тракта, обладающей нужны­
ми резонансными характеристиками. В полном описании целевой артикуляции гласного необходимо отразить также, как функционируют и другие речевые органы: нёбная зана­
веска, гортань и голосовые связки. При произнесении глас­
ных голосовые связки обычно колеблются, выступая в каче­
стве единственного источника звука. Поэтому в гласных указание на работу голосовых связок часто опускается. При­
ведем пример АП и ФС типового гласного (рис. 2.17). Типовая цель шумного согласного состоит в создании шумообразующего препятствия для воздушного потока, про-
56 2.4. Описание звука в артикуляционной фонетике 2.17. Артикуляционный профиль и функциональная схема типового глас­
ного (на примере русского На наличие голосовых колебаний показано волнистыми линиями, а отсут­
ствие — прямыми. На ФС используются следующие обозначения: облас ть максимального сужения речевого тракта при произнесении гласных; Г — наличие голоса; Т — турбулент­
ный источник; В - взрывной ис­
точник; 4 - нешумообразующая преграда у согласных ходящего по речевому тракту. Шум возникает при наличии достаточного давления воздуха в той части речевого тракта, которая расположена позади препятствия. Шумообразующее препятствие может находиться в разных местах речевого тра­
кта и в зависимости от типа создаваемой преграды модифи­
цировать воздушный поток двумя способами. В первом случае воздушный поток, проходя через зна­
чительное сужение, созданное определенными артикулято-
рами, превращается в беспорядочные звуковые колебания, которые могут длиться достаточно продолжительное время. Так образуется турбулентный шум, а соответствующие сог­
ласные называются щелевыми по типу преграды или фрика­
тивными по типу шума (от англ.
friction). Во втором случае артикуляторы полностью воздух некоторое время вообще не выпускается из речевого тракта и накапливается за преградой. Быстрое размыкание смычки сопровождается созданием воздушного толчка, ко­
торый на слух воспринимается как короткий щелчок, или взрыв. Так произносятся взрывные согласные, которые по типу преграды называются смычными. Описанные особенности образования шумных соглас­
ных могут быть отражены в их артикуляционных профилях и функциональных схемах так, как это показано на рис. и 2.19. 5 7 Глава 2. Артикуляционные механизмы речи Рис. Артикуляционный профиль и функциональная схема типового фри­
кативного согласного (на примере рус­
ского Рис. 2.19. Артикуляционный профиль и функциональная схема типового взрыв­
ного согласного (на примере русского а — фаза смычки, б — фаза размы­
кания 58 2.4. Описание звука в артикуляционной фонетике Шумные взрывные требуют динамического представ­
ления сопутствующих им артикуляционно-акустических со­
бытий (смычка и быстрое шумообразующее размыкание). Этим данный тип согласных отличается от обычных гласных и фрикативных согласных, которых могут быть предста­
влены единичным артикуляционным профилем. Динамиче­
ский тип целевой артикуляции характерен и для аффрикат. Так называются шумные согласные, образование которых включает смычку и постепенное шумообразующее размыка­
ние, т. е. плавный переход полной преграды в щелевое су­
жение. В русском языке к аффрикатам относятся согласные и Целевая ориентация шумного согласного на создание шумообразующей преграды предопределяет и другие при­
знаки их артикуляции. Для образования нужного давления проход в носовую полость должен быть закрыт, т. е. нёбная занавеска поднята, а использование голосовых связок в ка­
честве источника звука, в отличие от гласных, уже не явля­
ется обязательным. Сонорные согласные характеризуются артикуляцией, целевые признаки которой занимают промежуточное поло­
жение между ЦА типового гласного и согласного. Здесь можно выделить два основных подтипа. В первом случае в надгортанной части речевого трак­
та образуется значительная преграда для прохождения воз­
душного потока и одновременно создаются условия, кото­
рые делают преграду нешумообразующей. Эти условия свя­
заны с образованием в речевом тракте дополнительных воз­
душных проходов, благодаря которым давление воздуха в ротовой полости не достигает больших величин. У носовых согласных размыкание ротовой смычки не создает шума, так как воздушный поток выходит через носовую полость (рис. 2.20). При произнесении боковых согласных прегра­
да, образуемая по центральной оси ротовой полости, не яв­
ляется так как воздух проходит через ка­
налы между боковыми краями языка и твердым нёбом (рис. а). Наличие боковых проходов трудно изобразить на профиле: о них сообщается либо словесно, либо с помо­
щью рисунка, дополняющего основное изображение (рис. 2.21 б). Накопление избыточного давления позади преграды может быть также предотвращено пропусканием воздуха че-
59 Глава 2. Артикуляционные механизмы речи Рис. 2.20. Артикуляционный профиль и функциональная схема носового с о­
гласного (на примере русского рез нее отдельными небольшими порциями. В этом случае артикуляция согласного характеризуется кратковременным чередованием фаз сближения/разведения а — артикуляционный про­
филь и функциональная схема боково­
го согласного (на примере русского б — боковые проходы при образо­
вании смычки по центру ротовой поло­
сти 60 2.4. Описание звука в артикуляционной фонетике Рис. 2.22. Артикуляционный профиль и функциональная схема вибранта (на примере русского участвующих в создании преграды. Например, при произне­
сении русского согласного [р] кончик языка колеблется от­
носительно твердого нёба, в результате чего проход через преграду то сужается, то расширяется (рис. 2.22). Описанная артикуляция относится к динамическому типу: она харак­
терна для сонорных, которые называются вибрантами или дрожащими. Второй подтип сонорных согласных образуется при на­
личии в речевом тракте сужения, которое по своим физиче­
ским параметрам и акустическим следствиям занимает про­
межуточное положение между сужением для фрикативного согласного и гласного (рис. 2.23). Подобные согласные час­
то называются (от англ. В типовых реализациях степень сужения у аппроксимантов не­
достаточна для образования такого избыточного давления, которое приводит к появлению шума. Целевая артикуляция сонорного согласного не связана с образованием шумообразующего препятствия и так же, как ЦА гласного, направлена на формирование резонансных свойств речевого тракта. Поэтому, аналогично гласным, со­
гласные этого типа обычно произносятся с участием голосо­
вого источника, т. е. при колеблющихся голосовых связках. В то же время артикуляционные преграды, которые создают­
ся при их произнесении, приводят к энергетическим поте­
рям: результирующие звуковые колебания у сонорных, как правило, менее интенсивны, чем у гласных. 61 Глава 2, Артикуляционные механизмы речи 2.23. Артикуляционный профиль и функциональная схема согласного ап-
проксимантного типа (на примере рус­
ского Из сказанного понятно, что производство речевых зву­
ков предполагает образование сужений в надгортанной час­
ти речевого тракта. Это главная особенность целевых арти­
куляций. Способ создания сужения и его степень являются важнейшими параметрами, на основе которых различаются артикуляционные цели основных типов звуков: гласных, шумных согласных и сонорных. 2.4.2. Двигательная реализация целевой артикуляции звука Понятие артикуляционного жеста Для описания динамической стороны речепроизводст­
ва наряду с понятием целевой артикуляции звука необходи­
мо ввести также понятие артикуляционного жеста (АЖ). Ар­
тикуляционный жест представляет собой двигательный акт, с помощью которого реализуется в речи целевая артикуля­
Он является комплексным и включает координирован­
ные движения всех речевых органов, которые участвуют в реализации артикуляционной цели. В артикуляционном жесте выделяют три временных фазы. Начальная фаза АЖ, называемая экскурсией, или Прямая связь между артикуляционной целью и механизмом ее достижения приводит к тому, что термин "артикуляционный жест" часто используется для обозначения самой целевой артикуляции. 62 2.4. Описание звука в артикуляционной фонетике Сегмент 1
[s] Сегмент 2 [о] Рис. 2.24. Артикуляционная реализация звуковой последовательности в речи (изолированное англий­
ского слова
saw) приступом, представляет собой переход артикуляционных органов от состояния покоя или предшествующего АЖ к ук­
ладу речевых органов, характерному для данного АЖ. Далее следует фаза выдержки, в течение которой сохраняется от­
носительно стабильный уклад речевых органов. В идеале именно в фазе выдержки должна быть реализована целевая артикуляция. Конечная фаза АЖ - рекурсия, или отступ, — представляет собой переход к состоянию покоя или реализа­
ции последующего АЖ. Поток речи не следует представлять как последователь­
ность АЖ с мгновенными переходами от одного жеста к дру­
гому. Даже при тщательном и достаточно медленном темпе произнесения последовательность звуков реализуется со значительным перекрытием фаз соседних АЖ. Это обеспе­
чивает плавность и непрерывность звучащей речи. Наблюда­
емая артикуляционная картина соответствует ситуации, ко­
торая изображена на рис. 2.24: начальные и конечные фазы соседних АЖ осуществляются почти одновременно (по [Laver
63 Глава 2. Артикуляционные механизмы речи Наблюдения над органической фазой артикуляции по­
казывают, что и это представление является в значительной степени идеализированным. Начиная с исследования П. Менцерата и А. Лацерды, опубликованного в 1933 г. [Menzerath, Lacerda
накоплено большое количество экспериментальных данных, которые свидетельствуют о том, что для реальной речи типичны глубокое переслаивание ар­
тикуляционных жестов соседних звуков и почти непрерыв­
ное изменение положения произносительных органов в про­
странстве речевого тракта. Приведем в качестве примера некоторые современные экспериментальные данные
et 1987]. На рис. 2.25 представлены результаты электропалатографического компьютерного анализа язычно-палатального контакта при произнесении слова
носителем английского языка. В приводимой палатограмме можно выделить следующие осо­
бенности. Язычный контакт в палатальной зоне, характер­
ный для
[i],
наблюдается на всем протяжении реализации он сохраняется и на последующем звуке
При произ­
несении последовательности
[tk]
выделяется интервал сосу­
ществования альвеолярной и велярной смычек. Для всех звуковых единиц характерны плавная перестройка речевых органов, участвующих в артикуляции, и отсутствие резких начальных и конечных границ. На рис. 2.25 в то же время видно, что в непрерывной картине речи могут быть выделены участки, где характери­
стики язычно-палатального контакта (его наличие и зона) определяются главными признаками целевых артикуляций, т. е. степенью сужения речевого тракта и его локализацией. Эти участки и есть фазы выдержки АЖ. Заметим, что и на рис. 2.24 опорным признаком целе­
вой артикуляции, на основании которого может быть выде­
лен участок выдержки, является степень сужения речевого тракта. Естественно, что чем ближе по этому признаку (и по локализации сужения) соседние целевые артикуляции, тем труднее вычленить выдержки исполняющих их жестов в по­
токе движений. Даже в тех случаях, когда это можно сделать, некоторые особенности выдержки зависят от соседних зву­
ков, придающих ей определенную контекстно-обусловлен­
ную окраску. Возможность выделения участка выдержки не означает, что пересекающиеся фазы артикуляции соседних звуков не представляют интереса для исследования. Напро-
64 2.4. Описание звука в артикуляционной 0118 0119 0120 0121 0122 0123 0124 0125 0126 0127 0128 0129 0130 А/ 0131 0132 0133 0134 0135 0136 0137 0138 0139 0140 IV 0157 0158 0159 0161 0162 0163 0164 0165 0166 0167 0168 0169 0183 0184 0185 0186 0187 0188 0189 0190 0191 0192 0193 0194 0195 il il
2.25. Язычно­палатальные три верхних ряда соответствуют альвео­
ты при произнесении английского слова лярной зоне, следующие два — палаталь­
(компьютерная запись норматив­ ной, три последние — велярной. Точки ного произношения). Интервал между показывают отсутствие контакта языка с отсчетами равен 10 мс, кадры овалы — его наличие чены слева направо. На каждом кадре тив, взаимодействие последовательных жестов, наиболее яр­
ко проявляющееся на стыковых участках, является важной характеристикой организации речепроизводства. Степень достижения артикуляционной цели в потоке речи Целевое положение артикуляторов, характеризующее данный звук, наиболее отчетливо наблюдается в фазе вы­
держки при изолированном произнесении звуков, а также при отчетливом произнесении коротких, односложных зву­
ковых последовательностей или слов. В слитной речи, как уже отмечалось выше, границы между соседними жестами размываются, заметно пересекаются их краевые участки, вы­
держка приобретает контекстную окраску и может быть 65 Глава 2. Артикуляционные механизмы речи сильно редуцирована по длительности (вплоть до полного исчезновения). В результате часто оказывается, что даже главные признаки целевых артикуляций сильно модифици­
руются. Одной из причин, вызывающих подобные измене­
ния, является ослабление артикуляционных усилий говоря­
щего при производстве звуков и тесно связанная с этим из­
бирательная природа контроля за деятельностью произноси­
тельных органов. Примеры подобного ослабления артикуляции и ее фо­
нетических следствий для русского языка можно найти в [Кодзасов 1973; РРР 1973; Бондарко и др. 1988]. Для соглас- | ных характерны следующие явления: неполная и поэтому за- шумленная смычка при произнесении взрывных и аффри­
кат, ослабление у смычных шумных признаков взрыва или его полная утрата, появление шепелявости у согласных с обычно резким на слух фрикативным шумом (типа и т. д. Гласные, прежде всего безударные, утрачивают собст­
венный тембр, превращаются в краткую вокалическую про­
кладку между соседними согласными, которая не имеет фа­
зы выдержки; в определенных контекстных условиях они могут полностью исчезать. Аналогичные особенности артикуляции были обнару­
жены и описаны для слитной речи и на материале других языков. В целом они могут быть охарактеризованы как не­
достижение целевой артикуляции исполняющим артикуля­
ционным жестом. В русской традиции в этих случаях гово­
рят об артикуляционной редукции. В современной англо­
язычной фонетической литературе для описания подобных явлений используется термин
undershooting,
что буквально означает "недострел". Этот термин соотнесен с идеей целе­
вой артикуляции, которая обозначается словом
target,
бук­
вально "мишень". Артикуляционная редукция, как полагают современные фонетисты, является следствием того, что обычно говорящий не ориентирован на произносительный акт как таковой. Сознательная цель говорящего в речевой коммуникации состоит в передаче речевого сообщения, а не в демонстрации своего умения отчетливо произносить от­
дельные звуки. Здесь нужно напомнить, что физические ха­
рактеристики речи — это лишь один из источников инфор­
мации, на основании которой слушающий реконструирует то, что было сказано говорящим. Гораздо более мощными источниками являются языковые знания слушающего (сло-
66 Описание звука в артикуляционной фонетике варные и грамматические) и условия данного коммуника­
тивного акта в целом. Развивая эту идею, известный швед­
ский фонетист Б. предложил так называемую Н&Н
(hyper- and теорию артикуляции
[Lindblom 1990; 1995], суть которой сводится к следующему. Говорящий продуцирует речь, оценивая текущим обра­
зом, насколько необходима для слушающего отчетливая фи­
зическая информация о звуковом составе языкового выраже­
ния на данном его участке. В зависимости от этой оценки це­
левые артикуляции звуков (в их двигательном воплощении) могут быть реализованы с разной степенью усилия и точно­
В результате на одних участках речевого потока возни­
кают гиперартикулированные формы
а на других — гипоартикулированные или редуцированные формы Контекстная зависимость АЖ, длительность их реализации, а следовательно, и степень достижения ими заданных артикуляционных целей для этих форм различны. Не одинаково и общее соотношение гипер- и гипоартикули-
рованных произнесений в тщательной и беглой речи. В русской фонетике близкие идеи гораздо раньше за­
падных фонетистов высказывал Щерба, который ввел разграничение полного и неполного (беглого) типов произ­
несения [Щерба 1974; Бондарко и др. 1973]. 2.4.3. Взаимодействие звуков в потоке речи Коартикуляция и аккомодация Взаимодействие целевых артикуляций при реализации звуковой последовательности наиболее ярко показывает сложную природу артикуляционных процессов, которые на­
блюдаются как в тщательной, так и в беглой речи. В качест­
ве общего названия для этих процессов в фонетике исполь­
зуется термин коартикуляция, обозначающий влияние целе­
вых артикуляций соседних звуков друг на друга, независимо от того, в каких конкретно изменениях артикуляционных жестов оно проявляется. В более узком смысле различают собственно коартикуляцию и аккомодацию. Артикуляционная вариативность может привести к существенным измене­
ниям в звуковой системе языка. Этой проблемой специально занимался из­
вестный французский лингвист А. Мартине, который исследовал фактор экономии произносительных усилий в звуковых изменениях [Мартине 1960]. 67 Глава 2. Артикуляционные механизмы речи Собственно коартикуляция имеет место в тех случаях, когда на артикуляционный жест данного звука накладыва­
ется движение, которое является компонентом соседнего звукового жеста. Наглядным примером является наложение губной артикуляции гласного на предшествующий соглас­
ный или даже последовательность согласных (ср. произне­
сение русских слов [суп], [стул] и даже Легко про­
верить, что в последнем случае при сохранении губной смычки [п] губы значительно вытянуты вперед, чего не на­
блюдается, например, при произнесении слова Та­
ким образом, при собственно коартикуляции на некотором интервале одновременно реализуются движения разных звуковых жестов, если они не противоречат друг другу. Полного совмещения соседних жестов, как правило, не происходит, и в наблюдаемой артикуляционной картине сохраняется информация об их последовательной реализа­
ции. При аккомодации движение (положение) некоторого речевого органа, участвующего в артикуляции данного зву­
ка, определяется не только этим звуком, но и его соседями. Адаптационная природа аккомодации выражается в том, что участвующий в ней речевой орган, будучи "исполнителем" данного артикуляционного жеста, подстраивается под целе­
вую артикуляцию соседних звуков. В результате происходит сближение (уподобление) последовательных звуковых арти­
куляций. Например, точное место образования преграды у язычных согласных зависит от положения языка, которое требуется для произнесения последующего гласного, как по­
казано на рис. 2.26 для согласного [к] в английских словах cool
(по
[Laver
1994: Положение языка при произнесении гласных, в свою очередь, зависит от целевых язычных артикуляций соседних согласных, и это может проявляться не только на граничных участках гласного, но и в интервале выдержки. Если имеют­
ся существенные различия в целевых положениях языка у соседних звуков, артикуляционная цель гласного может быть и не достигнута. Это наблюдается, например, в русском языке при произнесении задних гласных /у, о, а/ в соседст­
ве с мягкими согласными, целевая артикуляция которых предполагает подъем средней части языка к твердому нёбу, т. е. палатализацию. Аккомодация приводит к тому, что в данном контексте указанные гласные произносятся с более 68 Описание звука в артикуляционной фонетике в) Рис. 2.26. Аккомодация места веляр­
ной смычки английского согласного [к] к язычной артикуляции последую­
щего а — позиция перед
[i] б— перед (cars);
в — перед высоким и более передним положением языка сравнительно с произнесением в изолированном положении (см. рис. 2.27, по [Матусевич 1976: Как видно из последнего примера, артикуляционный "недострел" может быть связан не только с ослаблением артикуляционного усилия, но также и с силь­
ным контекстным влиянием. Уподобление последовательных артикуляционных жес­
тов может иметь и иное проявление. Например, ротовые гласные перед носовыми согласными часто назализуются: опускание нёбной занавески, необходимое для производства согласного, осуществляется при произнесении гласного, це­
левая артикуляция которого предполагает закрытый носовой проход (подъем нёбной занавески). Полная назализация 69 Глава 2. Артикуляционные механизмы речи гласного происходит, одна­
ко, только в том случае, ко­
гда это не влияет на узнава­
емость произносимого сло­
ва. Поэтому она редко встречается в языках, где противопоставление носо­
вых и неносовых гласных выполняет смыслоразличи-
тельную функцию, как, ска­
жем, во французском языке. В рассмотренном примере важный признак целевой ар-
2.27. Зависимость язычной артику­
ляции русского гласного /у/ от мягко-
после твердого согласного после мягкого согласного ТИКуЛЯЦИИ СОГЛаСНОГО ак- согласного тивно вытесняет противопо­
ложный, но менее сущест­
венный признак гласного. Назализация гласных может про­
исходить и в положении после носовых согласных, когда нёбная занавеска некоторое время продолжает оставаться в опущенном состоянии при произнесении ротового гласного. В этом случае имеет место так называемая пассивная коар-
которая вызвана более медленным, запаздываю­
щим подъемом нёбной занавески по сравнению с движени­
ями остальных артикуляторов (языка и губ), участвующих в создании гласного. Коартикуляционные процессы чрезвычайно распро­
странены во всех языках и имеют многообразное выраже­
ние. Укажем главные параметры, которые учитываются при их более детальном рассмотрении. В зависимости от того, к каким основным классам принадлежат взаимодействующие звуки, различают собст­
венно аккомодацию и ассимиляцию. В первом случае взаи­
модействуют согласный и гласный, а во втором - звуки од­
ного класса (согласные или гласные). По направлению взаимодействия разграничивают рег­
рессивную и прогрессивную коартикуляцию. В первом слу­
чае целевая артикуляция изменяется под влиянием последу­
ющего звука, во втором — под влиянием предыдущего. В за­
падной фонетической литературе для обозначения регрес­
сивного взаимодействия используются термины предвосхи­
щающая (англ.
anticipatory)
или право-левая (англ.
right-to-
left)
коартикуляция. Взаимодействие прогрессивного типа 70 звука в артикуляционной фонетике называется распространяющейся (англ.
carryover)
или лево-
правой (англ.
left-to-right)
коартикуляцией. По результату коартикуляционного взаимодействия выделяются два типа процессов: частичное и полное уподоб­
ление. В первом случае целевая артикуляция звука в своем двигательном воплощении приобретает контекстно-обуслов­
ленную окраску. Во втором она сближается (до полного сов­
падения) с артикуляционным жестом другого звука. Такова, например, природа ассимиляции по глухости/звонкости шумных согласных в русском языке (ср.
Гали). При полном контекстном уподоблении разных звуковых жестов происходит замена одной целевой артикуляции на другую, т. е. изменяется лингвистическая программа произнесения. Это означает, что коартикуляционный процесс перестал быть чисто реализационным и приобрел статус автоматиче­
ского языкового правила. Обычно такое переосмысление ко-
артикуляционных процессов происходит в ситуациях, когда коартикуляция затрагивает движения, соотносимые со смыслоразличительными (фонологическими) признаками звуков. Проблема фонетической сегментации речевого потока В фонетике, говоря о фонетической сегментации, час­
то пользуются понятием звука речи. При этом звуком речи называют такой минимальный фрагмент речевого потока, который является результатом сложной артикуляционной деятельности, обладает определенными акустическими и перцептивными свойствами и соотносится с минимальной звуковой единицей языка - фонемой [ЛЭС 1990: 165]. Воз­
никает вопрос, в какой степени научные представления об отдельном звуке речи и возможности его вычленения соот­
ветствуют тем процессам, которые имеют место в звуковых механизмах речевой деятельности. Выше уже говорилось, что из-за коартикуляции в на­
блюдаемой артикуляционной картине речи трудно, а подчас и невозможно найти точные физические границы, отделяю­
щие целевую реализацию одной фонемы от другой. Это свя­
зано с тем, что в задачи говорящего не входит поддержание строгой дискретной природы звуковой цепочки: для него важны лишь глубинные целевые артикуляции и артикуляци-
Глава 2. Артикуляционные механизмы речи онные динамические навыки (артикуляционные жесты и ме­
ханизмы их взаимодействия), которые в условиях данного коммуникативного акта обеспечивают понятность речевого сообщения для слушающего. Современные данные о восприятии речи говорят о том, что и слушающий, скорее всего, не осуществляет прямой перцептивной сегментации речевого сигнала на отрезки фо­
немной протяженности. Его деятельность связана со слож­
ной интерпретацией физических данных, окончательное представление которых в виде звуковой цепочки опосредо­
вано не только акустической информацией, но и звуковой системой языка, словарными знаниями, владе­
нием письменной речью и т. д. Таким образом, полная сегментация речевого потока на звуки речи — это проблема фонетического, и прежде все­
го исследования, а не звукового поведения носителей языка. Если конкретные задачи исследования требуют такой сегментации, она осуществляется на основе физических границ, которые присутствуют в речевом пото­
ке (артикуляционном или акустическом), слухового анализа и специальных правил, которые соотносят фонемные едини­
цы языка с физическими отрезками. Как увидим далее, понятие звука речи активно используется классической фонологии для описания чрезвычайно разнообразных реа­
лизаций одной и той же фонемы в речевом потоке. 2.4.4. Универсальные и конкретно-языковые черты коартикуляции Коартикуляция возникает под воздействием двух взаи­
мосвязанных факторов, которые имеют универсальную при­
роду. Первый фактор — это стремление говорящего быстро и эффективно передать информацию в звучащей речи. При­
менительно к артикуляции это означает, что говорящий стремится произнести речевой отрезок в минимально воз­
можные временные сроки при минимальной затрате мышеч­
ных усилий, однако без потери разборчивости и понятности речевого сообщения для слушающего. Известно, что даже при умеренном темпе произнесения скорость разборчивой артикуляции в среднем составляет звуков в секунду. Учитывая рабочие характеристики речевых органов, участву­
ющих в производстве звуков, такую скорость невозможно 72 Описание звука в артикуляционной фонетике было бы получить при строго дискретной реализации фо­
немных цепочек, образующих слова и фразы. Сократить время произнесения речевого отрезка удается только с помо­
щью специальной организации ("упаковки") движений, вхо­
дящих в состав последовательных артикуляционных жестов. Регрессивная (предвосхищающая) коартикуляция, при кото­
рой жест данного звука включает элементы последующего или сближается с ним, сокращает время перехода от одной целевой артикуляции к другой. В результате скорость арти­
куляции увеличивается, а время произнесения звуковой по­
следовательности Уподобление соседних зву­
ковых жестов приводит к сокращению расстояния между це­
левыми положениями артикуляторов; это уменьшает нагруз­
ку на мышцы, которые должны обеспечивать переходные движения, и сокращает время их реализации. Редукция ар­
тикуляционных целей также является примером экономии произносительных усилий. Второй фактор, обусловливающий коартикуляцию, — это инерционно-механические и нейрофизиологические ог­
раничения, которыми характеризуются речевые Инерционные свойства артикуляторов определяются их ана­
томическим строением: очевидно, что кончик и передняя часть языка более подвижны, чем его средняя и задняя час­
ти; нёбная занавеска менее подвижна, чем тело языка, и т. д. Чем более массивным является речевой орган, тем труднее привести его в движение и заставить двигаться с нужной ско­
ростью. Механические ограничения предопределены тем, что некоторые речевые органы связаны между собой: например, нижняя губа и язык соединены мышцами с нижней челю­
стью. Поэтому ее опускание при произнесении открытых гласных, например русского создает особые и достаточно трудные условия для производства соседних согласных с губ-
Исследователи отмечают что коартикуляция предотвращает образо­
вание паразитических звуков, которые при строго дискретной реализации целевых артикуляций неизбежно возникали бы на пограничных участках а1. 1980]. аппарат представляет собой сложную биомеханическую систему, которая состоит из мышц, хрящей, косточек, сухожилий и связок. Как вся­
кий механический объект, эта система имеет ограниченный диапазон дви­
гательных возможностей, которые подчиняются законам физики. В частно­
сти, в полном соответствии с первым законом Ньютона скорость движения речевого органа обратно пропорциональна его массе и прямо пропорцио­
нальна прилагаемой к нему силе нервного возбуждения. 73 Глава 2. Артикуляционные механизмы речи ной или язычной артикуляцией — их гораздо легче произне­
сти с поднятой нижней челюстью. Нейрофизиологические ограничения проявляются в том, что время прохождения нер­
вных импульсов, вызывающих сокращение мышц в разных частях речевого аппарата, различно: при одинаковой интен­
сивности нервного возбуждения оно определяется физиче­
скими параметрами проводящих нервных путей (их толщи­
ной и длиной). Например, нервные импульсы, управляющие мышцами в ротовой полости, попадают в свою рабочую об­
ласть раньше синхронно возникающих импульсов, которые управляют мышцами гортани, с опережением до 30 мс 1967]. Этим, в частности, может быть объяснено озвончение начальных участков глухих согласных в положе­
нии после гласных (часто встречающаяся коартикуляция про­
грессивного типа). Кроме того, частота нервных импульсов, которая определяет интенсивность нервного возбуждения мышцы и степень ее сокращения, имеет некоторую верхнюю границу. Поэтому увеличение скорости и точности движений речевых органов возможно только до определенного предела. Ограничения, действующие в артикуляции, ярко де­
монстрируют скороговорки (типа Шла Саша по Затруднения, которые возникают при их произнесении, по­
казывают, что речевые органы характеризуются разными двигательными способностями, которые должны быть как­
то учтены при артикуляции слитной речи. Теоретически воз­
можны три способа организации движений. Первый способ реализуется в предвосхищающей коартикуляции: органы, которые имеют более сильные двигательные ограничения, активизируются раньше более подвижных компонентов ар­
тикуляционного жеста (ср. рассмотренный выше пример ре­
грессивной назализации гласных перед носовыми согласны­
ми). Второй способ состоит в увеличении интенсивности нервного возбуждения, прилагаемого к произносительным органам, что приводит к более быстрому сокращению соот­
ветствующих мышц и блокировке инерционных тенденций. Оба указанных способа предполагают специальное программирование движений, входящих в состав последова­
тельных артикуляционных жестов, причем на реализацию второго способа затрачивается больше энергетических уси­
лий. С помощью артикуляционных упражнений скороговор­
ки можно научиться произносить очень быстро и разборчи­
во, но это требует особого внимания и выбора такой скоро­
74 2.
4. Описание звука в артикуляционной фонетике сти артикуляции, которая не заставляла бы речевой аппарат работать на пределе своих рабочих возможностей. Наконец, третий способ "борьбы" с двигательными ог­
раничениями состоит в том, чтобы вообще с ними не бо­
роться. Это проявляется в пассивной коартикуляции, когда реализация данного звукового жеста сопровождается сохра­
нением артикуляционных элементов предшествующего зву­
ка (ср. приводившиеся выше примеры назализации гласно­
го после носового согласного, озвончения согласного после гласного). Универсальные коартикуляционные тенденции реали­
зуются на фоне общекоммуникативного требования: говоря­
щий должен произнести речевой отрезок достаточно разбор­
чиво для того, чтобы слушающий мог опознать входящие в него слова и понять речевое сообщение. В каждом конкрет­
ном языке, однако, используется своя система фонемных единиц, которые обеспечивают построение и различение слов. Это приводит к тому, что универсальные тенденции в разных языках реализуются по-разному. Например, точность артикуляции гласного и его подверженность различным ко-
артикуляционным процессам в конкретном слове зависят от общего количества гласных фонем в данном языке, от коли­
чества гласных, которые различаются в данном фонетиче­
ском контексте, от того, есть ли в данном языке слова, ко­
торые различаются только гласными, и т. д. Важны не толь­
ко фонологические характеристики звуковой системы язы­
ка, но и исторически складывающиеся произносительные навыки. Их отсутствие у говорящих, для которых язык не является родным, неизбежно приводит к появлению ино­
язычного акцента. В качестве иллюстрации этой зависимо­
сти на рис. 2.28 приведены экспериментальные данные, по­
казывающие, как реализуется предвосхищающая лабиализа­
ция перед гласным [и] у носителей английского (Еп), испан­
ского и французского языков (по Отдельные кривые на приводимом рисунке отражают дви­
жение нижней губы вперед (выпячивание), которое фикси­
ровалось во времени относительно ряда последовательных артикуляционных событий при произнесении звуковых це­
почек и [капш] разными говорящими. Отметим еще несколько интересных фактов, выявлен­
ных в результате специальных исследований артикуляцион­
ного взаимодействия звуков. 75 Глава 2. Артикуляционные механизмы речи Рис. 2.28. Предвосхищающая вокаличе­
ская лабиализация в английском, ис­
панском и французском языках. Услов­
ные обозначения: размыкание смыч­
ки | начало фонации конец первого гласного; размыкание смыч­
ки может затрагивать разные компоненты артикуляционных жестов, в частности влиять на реализацию опорных признаков целевых артикуляций, задающих сте­
пень и локализацию основного сужения, на поведение губ, небной занавески, голосовых связок и т. д. Реже всего коар-
тикуляция распространяется на способ образования звука: согласные крайне редко "превращаются" артикуляторно в гласные (это возможно прежде всего для аппроксимантных согласных). Смычные взрывные в определенных ситуациях могут "превращаться" во фрикативные, однако противопо­
ложный переход невозможен и т. д. Это указывает на то, что признаки целевых артикуляций имеют неодинаковую значи­
мость для создания необходимого слухового эффекта: то, что 76 2.4. Описание звука в артикуляционной фонетике наиболее важно, подвергается модификациям в последнюю очередь. Область коартикуляционного взаимодействия также различна. Аккомодация язычных артикуляций, от которой зависит расстояние между положением главных сужений в речевом тракте (например, аккомодация места образования согласных к ряду гласных и наоборот), обычно затрагивает только соседние звуки. Напротив, предвосхищающее опус­
кание нёбной занавески, необходимое для производства но­
сового согласного, может охватывать всю последователь­
ность вокальных звуков, предшествующих этому согласно­
му, независимо от длины такой последовательности и нали­
чия в ней слоговых и словесных границ. Наибольшие воз­
можности с точки зрения размеров "зоны распространения" имеет предвосхищающая вокалическая лабиализация: она может распространяться на последовательность согласных длиной до шести единиц
[Benguerel, Cowan
1974]. Имеются различия и в типичности коартикуляций, ко­
торые отличаются направлением взаимодействия. Так, ак­
тивная коартикуляция предвосхищающего типа встречается гораздо чаще и выражается ярче, чем инерционная. С точки зрения общих задач звуковой коммуникации это ожидаемый результат. Выше уже говорилось, что именно предвосхища­
ющая коартикуляция увеличивает скорость передачи инфор­
мации и одновременно позволяет учесть двигательные огра­
ничения речевого аппарата. Коартикуляционные явления представляют огромный интерес для понимания артикуляционных механизмов речи и их взаимодействия с системой языка. С ними связаны исто­
рические и синхронные звуковые изменения, наблюдаемые в конкретных языках. В то же время многое остается неясным, не хватает и экспериментальных сведений, раскрывающих конкретные особенности Это объясняется несколькими причинами. С одной стороны, получение пря­
мых инструментальных данных об органической фазе арти­
куляции сопряжено с большими техническими трудностями, а в формах речевого поведения, как естественная раз­
говорная речь, это просто невозможно. Поэтому исследова­
ние часто основано на анализе ее акустико-
слуховых следствий. С другой стороны, наблюдаемые движе­
ния речевых органов — это лишь видимая часть "айсберга", обеспечивающего произносительную деятельность. Глубин-
77 Глава 2. Артикуляционные механизмы речи ные процессы и этапы речепроизводства недоступны наблю­
дению и могут быть воспроизведены только в виде теорети­
ческих моделей. Объяснительная сила этих моделей опреде­
ляется тем, насколько полно и непротиворечиво они прогно­
зируют наблюдаемые артикуляционные явления. 2.5. Элементы динамической модели речепроизводства Главная задача моделей речепроизводства состоит в том, чтобы объяснить, каким образом лингвистическая про­
грамма произнесения преобразуется в движения речевых ор­
ганов. Пытаясь решить эту задачу, ученые выдвигают раз­
личные гипотезы и проводят специальные эксперименты. Однако сложность артикуляционных процессов настолько велика, что единой, общепринятой модели артикуляции до сих пор не существует. Ниже мы ограничимся рассмотрени­
ем теоретических положений, которые в том или ином виде присутствуют в большинстве современных моделей. В модельной структуре речепроизводящего механизма обычно выделяются два компонента: управляющий (англ. controller)
и исполняющий (англ.
performer).
Управляющий компонент воспроизводит функции центральной нервной си­
стемы, которая в артикуляционной деятельности отвечает за формирование набора двигательных (моторных) команд. Здесь моделируются процессы, относящиеся к фазе двига­
тельного программирования артикуляции. Задачи исполняю­
щего компонента связаны с моделированием процессов, про­
исходящих на нейромышечном и органическом этапах рече­
производства. В целом модель должна имитировать организа­
цию и функционирование той части двигательной системы человека, которая обеспечивает производство звуковой речи. 2.5.1. Управляющий компонент модели речепроизводства Понятие координационной двигательной структуры Механизмы нервного обеспечения произносительной деятельности очень сложны: в них участвуют как централь­
ная нервная система (моторная кора левого полушария 78 2.5. Элементы динамической модели речепроизводства мозга, подкорковые структуры, структуры ствола мозга, мозжечок), так и периферическая (моторные и сен­
сорные нервы, по которым передаются нервные импульсы из центральной нервной системы к мышцам и обратно). Есть основания полагать, что общие принципы работы цен­
тральных нервных механизмов в речи аналогичны тем, кото­
рые наблюдаются в других видах двигательной Один из главных принципов состоит в том, что движения и вся система управления двигательными органами ориенти­
рованы на решение задач, которые необязательно имеют двигательную природу. Это характерно даже для таких вро­
жденных двигательных актов, как дыхание или глотание. Например, в основе обычного дыхательного акта лежат по­
требности внутреннего газообмена (вентиляции легких), ко­
торые предотвращают возможность удушья. Эта функцио­
нальная задача порождает соответствующую моторную цель, и стандартный способ ее двигательного осуществления — увеличение объема легких с помощью расширения грудной клетки. В достижении моторных целей дыхательного акта участвуют многие мышцы. Их координированное сокраще­
ние приводит к нужным движениям грудной клетки, кото­
рые человек почти не замечает. Координация мышц для ре­
ализации целостного двигательного акта называется мышеч­
ной синергией, а объединение мышц в автономную функци­
ональную систему, выполняющую определенную двигатель­
ную задачу, — координационной структурой. Координационные структуры обладают рядом важных свойств, которые, как полагают ученые, должны учитывать­
ся при создании правдоподобных моделей артикуляции. Укажем наиболее существенные из них. Первое свойство можно назвать гибкостью функционирования. Одна и та же Ценный материал для понимания отдельных участков мозга в орга­
низации произносительной стороны речи дают очаговые поражения, возни­
кающие при сосудистых заболеваниях нервной системы, мозговых опухолях или травмах. Интересные наблюдения над речью русскоговорящих больных приведены в книге [Винарская, Пулатов 1989]. Для изучения функций ло­
кальных участков мозга нейрофизиологи проводят эксперименты с исполь­
зованием различных стимуляторов (электрических или химических). Ни в одном из экспериментов по стимуляции отдельных участков мозга не было получено спонтанных реакций в виде произнесения целого слова, хотя из­
вестно, что локальная стимуляция может приводить к реализации сложных движений. Это говорит о том, что произнесение слова базируется на одно­
временном действии многих участков мозга и не может быть вызвано един­
ственной локальной стимуляцией. 79 Глава 2. Артикуляционные механизмы речи координационная структура может осуществлять целую со­
вокупность близких действий, которые приводят к одному и тому же функциональному результату. Дыхательный акт, на­
пример, реализуется в разных условиях: человек дышит в положении стоя, лежа, сидя, при ходьбе и т. д. Это требует изменения баланса мышечных нагрузок в рамках структуры, обеспечивающей дыхание, но не влияет на окончательный результат. Двигательная активность дает разнообразные при­
меры такого множественного соотношения между двига­
тельным заданием и его мышечным исполнением (ср. напи­
сание слова ручкой на бумаге и мелом на плохой доске; ходьба по асфальту или по вязкой почве). Из таких приме­
ров можно сделать два вывода: 1) двигательное задание не может быть сведено к набору моторных команд, вающих постоянные, независимые от условий параметры мышечных сокращений; оно должно иметь более ный характер; 2) при исполнении двигательного задания ко­
ординационные структуры учитывают внешние условия (или контекст) двигательного акта. Адаптирующее перераспреде­
ление мышечной нагрузки внутри координационной струк­
туры происходит без участия высших двигательных центров на основе внутренних механизмов саморегуляции (подобно тому, как действуют простые терморегуляторы в электриче­
ских утюгах, освобождая человека от необходимости перио­
дически выдергивать шнур из электрической розетки). Ис­
пользование механизмов саморегуляции для приспособле­
ния к условиям двигательного акта — второе важное свойст­
во координационных структур. Наконец, нужно упомянуть о способности этих структур входить в более сложные систе­
мы аналогичной природы. Так, в акт ходьбы включены ко­
ординационные структуры, управляющие движениями рук, голеностопных частей, ступней и пальцев ног. Таким обра­
зом, в координационные структуры, выполняющие единый двигательный акт, могут объединяться не только отдельные мышцы, но и большие группы мышечного аппарата, управ­
ляющие движениями отдельных частей человеческого тела. Координационные структуры артикуляции Исследователи речи провели большую эксперимен­
тальную работу для выяснения того, как действуют в речи различные координационные структуры: дыхательный меха-
80 2.5. Элементы динамической модели речепроизводства низм
[Lenneberg
1967], структуры слоговой организации ре­
чи
[Lindblom
1983], артикуляционные координации, обеспе­
чивающие произнесение звуков. Последние изучались наи­
более интенсивно, обычно на материале многократного по­
вторения слогов или слов разными говорящими. В экспери­
ментах исследовались мышечные усилия и движения рече­
вых органов как в условиях естественного произнесения, так и при искусственно вводимых ограничениях на подвижность того или иного артикулятора. В качестве примера рассмот­
рим результаты некоторых экспериментов
[Fowler, 1980;
Kelso
et al.
1986]. В одном из них анализировались мы­
шечная активность и движения губ при ограничении под­
вижности нижней челюсти, которое вводилось неожиданно для говорящего при произнесении гласного в звуковой це­
почке
В обычных условиях гласный
[se]
произносится с опущенной челюстью, которая далее должна быть поднята для создания губно-губной смычки согласного Если ис­
кусственно воспрепятствовать этому подъему, смычка все же осуществляется за счет увеличения мышечной активности верхней губы и более выраженного, по сравнению с нормой, движения вниз к нижней губе. Если то же самое проделать с челюстью при произнесении цепочки
то оказывает­
ся, что при переходе к артикуляции альвеолярного
[z]
огра­
ниченная подвижность челюсти приводит к увеличению мы­
шечной активности в передней части языка и более энергич­
ному подъему кончика языка к альвеолам. При этом не на­
блюдается никаких изменений в поведении верхней губы. Таким образом, движения речевых органов, совме­
стно с челюстью участвуют в артикуляции согласных, изби­
рательно компенсируют неожиданные отклонения в ее дви­
жении, помогая осуществить заданную двигательную цель — создать губную смычку для
[b]
и альвеолярную щель для
Компенсация наступает очень быстро; это говорит о том, что перестройка артикуляторов осуществляется автоматиче­
ски, благодаря координационным связям между челюстью и губами в случае
[b]
и челюстью и кончиком языка — в слу­
чае
Сигналом для начала перестройки является инфор­
мация, поступающая по каналам обратной связи. Наиболее существенны проприоцептивные сигналы, идущие от мы­
шечных сенсорных рецепторов. Благодаря этим сигналам нервная система "узнаёт" о текущем состоянии речевого тракта и может перестроить последующие движения так, 81 Глава 2. Артикуляционные механизмы речи чтобы артикуляционная цель была достигнута. Целеориен-
тированная перестройка артикуляционных движений, учи­
тывающая текущее состояние тракта, называется компенса­
торной артикуляцией. В ряде экспериментов было обнаружено, что компен­
саторная артикуляция может выражаться в весьма сущест­
венных артикуляционных перестройках. Например, в норме артикуляция гласного [и] предполагает вытягивание и округ­
ление губ, что приводит к увеличению длины речевого тра­
кта и появлению дополнительного резонатора на выходе из ротовой полости. Если исполнение этого движения затруд­
нено (по каким-то естественным или искусственным причи­
нам), нужный тембр гласного достигается либо более высо­
ким и более задним (относительно стандартной целевой ре­
ализации) положением языка, либо опусканием гортани. В этих случаях перестройка артикуляции приводит к разным изменениям в форме речевого тракта: в первом случае отсут­
ствие удлинения тракта на выходе из ротовой полости ком­
пенсируется удлинением передней части ротового резонато­
ра за счет движения языка, во втором — удлинением задней части на счет движения гортани. Таким образом, существу­
ют по крайней мере три разные артикуляционные конфигу­
рации, которые дают один и тот же акустико-слуховой эф­
фект гласного. Какая из них является стан­
дартной а какая возникает только в условиях ком­
пенсации, сказать Оказалось, что разные говорящие при многократном повторении гласного [и] используют раз­
ные конфигурации из указанного набора. При этом один и тот же говорящий, хотя и опирается на некоторый произно­
сительный стандарт, может использовать и другие акустиче­
ски эквивалентные артикуляционные формы. Эти результа­
ты показывают, что двигательные цели, на достижение ко­
торых направлена артикуляция, имеют акустико-слуховую природу. Компенсаторные механизмы действуют не только при искусственном ограничении движений, как это было в опи­
санных экспериментах. Перестройка артикуляции с учетом текущего состояния тракта необходима во многих повсе­
дневных ситуациях общения: люди разговаривают с сигаре­
той в зубах, с конфетой во рту, бывают беззубыми и т. д. Ес­
ли бы человек не умел быстро компенсировать существен­
ные изменения формы тракта и состояния 82 2.5. Элементы динамической модели речепроизводства которые сопутствуют подобным ситуациям, общение с по­
мощью устной речи было бы затруднено. Произнесение зву­
ка в различных звуковых контекстах также опирается на компенсаторные механизмы. Однако контекстно зависимая перестройка целевой артикуляции редко бывает полной: в разных контекстах фазы выдержки одного и того же звука отличаются и и акустически. Компенсирую­
щие усилия говорящего сбалансированы со стремлением к экономии произносительных усилий: компенсирующая пе­
рестройка целевой артикуляции с учетом контекста осуще­
ствляется в той степени, которая достаточна для понимания произносимого слушающим. Изучение координационных структур и явлений ком­
пенсаторной артикуляции оказало большое влияние на на­
учную интерпретацию глубинных артикуляционных меха­
низмов. Были сформулированы принципиальные вопросы, без ответа на которые не может обойтись никакая функцио­
нальная модель речепроизводства. Укажем наиболее важные из них: 1) в чем заключается функция артикуляционных ме­
ханизмов в звуковой коммуникации; 2) какая артикуляцион­
ная структура является минимальным (самым простым) объ­
ектом управления и какие параметры ее двигательного пове­
дения могут контролироваться; 3) какова природа двигатель­
ных заданий, выполняемых артикуляционными структура­
ми; 4) как артикуляторы организуются в координационные структуры для достижения двигательных целей и как регули­
руется их работа во времени; 5) что представляют собой мо­
торные команды и каким образом учитываются контекстные условия, в которых осуществляются двигательные артикуля­
ционные акты; 6) как возникают коартикуляция и явления компенсаторной артикуляции. Попробуем изложить в сум­
марном виде, как решаются эти вопросы в современных мо­
делях артикуляции. Заметим, что ряд положений, о которых будет идти речь, носит дискуссионный характер. Организация управляющего компонента и двигательные цели артикуляции Функция артикуляционных механизмов в звуковой коммуникации состоит в том, чтобы преобразовать лингви­
стическую программу произнесения в речевой сигнал, ха­
рактеристики которого слушающий использует для декоди-
83 Глава 2. Артикуляционные механизмы речи рования речевого сообщения (опознавания слов, типа инто­
нации и т. Эта задача ориентирована на взаимодействие со слушающим, и работа артикуляционных механизмов за­
висит от коммуникативных установок говорящего (ср. пол­
ный/беглый тип произнесения). Речевой сигнал образуется в результате координирован­
ных движений артикуляционных органов в пространстве ре­
чевого тракта. Минимальным управляемым объектом являет­
ся отдельный артикулятор (верхняя и нижняя губы, нижняя челюсть, кончик языка, спинка языка, все тело языка и т. д.). Управляющий компонент должен задавать параметры движе­
ний артикуляторов: величину и направление смещения из одного положения в другое, а также скорость смещения. Представляется маловероятной такая стратегия управления, при которой звуковые единицы лингвистической программы непосредственно (в один шаг) преобразовывались бы в дви­
жения, поскольку их параметры очень сильно варьируются в зависимости от многих причин, в том числе и не связанных с лингвистической программой сообщения. Движения пла­
нируются поэтапно, и в управляющем механизме можно вы­
делить три функциональных уровня со своими типами дви­
гательных заданий. На начальном этапе определяются глав­
ные функциональные задания. При произнесении звуков планирующие действия управляющего компонента направле­
ны на то, чтобы в результате артикуляции образовались зву­
ковые колебания с нужными акустическими характеристика­
ми. Для этого фонемные символы, входящие в лингвистиче­
скую программу, заменяются сначала на соответствующие им целевые артикуляции (образы артикуляционных поз и/или конфигураций речевого тракта, которые необходимо создать для порождения Целевая артикуляция является глу-
Некоторые ученые утверждают, что звуки не имеют стандартных целевых артикуляций: говорящий просто знает, как переводить слуховые образы не­
посредственно в артикуляционные движения, без промежуточного исполь­
зования стереотипных артикуляционных укладов или форм речевого тракта [Guenther
Это мнение основано на описанных выше экспериментах, показывающих, что один и тот же тембр гласного может быть получен при весьма различных укладах речевых органов и формах тракта. Не признают целевых артикуляций и те исследователи, которые считают минимальной произносительной единицей слоговые структуры
[Levelt
1989]. Наконец, есть еще одна теоретическая позиция, отрицающая целевые артикуляции. Согласно этой позиции, цели артикуляции соотносятся с различительными признаками фонем
[Browman, Goldstein
1992]. Мы излагаем более традици­
онную точку зрения. 84 2.5. Элементы динамической модели речепроизводства бинной координационной структурой, характеристики кото­
рой не зависят от звукового контекста. На ее основе опреде­
ляются двигательные цели для подчиненных структур следу­
ющего уровня. Подчиненные цели связаны с построением в речевом тракте сужений, принципиально важных для звуко­
образования: голосовой щели, носового, язычного и губного проходов. Например, целевая артикуляция звонкого губного смычного согласного /б/ порождает такие цели: создать голо­
совую щель, необходимую для образования голоса; плотно закрыть носовой проход (для глоточно-нёбной структуры, пе­
рекрывающей доступ воздуха в носоглотку); плотно закрыть губной проход (для структуры, включающей обе губы и ниж­
нюю челюсть). Таким образом, на втором этапе планирова­
ния в качестве двигательных целей выступают состояния главных отделов речевого тракта, которые создают акустиче­
ские характеристики, важные для восприятия планируемого звука. Для их реализации активизируются группы артикуля-
торов, которые совместно контролируют такие параметры су­
жений, как локализация, форма, величина, напряженность и т. п. На последнем этапе планирования создаются двигатель­
ные задания для мышечных структур, отвечающих за произ­
водство движений, в результате которых образуются сужения с заданными параметрами. Например, для создания губной смычки надо указать, как конкретно должны двигаться верх­
няя и нижняя губы, а также нижняя челюсть. Нужно учесть также, что движения этих артикуляторов зависят от звуково­
го контекста, в котором реализуется смычка. Таким образом, при переходе от высшего уровня управления к низшему дета­
лизируется исходное функциональное задание и уточняется состав его исполнителей: целевая артикуляция задает нужную форму тракта очень приблизительно, но зато целостно. На следующем уровне единое задание получают более мелкие структуры, отвечающие за настройку главных частей тракта при производстве данного звука. Наконец, на последнем уровне общее задание объединяет небольшие группы мышц, которые контролируют самые тонкие детали артикуляции: конкретные движения или положения речевых органов в ка­
ждой акустически важной части тракта. Как видим, иерархи­
ческое планирование артикуляции изначально направлено на конструирование "аэродинамической трубы для извлечения нужных звуков". Уровни планирования артикуляционных движений представлены в нижеследующей таблице. 85 Глава 2. Артикуляционные механизмы речи Лингвистическая программа произнесения Фонема Уровни 1 Целевая артикуляция (целевая конфигурация речевого тракта) планирования артикуляции 2 Целевые состояния акустически важных отделов речевого тракта (параметры губного, язычного, носового, голосового проходов) 3 Артикуляционные движения Двигательно-временные программы артикуляции Большинство артикуляторов, участвующих в формиро­
вании речевого тракта, не связаны анатомически, поэтому важной функцией управляющего компонента является объ­
единение артикуляторов в координационные структуры, а также временная координация их двигательной активности. В механизме речепроизводства нет какого-то отдельно­
го этапа или специального механизма, который отвечал бы за временную координацию движений при произнесении отдельных звуков или их цепочек. Наблюдаемая артикуля­
ционная картина является результатом объединенного дей­
ствия нескольких механизмов. Двигательные команды и программы, которые генерируются этими механизмами, имеют внутреннюю динамику: они не только активизируют артикуляционные структуры, но одновременно определяют их поведение во времени. Такая стратегия управления назы­
вается внутренним таймированием (англ.
intrinsic timing) двигательной активности. Рассмотрим, что представляют со­
бой двигательно-временные программы произнесения на разных этапах планирования артикуляционного процесса. На начальном этапе моторные программы должны обеспечить два вида временных внутри арти­
куляционных жестов и между ними. В первом случае необ­
ходимо учитывать, что целевая артикуляция звука представ­
ляет собой сложный комплекс, в котором акустически важ­
ные участки речевого тракта имеют свои целевые состояния. 86 2.5. Элементы динамической модели речепроизводства Для образования нужного звука должно быть установлено правильное соотношение между моментами их достижения. Например, для производства согласного /б/ не­
обходимо, чтобы носовой проход был закрыт синхронно с губным или даже раньше. В противном случае в начале сог­
ласного появится носовой призвук и согласный будет зву­
чать как последовательность [мб]. Начальный момент губ­
ной смычки должен быть скоординирован и с образованием голосовой щели, обеспечивающей звонкость согласного. Та­
ким образом, в двигательной программе звука должны быть определены не только целевые состояния тракта на его от­
дельных участках, но одновременно и последовательность их достижения во времени. Управляющая команда в такой про­
грамме задает начальный момент построения заданного су­
жения, длительность этого процесса, а также степень уси­
лий, которые при этом нужно затратить. Указанные параме­
тры не зависят от звукового контекста, они определяются физическими характеристиками планируемых сужений, а также, возможно, механическими свойствами артикулято-
ров, которые участвуют в их создании. Предполагается, что целевая артикуляция хранится в памяти говорящего вместе со своей программой. Наиболее от­
четливо эта программа выявляется при изолированном про­
изнесении звука. Когда планируется произнесение последовательности звуков, двигательно-временные планы соседних целевых ар­
тикуляций могут частично накладываться друг на друга. Иначе говоря, в исходных временных программах заплани­
рована возможность начала одной целевой артикуляции на интервале активности предыдущей. Частичное пересечение исходных временных планов приводит к тому, что в наблю­
даемой артикуляционной картине появляются интервалы одновременной артикуляции соседних звуков, т. е. возника­
ет собственно коартикуляция (англ.
coproduction). Создание исходного артикуляционного плана на осно­
ве временных программ целевых артикуляций — это только начало произносительной деятельности. На следующем эта­
пе исходные планы для звуковых цепочек преобразуются во временные траектории, которые определяют, как должно меняться во времени состояние каждого из главных сужений тракта для того, чтобы целевое состояние сужения было до­
стигнуто. При этом учитывается как текущее состояние дан-
87 Глава 2. Артикуляционные механизмы речи ного участка тракта, так и допустимые значения самого це­
левого состояния. Например, для образования губной смыч­
ки надо построить целевую траекторию, задающую измене­
ние величины ротового отверстия с учетом его состояния на предшествующем звуке. Предполагается, что при планиро­
вании траекторий важную роль играет принцип экономии произносительных усилий. На последнем этапе планирования задача двигательно-
управления состоит в том, чтобы на основе це­
левых траекторий рассчитать траектории артикуляционных движений для тех речевых органов, которые совместно кон­
тролируют параметры сужений. Артикуляционные траекто­
рии задают параметры движений, которые затем (в исполня­
ющем компоненте модели) реально выполняются мышечны­
ми структурами. Таким образом, планирование двигательно-
стороны артикуляции проходит три этапа: исход­
ный временной план, целевые траектории достижения нуж­
ного состояния речевого тракта, артикуляционные траекто­
рии движений. Рассмотрим на конкретном примере, как выглядят дви-
гательно-временные программы на разных уровнях плани­
рования артикуляции (пример заимствован из работы 1995] и несколько упрощен). На рис. изображе­
ны двигательно-временные планы произнесения двух звуко­
вых цепочек: и В верхнем ряду рисунка показаны в виде прямоугольников исходные моторные команды (им­
пульсы активации), которые необходимы для создания нуж­
ного места язычного сужения (МЯС) для каждого из глас­
ных (контролируется сдвиг сужения относительно нейтраль­
ного положения языка). Здесь же в виде кривой дается тра­
ектория изменения этого параметра, в результате которого должно достигаться его целевое значение. Второй ряд отно­
сится к параметру "величина губного прохода" (ГП). Он со­
держит изображение исходных моторных команд для созда­
ния губной смычки согласных, а также траектории, задаю­
щие изменение параметра ГП, нужные при достижения це­
левого состояния. Остальные ряды соответственно показы­
вают, как должны регулироваться во времени вертикальные движения верхней губы (ВГ), нижней губы (НГ) и нижней челюсти (НЧ) при заданных целевых траекториях. Отметим наиболее важные особенности временного планирования. Исходные моторные команды во временных 88 2.5. динамической модели речепроизводства Рис. 2.29. Двигательно-временные про­
граммы артикуляции. А — моторные ко­
манды, траектории целевых артикуля­
ционных параметров и движений для последовательности В — то же для последовательности планах звуковых цепочек пересекаются: сближение губ на­
чинается одновременно с достижением целевых положений языка у предшествующих гласных. Команда, запускающая построение губной смычки, одна и та же в обоих случаях, но целевая траектория ГП зависит от предшествующего гласно­
го. Хотя параметр ГП у гласных не контролируется (нет осо­
бой команды), раствор рта при их произнесении разный. Из-за взаимодействия языка и челюсти при образовании язычного сужения гласный имеет меньший раствор, чем Это учитывается при планировании целевой траектории ГП для достижения губной смычки. Артикуляционные трае­
ктории ВГ и НГ для обеих звуковых цепочек похожи, но планируемые движения, направленные на образование смычки, различаются. После гласного [ж], который обычно произносится с широким ротовым раствором, вертикальные движения губ в сторону сближения происходят с большей скоростью и более интенсивным размахом. Артикуляцион­
ная траектория НЧ отражает два обстоятельства: значитель­
ную инерционность нижней челюсти, а также то, что ее вер­
тикальные движения зависят одновременно от места языч­
ного сужения и величины ротового отверстия. Это происхо­
дит потому, что челюсть взаимодействует с языком при про-
89 Глава 2. механизмы речи изнесении гласных и с губами — при произнесении соглас­
ного. Рассмотренный пример показывает, как могут быть объяснены коартикуляционные явления, наблюдаемые в ре­
альной артикуляции. Собственно коартикуляция возникает как результат контролируемого наложения исходных времен­
ных планов для последовательных целевых артикуляций. Это позволяет увеличивать скорость артикуляции без ущерба для восприятия (в нашем примере начало смычки согласовано с достижением целевого состояния язычного сужения у пред­
шествующего гласного). Звуковая аккомодация обусловлена тем, что построение целевых и артикуляционных траекторий подчиняется принципу экономии произносительных усилий (ср. различные усилия подвижных губ и малоподвижной нижней челюсти при реализации губной смычки в зависимо­
сти от положения челюсти на предшествующем гласном). Превращение исходных контекстно-независимых моторных команд в наблюдаемые контекстно-зависимые движения происходит потому, что команды выполняются целевыми ко­
ординационными структурами, а движения — отдельными артикуляторами, которые могут входить в разные структуры. Одна и та же целевая траектория может задавать движение нескольких артикуляторов (ср. зависимость движений губ и челюсти от ГП), а движения одного и того же артикулятора могут определяться несколькими целевыми траекториями (ср. зависимость движения челюсти от МЯС и ГП). Роль обратных связей в управлении артикуляцией •Артикуляционные механизмы формируются в процессе обучения языку на основе использования различной обрат­
ной информации, которая сопровождает артикуляцию. Та­
кая информация включает не только слуховые ощущения от собственной речи, но также сведения о текущем состоянии речевого тракта, которые поступают через тактильные, мо­
торные и барорецепторные сенсорные клетки, встроенные в речевые органы. При артикуляции человек не только управ­
ляет движениями речевых органов и слышит производимые звуки, но одновременно "чувствует" происходящее в рече­
вом тракте. Ведущую роль в развитии артикуляционных навыков играет взаимодействие слуховых и проприоцептивных сен-
90 2.5. Элементы динамической модели речепроизводства сорных ощущений. Механизм артикуляции может сформи­
роваться только тогда, когда говорящий имеет возможность соотносить слуховой результат с информацией о состоянии речевого тракта, который этот результат порождает. Об этом свидетельствуют огромные, а подчас и непреодолимые труд­
ности в развитии навыков устной речи у детей с дефектами слуха. Вклад различных видов обратной связи в формирова­
ние управляющих механизмов артикуляции меняется в зави­
симости от степени развития последних. Как показывают исследования детской речи
[Webster, в начальной стадии овладения языком наибо­
лее существенной является слуховая обратная связь, а в ко­
нечной ­ проприоцептивная. Наблюдения над компенсатор­
ной артикуляцией в речи взрослых также говорят о том, что проприоцептивная обратная связь играет главную роль в адаптации управляющих команд к текущему состоянию ре­
чевого тракта, поскольку сенсорная информация от сокра­
щения мышц поступает в нервную систему с минимальной задержкой во времени. Как может использоваться такая ин­
формация для управления артикуляцией? Одно из возмож­
ных объяснений состоит в следующем. Предполагается, что при обучении языку в управляю­
щем механизме формируется особый блок, способный про­
гнозировать сенсорные ощущения, которые должны возник­
нуть при реализации произносительной программы (англ. forward model).
Это как бы внутреннее проговаривание того, что нужно реально произнести. Траектории движений, по­
рождаемые на последнем этапе артикуляционного планиро­
вания, поступают не только в мышечный аппарат речевого тракта, но и в прогнозирующий блок. ощущения, которые появляются при реализации заданного движения, попадают по каналам обратной связи в прогнози­
рующий блок, где реальные ощущения сравниваются с ожи­
даемыми. При обнаружении значительных расхождений ин­
формация об этом передается в механизм планирования, ко­
торый формирует новые двигательно­временные програм­
мы, позволяющие получать нужный акустико­слуховой ре­
зультат. В зависимости от характера расхождений могут быть перестроены общая конфигурация речевого тракта, целевые состояния его главных участков или же изменены только па­
раметры артикуляционных движений, если целевые состоя­
ния тракта не требуют перестройки. 91 Глава 2. Артикуляционные механизмы речи Никто из исследователей не сомневается в том, что ме­
ханизм артикуляционного контроля, подобный описанному выше, используется при усвоении языка, а также в особых ситуациях, моделируемых, например, экспериментами по изучению компенсаторной артикуляции. Однако в вопросе о том, нужна ли обратная информация в обычных условиях звуковой коммуникации у взрослых, мнения расходятся. Многие ученые считают, что планирование артикуляции мо­
жет осуществляться и без опоры на обратную сенсорную ин­
формацию. В этом нет необходимости, потому что прогно­
зирующий блок может функционировать как внутренняя модель речевого тракта. Эта модель в ответ на двигательные задания ведет себя так же, как и реальный речевой тракт, т. е. порождает те же сенсорные ощущения, которые возни­
кают при "настоящем" осуществлении движений. Оказыва­
ется, что человек может "слышать" и чувствовать звуки соб­
ственной речи, заменяя реальную артикуляцию внутренним проговариванием. При планировании контекстно зависимых движений сведения об ожидаемом состоянии речевого трак­
та в любой момент времени могут браться из его внутренней модели. 2.5.2. Исполняющий компонент модели речепроизводства Задача исполняющего компонента модели заключается в том, чтобы показать, как запланированные артикуляцион­
ные траектории преобразуются в сокращения мышц и дви­
жения артикуляторов. Для построения такой модели надо располагать достаточными сведениями о мышечном обеспе­
чении речевых органов и их двигательных (биомеханиче­
ских) возможностях. Биомеханические характеристики рече­
вого аппарата важны и для понимания механизмов планиро­
вания: без них трудно оценить, какие параметры наблюдае­
мых движений планируются, а какие возникают автоматиче­
ски как следствие двигательных ограничений. К настоящему времени эта сторона артикуляции изучена недостаточно. Специалисты считают, что упрощенные представления об исполняющей части артикуляционного процесса являются наиболее слабым местом современных моделей речепроиз­
водства. 92 2.5. Элементы динамической модели речепроизводства 2.5.3. Артикуляция как частный случай двигательной активности Модели речепроизводства находятся на начальном эта­
пе развития — не устоялись даже исходные теоретические представления. Однако сейчас исследователи уже перешли от построения чисто теоретических схем к созданию дейст­
вующих компьютерных моделей, в которых имитируется ра­
бота планирующих и исполняющих механизмов речи, вклю­
чая движения артикуляторов. Наиболее успешной признает­
ся модель, которую разрабатывают сотрудники Хаскинских лабораторий в США
Goldstein
1992;
Fowler, 1993]. В большинстве имеющихся моделей принимается, что механизмы артикуляции работают по тем же законам, кото­
рые лежат в основе любой двигательной активности. Эти за­
коны регулируются отношением — средства — условия действия — результат" и проявляются, например, в движе­
ниях рук, когда надо достать что-то, ног, когда надо преодо­
леть какое-то препятствие, и т. д. Двигательная активность переходит в автоматизированные навыки, если она воспроиз­
водится неоднократно в однотипных условиях. Профессио­
нальные танцор, музыкант, художник (в отличие от начина­
ющих) не обдумывают каждый раз, какие движения необхо­
димо осуществить для получения нужного результата. То же и с речевыми движениями: носитель языка, постоянно поль­
зующийся устной речью, становится в применении возможностей речевых органов и не замечает, как сложны процессы, лежащие в основе артикуляции. Это значительно облегчает устную коммуникацию людей и в то же время усложняет исследовательскую деятельность фоне­
тистов и физиологов. Изучая речепроизводство, ученые име­
ют дело с неосознаваемыми, высоко автоматизированными и координированными движениями, центральные уровни уп­
равления которыми недоступны для прямого наблюдения. 2.6. Методы исследования артикуляции В артикуляционной фонетике издавна применяются различные инструментальные средства для исследования ра­
боты органов речи при произнесении тех или иных речевых 93 Глава 2. Артикуляционные механизмы речи отрезков. Инструментальные средства и основанные на них методы исследования тесно связаны с возможностями тех­
нических способов слежения и фиксации артикуляционных движений. В годы большинство таких средств позволяло, как правило, фиксировать только статическую картину со­
стояния какого-то артикулятора (губ, контакта языка с нё­
бом) при производстве отдельного звука. Некоторые данные об артикуляции можно получить с помощью обычной фото­
графии. Этот метод активно использовался, например, для изучения движений губ при одновременной фиксации аку­
стической картины произнесения. Однако фотографирова­
ние состояния артикуляторов внутри ротовой полости требу­
ет введения в речевой тракт сверхминиатюрных фотоаппара­
тов. Это вызывает физический дискомфорт говорящего и сильно нарушает естественность артикуляции. Такие же не­
достатки присущи и кинематографическому методу, кото­
рый в определенной мере позволяет отслеживать динамиче­
скую картину артикуляции. Большое значение для артикуляционной фонетики имела разработка метода палатографии — различных средств для получения отпечатков, фиксирующих области касания языка с твердым нёбом. Комплексное изображение артикуляционной картины звука, хотя и статической, можно получить с помощью рент­
геновских снимков. Однако ввиду опасности для здоровья говорящего количество данных, получаемых с использовани­
ем этого метода, всегда ограниченно. Кроме того, для рент­
генографической съемки требуется фиксировать голову гово­
рящего в одном и том же положении, что, конечно, влияет на естественность речи. Статические рентгеновские снимки могут быть дополнены высокоскоростной кинорентгеногра­
фией, позволяющей наблюдать динамику артикуляции и из­
менение параметров речевого тракта во времени. Динамиче­
ские методы рентгенографии имеют те же принципиальные недостатки, что и статические: они опасны для говорящего и нарушают естественность артикуляции. Поэтому методы, ос­
нованные на применении рентгеновских лучей, не получили широкого распространения, хотя и позволили собрать много полезных сведений об органической фазе артикуляции. Дальнейшее развитие инструментальных артикуляци­
онных исследований связано с разработкой технических 94 2.6. Методы исследования артикуляции средств, которые дают возможность получать комплексную динамическую картину артикуляции и являются безопасны­
ми для здоровья человека. В годы на смену преж­
ним средствам инструментального анализа пришли электро­
технические устройства регистрации артикуляции. В начале 60-х годов в России в Институте физиологии имени И.П. Павлова была создана уникальная аппаратура, с помо­
щью которой можно регистрировать все основные артикуля­
ционные параметры вместе с акустической картиной [Чистович и др. 1965]. Современные методы исследования артикуляции соче­
тают возможности электротехнической регистрации артику­
ляционных показателей с использованием компьютерной техники. Широко используются различные датчики — кро­
шечные электроды, которые позволяют фиксировать и запи­
сывать в память компьютера информацию о движениях ре­
чевых органов. Электропалатографическая техника дает воз­
можность получать детальную динамическую картину конта­
ктов языка с нёбом. Для этого используется тонкая гибкая пластинка ("искусственное нёбо") с большим количеством электронных датчиков, которая закрепляется на нёбе гово­
рящего. Движения отдельных частей языка и изменения в его форме могут быть зафиксированы с помощью видеоза­
писей, получаемых на основе современной ультразвуковой технологии. Оптико-волоконная эндоскопия, осуществляе­
мая с помощью крошечного светочувствительного устройст­
ва, вводимого через носовую полость в область горла, позво­
ляет наблюдать и фиксировать поведение голосовых связок. Эта же техника применяется для регистрации движений нёб­
ной занавески. Вместо рентгеновских лучей для получения комплексной картины артикуляции используются электро­
магнитное излучение и компьютерная томография. С помо­
щью этих методов можно получить трехмерное изображение речевого тракта и данные об изменении его параметров. Для регистрации воздушных потоков на выходе из ротовой и но­
совой полостей используются специальные маски, надевае­
мые на лицо говорящего. Участие дыхательной системы в речепроизводстве регистрируется устройствами, которые от-
В главе 1 (рис. на примере слова цапля приводились артикуляционные и акустические данные, которые можно получить с помощью этой аппара­
туры. 95 Глава 2. Артикуляционные механизмы речи Рис. 2.30. Современная комплексная установка для регистрации артикуляци­
онных параметров речи дыхательные движения на разных уровнях груд­
ной клетки. На рис. 2.30 представлена современная комплексная установка регистрации артикуляционных параметров речи — так называемый В артикуляционной фонетике применяются также электромиографические методы, позволяющие получать ин­
формацию о нейромышечной фазе артикуляции. Эти мето­
ды основаны на использовании электрических датчиков, ко­
торые фиксируют электрические разряды, возникающие в мышцах при их На рисунке изображена установка
Германии фирмой
"Carstens Medizinelektronik"
(Гёттинген). 96 2.6. Методы исследования артикуляции Развитие компьютерных технологий позволило усовер­
шенствовать не только методы наблюдения над нейромы-
шечной и органической фазами артикуляции. Для построе­
ния и верификации действующих моделей речепроизводст­
ва, пытающихся объяснить планирование артикуляционных движений и их исполнение, все чаще используется компью­
терное артикуляционное моделирование. Несмотря на то что ныне технические средства артику­
ляционных исследований значительно усовершенствовались (и, как правило, основанные на них методы обладают существенным недостатком: в той или иной степе­
ни они вмешиваются в естественную артикуляцию и созда­
ют определенный дискомфорт для говорящего. Поэтому большое внимание уделяется исследованию связи между ар­
тикуляцией и акустикой речи с тем, чтобы можно было ис­
пользовать акустические данные для артикуляционных ин­
терпретаций. Литература к главе 2 Аванесов Русское произношение. 1972. Ъондарко Вербицкая и др. Фонетика спонтанной речи. 1988. Ъондарко Вербицкая Гордина и др. Стили произношения и типы произнесения Вопр. языкознания. 1973. № 37-49. Винарская Пулатов
Дизартрия и ее топико-диагностическое значение в клинике очаговых поражений мозга. Ташкент, 1989. Л.Р. Общая фонетика. 1979. Кодзасов C.B. Фонетический эллипсис в русской разговорной речи Те­
оретические и экспериментальные исследования в области структур­
ной и прикладной лингвистики. 1973. Кодзасов C.B., Кривнова О.Ф. Фонетические возможности гортани и их использование в русской речи Проблемы теоретической и экспери­
ментальной лингвистики. 1977. ЛЭС 1990: Лингвистический энциклопедический словарь. 1990. Мартине А. Принцип экономии в фонетических изменениях. 1960. Матусевич М.И. Современный русский язык. Фонетика. 1976. РРР 1973: Русская разговорная речь Под ред. Е.А. Земской. 1973. Фант Г. Акустическая теория речеобразования. 1964. Чистович Кожевников Алякринский и др. Речь. Артику­
ляция и восприятие. 1965. Чистович Л.А., Венцов А.В, М.П. и др. Физиология речи. Вос­
приятие речи человеком. 1976. 97 Глава 2. Артикуляционные механизмы речи Щерба В. О разных стилях произношения и об идеальном фонетиче­
ском составе слов Языковая система и речевая деятельность. 1974. Cowan
of Upper Lip Protrusion in French Phonetica.
1974, 30.
P.
41-55. Brosnehan L.F. The Sounds of Language. Cambridge,
Goldstein L. Phonology: An Overview
Phonetica.
1992, 49.
P.
155-180. Catford Fundamental problems in phonetics. Ontario,
1977. Yallop An Introduction to Phonetics and Phonology. Oxford,
1990. Feth L. The Physiology of Speech and Hearing. An Introduction.
N.
1980. Fowler C.A., M. T. Immediate Compensation in bite-block Speech
Phonetica.
1980, 73.
P.
306-326. Fowler E. Coordination and Coarticulation in Speech Production
Language and Speech.
1993, 36.
P.
171-195. Guenther F. H. A Modelling Framework for Speech Motor Development and Kinematic Articulation Control
Proceedings of the XIII Intern. Congress of Phonetic Sciences. Stockholm,
1995. Hardcastle Morgan-Barry Clark
An Instrumental Phonetic Study of Lingual Activity in Children
Journal of Speech and Hearing Research.
1987, 30.
P.
171-184. Kelso Saltzman Tuller B. The Dynamic Perspective on Speech Production Data and Theory
Journal of Phonetics.
1986, 14.
P.
29-59. J. Principles of Phonetics. Cambridge,
1994. E.H. Biological Foundations of Language.
N.
1967. W. J. M. Speaking. From Intention to Articulation. Cambridge,
1989. Ph. On the Origin of Language.
N.
1975. B. Economy of Speech Gestures
The Production of Speech.
N.
1983. B. Explaining Phonetic Variation: a Sketch of the H&H theory
Speech Production and Speech Modeling. Dordrecht,
1990. Lindblom B. Modelling Speaker-Listener Interaction
European Studies in Phonetics and Speech Communication. Haag,
1995. P., Lacerda. A de. and Berlin; Bonn,
1933. Perkell J.S. On Sources of Invariance and Variability in Speech Production
Invariance and Variability in Speech Processes.
N.
1986. J.S. Models, Theory and Data in Speech Production
Proceedings of the XII Intern. Congress of Phonetic Sciences. 1991. Webster R.L., M.F. Changes in Reliance on Auditory Feedback Cues as a Function of Oral Practice
Journal of Speech and Hearing Research. 1971, 14.
P.
307-311. Глава 3 АКУСТИКА РЕЧИ Акустическая фаза речевого процесса и задачи акустической фонетики Деятельность говорящего, связанная с построением речевого сообщения, завершается созданием звуковых ко­
лебаний, которые в фонетике называют речевым сигналом. Речевой сигнал относится к последней, акустической фазе речепроизводства. Он представляет собой незначительные колебания воздушного давления, которые возникают в ре­
зультате аэродинамических и акустических процессов, обу­
словленных артикуляцией. Речевой сигнал, исходящий от говорящего, распространяется по воздушной среде в виде звуковой волны, создавая в ней добавочные изменения да­
вления относительно среднего атмосферного уровня, кото­
рый является относительно постоянным. Добавочное дав­
ление, вызванное возникновением и распространением звука, называется звуковым, или акустическим, давлением. Звуковое давление, образуемое речевым сигналом, микро­
скопически мало. Например, давление, соответствующее речи средней громкости, составляет примерно одну милли­
онную долю (или 0,0001 от внешнего атмосферного да­
вления. "Путешествуя" по воздуху, речевой сигнал достигает слушающего и заставляет колебаться барабанную перепонку его слухового анализатора. Это является началом сложного процесса слухового анализа, благодаря которому слушаю­
щий воспринимает речевое сообщение. Физические свойства речевого сигнала изучаются в акустической фонетике. Здесь исследуются акустические ха­
рактеристики звуковых средств языка, а также связь между артикуляцией и ее аэродинамическими и акустическими следствиями. Таким образом, в изучении звуковой коммуни­
кации акустическая фонетика находится между фонетиче­
скими дисциплинами, которые исследуют артикуляцию и восприятие речи. Акустический раздел фонетики имеет осо­
бое значение для приложений, в которых разрабатываются технические средства анализа речевого сигнала, а также для речевых технологий. 99 Глава 3. Акустика речи Акустическая фонетика опирается на ряд базовых фи­
зических понятий, относящихся к учению о колебаниях. Об­
разование звуковых колебаний в речевом тракте говорящего, их распространение в окружающей воздушной среде и пер­
вичная обработка этих колебаний слуховой системой подчи­
няются законам физики. Поэтому надо иметь хотя бы общее представление об этих законах, знать, что такое колебание, каковы основные типы колебаний, какими физическими ха­
рактеристиками они описываются и т. д. Благодаря знанию общих законов, управляющих колебаниями, акустическая фонетика, сравнительно недавно оформившаяся в самосто­
ятельную научную дисциплину (в середине 40-х годов), представляет собой один из самых разработанных разделов фонетической науки. Центральной частью этой дисциплины является аку­
стическая теория речеобразования, которая изучает связь между органической фазой артикуляции и акустическим ре­
зультатом артикуляционных процессов. 3.2. Элементы акустической теории речеобразования Задача акустической теории речеобразования состоит в том, чтобы выявить и количественно описать аэродинамиче­
ские и акустические процессы, которые происходят в рече­
вом тракте при артикуляции. Понимание этих процессов со­
здает возможность обратных заключений: от акустики к ар­
тикуляционной картине, которые также очень важны. Зна­
ние акустики речеобразования необходимо и для правиль­
ной интерпретации физических данных, так как оно позво­
ляет отделить ожидаемые, прогнозируемые артикуляцией акустические свойства речевого сигнала от неожиданных, непрогнозируемых, а это, в свою очередь, заставляет ставить вопрос о причинах таких акустических неожиданностей. Ими могут быть какие-то неучтенные или даже неизвестные исследователям особенности артикуляции либо какие-то случайные факторы. Для фонетической науки важно, что акустическая теория речеобразования придает интерпрета­
ции физических речевых данных объяснительный, научный характер. Элементы акустической теории Основы акустической теории речи были заложены в XIX в. немецким физиком Г. Гельмгольцем. В XX в. наибольшую известность в этой области знания полу­
чили работы Г. Фанта [Фант 1964] и Дж. Фланагана [Флана-
ган Книга Фанта "Акустическая теория речеобразова­
ния" признана классическим трудом по акустике речи. Основные положения акустической теории речеобразования Движения речевых органов, наблюдаемые в органиче­
ской фазе речепроизводства, сами по себе не порождают ре­
чевого сигнала. Их роль состоит том, чтобы создать в ре­
чевом тракте аэродинамические условия, необходимые для образования звуковых колебаний. Эти условия подобны тем, что имеют место во многих язычковых и духовых музыкаль­
ных инструментах, таких, как кларнет или орган. Поэтому речевой тракт может рассматриваться как своеобразная и очень богатая по своим возможностям акустическая труба. Для того чтобы она требуются два условия. Во-
первых, нужно создать в ней поток воздуха, т. е. необходим механизм продувания воздуха через речевой тракт. Во-вто­
рых, нужно "раздробить" этот поток, превратить его в ко­
леблющуюся воздушную струю. Иначе говоря, на движу­
щийся поток должно быть наложено акустическое возмуще­
ние (или модуляция). Движущийся поток воздуха, который выступает в качестве внешнего источника акустической энергии, создается дыхательной системой — инициатором звуковых колебаний. Акустическое возмущение воздушного потока осуществляется голосовыми связками и преградами в надгортанной полости речевого тракта. Голосовые связки и артикуляторы, участвующие в образовании шумообразую-
щих преград, функционируют как источники звука. Колеблющийся поток воздуха, созданный источником, проходя по речевому тракту, подвергается дальнейшим пре­
образованиям. Они не связаны с порождением каких-либо акустических возмущений, а представляют собой изменение акустических характеристик того "сырого" звукового материала, который был создан источником. Эти изменения происходят благодаря резонансным (частотно-
избирательным, фильтрующим) свойствам воздуха, содержа­
щегося в речевом тракте. Как и любая масса воздуха, заклю-
101 Глава 3. Акустика речи ченного в ограниченный объем, воздушный столб тракта яв­
ляется колебательной системой и имеет собственные часто­
ты Когда колебания, образованные источником, проходят далее через речевой тракт, некоторые частотные составляющие в спектре источника усиливаются, в то время как другие либо остаются без изменения, либо существенно подавляются. Усиление получают те исходные составляю­
щие, частоты которых близки к собственным частотам воз­
душного столба в тракте. Таким образом, речевой тракт дей­
ствует как обычный акустический он как бы фильтрует спектр источника звука, перераспределяя энер­
гию его составляющих в соответствии с собственными час­
тотами. В результате образуются звуковые колебания с тем или иным специфическим тембром звучания. Огромное разнообразие звуков речи обусловлено тем, что речевые органы, участвующие в артикуляции, обеспечи­
вают изменение размеров и формы воздушных полостей тра­
кта, трансформируя тем самым его резонансные свойства. Учитывая чисто преобразовательный характер происходя­
щих при этом процессов, частотно-избирательные характе­
ристики речевого тракта называют также его передаточной, или фильтровой, функцией. Главное положение акустической теории речеобразова-
ния формулируется следующим образом. Речевой сигнал возникает в результате воздействия одного или нескольких источников звука на систему резонаторов, образуемых воз­
душными полостями речевого тракта. Если обозначить через S(f)
амплитудно-частотный спектр колебаний, создаваемых источником звука, через
T(f)
— передаточную функцию ре-
зонаторной системы речевого тракта, то амплитудно-частот­
ный спектр результирующих звуковых колебаний
P(f)
может быть представлен равенством S(f)
Как показывает приведенная формула, частотная фильтрация состоит в том, что амплитуда каждой из частот-
резонатором называется любая воздушная емкость, имеющая отверстие — бутылка, колба, труба и пр. В приведенной формуле буквы являются сокращениями следующих англий­
ских слов:
S
-
source
(источник), Т —
transfer
(передача), Р —
pressure
(дав­
ление),
f
—
frequency
(частота). 12. Элементы акустической теории ных составляющих источника звука умножается на значение передаточной функции тракта на той же Свойства источников звука и резонаторной системы тракта не являются неизменными. Произнесение отдельных звуков и тем более звуковых последовательностей представ­
ляет собой сложный динамический процесс, характеристики которого меняются во времени. Поэтому в приведенную вы­
ше формулу включается параметр времени P(f, t)
S(f, t)
T(f, t). Акустическую теорию речеобразования, в соответствии с содержанием ее главного принципа, называют также моде­
лью источник-фильтр (англ.
source-filter Основное положение акустической теории речеобразо­
вания можно пояснить на примере образования сложных колебаний, возникающих при производстве гласных. На рис. приводится схема процессов, происходящих в этом случае et 1980: Голосовой источник со­
здает периодические толчки воздуха (А). Амплитуды гармо­
ник спектра этих толчков (Б), проходя через резонаторную систему речевого тракта умножаются на значения пере­
даточной функции, которая имеет две выраженные резо­
нансные частоты (Г). В результате получается сложный пе­
риодический сигнал (Д) со спектром гармонической струк­
туры, задаваемой голосовым источником. В нем усилены спектральные составляющие, частоты которых наиболее близки к резонансным максимумам передаточной функции тракта (Е). Классическая теория речеобразования исходит из допу­
щения, что акустические свойства источников звука и резо­
наторной системы речевого тракта относительно независи­
мы. В последующих разделах главы мы рассмотрим источни­
ки звука, действующие в речи, и характеристики передаточ­
ной функции тракта. Далее на речевом материале будет по­
казано, как они взаимодействуют при образовании звуков главных фонетических классов. При более детальном рассмотрении в формулу включается еще один компо­
нент —
(от англ.
radiation).
Он учитывает особенности излучения звука на выходе из речевого тракта во внешнюю среду. При рассмотрении связей между артикуляцией и речевым сигналом особенности излучения могут быть опущены, однако нужно иметь в виду, что они влияют на окончатель­
ный спектр звуков. Элементы акустической 3.2.2. Источники звука в речи При производстве речевых звуков акустическая ляция воздушного потока может осуществляться тремя спо­
собами. Соответственно выделяются три типа источников звука: голосовой, турбулентный и импульсный. Голосовой источник звука В речи наиболее мощным источником звука являются голосовые связки. В качестве единственного источника они участвуют в образовании гласных и сонорных согласных. С акустической точки зрения колеблющиеся голосовые связки представляют собой тонко управляемый клапанный меха­
низм: они периодически закрывают и затем открывают про­
ход потоку воздуха через голосовую щель, превращая его в последовательность воздушных толчков (импульсов). Каж­
дый голосовой импульс, действуя на воздух, находящийся над связками, создает в речевом тракте звуковую волну, т. е. выступает по отношению к нему в качестве внешней, выну­
ждающей силы. Последовательность воздушных толчков, возникающих в результате колебания голосовых связок, на­
зывается волной, или просто голосом. Глотталь-
ную волну принято описывать как изменение объемной ско­
рости (англ.
volume velocity)
воздушного проходя­
щего через колеблющуюся голосовую щель. Механизм возникновения глоттальной волны был под­
робно рассмотрен в главе 2. Остановимся на изложении не­
которых фактов из акустики речи. Начнем с нейтральной фонации - наиболее удобного и естественного для человека способа голосообразования. Слуховое ощущение, которое возникает от звука, создаваемого голосовыми связками в этом случае, можно описать как гудение или гул. На рис. 3.2 показаны глоттальная волна и ее спектр при нейтральной фонации. Как видим, график глоттальной волны похож на пос­
ледовательность треугольников, регулярно повторяющихся во времени. Период Т равен длительности колебательного Объемная скорость потока, имеющая размерность определяется как объем воздуха, проходящий через фиксированное сечение канала трубки за единицу времени. Глава 3. Акустика речи цикла голосовых связок. Длительность колебательного цик­
ла зависит от массы и упругости (натяжения) голосовых свя­
зок и в некоторой степени от перепада давлений под и над связками. В пределах каждого глоттального периода ско­
рость воздушного потока постепенно нарастает (голосовая щель открывается), достигает максимума, затем убывает (го­
лосовая щель закрывается) и некоторое время остается рав­
ной нулю (голосовая щель При нейтральной фона­
ции и умеренной громкости речи длительность закрытого состояния голосовой щели составляет от длительно­
сти всего периода. Временное соотношение фаз колебатель­
ного цикла и скорость нарастания/убывания воздушного по­
тока в открытой фазе характеризуют форму голосового им­
пульса. Амплитуда глоттальной волны А определяется макси­
мальной скоростью воздушного потока, проходящего через голосовую щель. От этой величины зависит интенсивность 106 2. акустической чем больше скорость, сильнее удар, с которым голосовой импульс воздействует на воздушный столб, нахо­
дящийся выше голосовых связок. Амплитуда голосового им­
пульса пропорциональна степени голосового усилия (англ. vocal effort),
которое связано с давлением. Возрастание усилия приводит к увеличению давления и бо­
лее тесному смыканию голосовых связок. Это влияет не только на амплитуду голосового импульса, но и на его фор­
му. При значительном голосовом усилии фронты голосово­
го импульса, характеризующие скорость нарастания/убыва­
ния глоттального потока, становятся более крутыми, а дли­
тельность интервала, когда щель полностью закрыта, может составлять от длительности колебательного цикла. При этом длительность самого цикла, т. е. период глотталь-
ной волны, как правило, уменьшается. Голос является сложным периодическим звуком, кото­
рый может быть представлен в виде суммы простых синусо­
идальных колебаний - гармоник. Иначе говоря, голо­
сового источника состоит из набора простых составляющих, частоты которых относятся как целые числа. Первая гармо­
ника голосового спектра, называемая основным тоном, име­
ет частоту, обратную периоду глоттальной волны,
Частота основного тона
называется также основной часто­
той голоса. Она равна частоте колебаний голосовых связок. Частоты остальных гармоник, или обертонов, в целое число раз больше частоты основного тона. В частности, спектр на рис. 3.2 имеет основную частоту
равную 100 Гц, и обер­
тоны с частотами 200, 300, 400 Гц и т. д. В общем виде час­
тота гармоник голосового источника задается произведением где п - натуральное число, равное номеру гармоники в спектральном разложении глоттальной волны. От основной частоты
зависит плотность спектраль­
ных линий в спектре голоса: чем длительнее период голосо­
вых колебаний, тем меньше основная частота, тем чаще рас­
положены спектральные линии. Поэтому в спектре звуков, произнесенных низким мужским голосом, плотность линий больше, чем в спектре тех же звуков в речи женщин и детей. Спектральная плотность является важным параметром для спектрографического анализа вокальных речевых звуков. Форма голосового импульса находит непосредственное отражение в огибающей спектра голосового источника (англ. spectral
envelope),
т. е. кривой, соединяющей амплитуды по-
107 Глава 3. Акустика речи следовательных гармоник. Спектральная огибающая характе­
ризует относительный вклад гармоник в энергию го­
лосовых колебаний. На рис. 3.2 видно, что основной тон яв­
ляется самой интенсивной гармоникой голоса, а амплитуды обертонов быстро убывают. Такое соотношение характерно не только для нейтральной фонации, но и для других типов голосовых колебаний, однако скорость убывания амплитуды гармоник может быть разной. Для учета этих различий вво­
дится понятие наклона спектральной огибающей (англ.
spec­
tral tilt),
который показывает, с какой скоростью уменьшает­
ся амплитуда гармоник при увеличении частоты. При нейт­
ральной фонации со средним голосовым усилием огибающая спадает со скоростью, равной приблизительно — 12 дБ на ок­
таву. Это означает, что при увеличении частоты в два раза амплитуда гармоник уменьшается в четыре раза. Таким обра­
зом, энергия низкочастотной части голосового спектра зна­
чительно превосходит энергию высокочастотной области. Скорость спадания спектральной огибающей отражает разные особенности голосового поведения говорящих: от степени голосового усилия и громкости речи до различий в типе фонации, которые могут быть обусловлены индивиду­
альным тембром голоса, эмоционально-психологическим состоянием говорящего в момент речи или имеющимися в языке фонационными противопоставлениями. На рис. 3.3 [Clark, Yallop
1990: приведены глоттальные волны и их спектры для двух типов голосообра-
зования, отличных от нейтральной фонации. Пример а -
слабый, тусклый, ненапряженный голос, близкий к приды­
хательной фонации; пример б — сильный, яркий, напряжен­
ный голос. Приведенные примеры показывают: чем больше относительная длительность закрытой фазы колебательного цикла и чем круче фронты голосового тем богаче спектр голоса, сильнее его звучание и ярче тембр. До сих пор мы говорили о голосе как о периодическом звуке. На самом деле голосовые колебания не являются строго периодичными. Во-первых, в речи наблюдаются слу­
чайная вариативность как периода последовательных голо­
совых импульсов (так называемый от англ. jitter
"дрожание"), так и амплитуды от англ.
"мерцание"). Во-вторых, происходят системати­
ческие, хотя и довольно медленные изменения, обусловлен­
ные лингвистическими факторами, например, интонацией, 108 Элементы акустической теории Рис. 3.3. Характеристики голосового источника для голосов разного тембра ударением, или же экстралингвистическими причинами, на­
пример, эмоциональным или физиологическим состоянием говорящего. Все рассмотренные выше акустические параметры го­
лоса существенны для восприятия. Они участвуют переда­
че различной информации, важной для речевого общения. Наиболее разнообразную нагрузку имеет основная частота глоттальной волны, которая определяет воспринимаемую высоту голоса: чем больше тем выше голос, и наоборот. В потоке речи у одного и того же говорящего основная час­
тота может значительно меняться, отражая такие важные ха­
рактеристики речевого сообщения, как интонация, наличие логических ударений и даже просто состав слов (в тональ­
ных Диапазон возможных изменений достаточно велик. Для взрослого человека он составляет около полуто­
ра — двух В то же время для каждого отдельного че-
Октава — это отношение частот, равное двум. 109 Глава 3. Акустика речи ловека существует наиболее удобный и привычный режим работы голосовых связок. Основная частота, соответствую­
щая этому режиму, называется базовой или нейтральной (англ.
modal Базовая частота говорящего расположена в области, приблизительно соответствующей одной третьей чет­
вертой) части его голосового диапазона, считая от границы. Голоса разных людей существенно отличаются ба­
зовыми частотами. Ведущую роль в этих различиях играют половые и возрастные признаки говорящих. Это легко объ­
яснить, если вспомнить, что основная частота голоса зави­
сит от таких параметров голосовых связок, как степень уп­
ругости, длина и масса. Несмотря на большую индивидуаль­
ную вариативность базовых частот и границ голосового ди­
апазона, можно выделить их типовые значения с учетом по­
ла и возраста говорящего. Так, для мужских голосов средняя базовая частота равна приблизительно 130 Гц, для жен­
ских — 260 Гц. Для диапазона мужского голоса типичен ин­
тервал 80-200 Гц, для женского - Гц, для детских голосов (в сильной зависимости от возраста) - Гц. Получение акустических данных (особенно спектраль­
ных) о работе голосового источника в речи сопряжено с большими трудностями, поскольку в результирующем рече­
вом сигнале спектр голосовых колебаний всегда модифици­
рован резонансной системой речевого тракта. Чтобы выде­
лить характеристики голосового источника, надо "вычесть" из речевого сигнала вклад передаточной функции. Для это­
го используются специальные методы обработки сигнала (так называемая обратная фильтрация). Турбулентный источник звука Турбулентный шум возникает в том случае, когда в воздушном потоке, проходящем по речевому тракту, появля­
ется турбулентность, обусловленная вихрями. Вихри пред­
ставляют собой такие участки потока, в которых частицы воздуха, двигаясь в среднем по направлению течения, совер­
шают сложные и беспорядочные перемещения, в том числе и круговые. В нетурбулентном, или ламинарном (от лат. lamina
"слой"), потоке движение частиц упорядочено: каж­
дая частица движется по своей траектории, не пересекаю­
щейся с путями следования других частиц. В речи такой тип 3.2. Элементы акустической потока имеет место при произнесении гласных и сонорных согласных. Для возникновения турбулентного потока необходимы два условия. Во-первых, на пути потока, идущего по тракту, должно быть образовано значительное сужение (щель). Во-
вторых, позади сужения должно быть создано избыточное давление, достаточное для того, чтобы поток двигался через сужение со скоростью, которая необходима для образования турбулентности. Указанные условия выполняются при произнесении фрикативных согласных, причем артикуляция глухих фрика­
тивных (типа русских наиболее благоприят­
на для формирования турбулентного шума. При их производ­
стве голосовая щель широко открыта, связки не колеблются и перепад давления в области сужения определяется подсвя-
зочным давлением. Звонкие фрикативные (типа русских произносятся с периодически закрывающейся голо­
совой щелью, поэтому при прочих равных условиях для них характерны меньшие значения избыточного давления позади сужения и меньшая скорость потока, чем для соответствую­
щих глухих. Некоторые фонетисты 1983] считают, что эти различия являются основной причиной большей распро­
страненности глухих фрикативных в языках мира. Турбулент­
ный шум в области артикуляционного сужения может возни­
кать также при произнесении сонорных ротовых согласных в случае их полного или частичного оглушения. Механизм возникновения турбулентности можно опи­
сать следующим образом. Сжатый воздух, проходя через су­
жение, приобретает большую скорость. При некотором кри­
тическом значении скорости, которое зависит от размеров сужения, поток превращается в струю. На выходе из сужения струя сталкивается с инертной воз­
душной массой и разбивается на фрагменты, содержащие вихри. Когда вихри смешиваются с остальной массой возду­
ха, возникают быстрые и нерегулярные колебания давления, которые воспринимаются как шум. Описанная картина ти­
пична для произнесения всех фрикативных согласных. Од­
нако, как показали недавние исследования ме­
ханизм турбулентности, обусловленный только столкнове­
нием воздушных масс в речевом тракте, порождает доволь­
но слабый шум (его амплитуда обратно пропорциональна размерам сужения). 111 Глава 3. Акустика речи Более выражена турбулентность в том случае, когда воз­
душная струя встречает на своем пути какое-то твердое пре­
пятствие. Можно выделить два способа турбу­
лентного шума в зависимости от ориента­
ции препятствия относительно движения воздушной струи. При артикуляции свистящих и шипящих (или сибилянтных от англ.
sibilant)
согласных типа русских [с] и [ш] воздушная струя, выходящая из сужения, направлена почти под прямым углом на дополнительные препятствия, создаваемые верхними и/или нижними зубами. Удар струи об эти препятствия поро­
ждает интенсивный (максимальный для фрикативных соглас­
ных) шум с очень нерегулярным изменением звукового давле­
ния. При произнесении остальных фрикативных (прежде все­
го, палатальных, велярных и фарингальных) в качестве допол­
нительного твердого препятствия, порождающего турбулент­
ность, выступает внутренняя поверхность (стенки) расширяю­
щейся части тракта впереди сужения. В этом случае препятст­
вие расположено под небольшим углом к направлению дви­
жения воздушной струи, выходящей из сужения. Турбулент­
ность, возникающая вдоль стенок речевого тракта, создает бо­
лее слабый шум по сравнению с ситуацией, когда шум обра­
зуется в результате прямого удара струи о препятствие. В фонетике турбулентный шум, который создается вы­
ше гортани, называют фрикативным (от лат.
"тре­
ние"). Турбулентный источник может возникать также в гортанной полости при прохождении воздушного потока че­
рез открытую и несколько суженную голосовую щель, как при произнесении английского согласного Шум такого происхождения имеет небольшую амплитуду. Он усиливает­
ся при столкновении воздушного потока, выходящего из го­
лосовой щели, с ложными голосовыми связками и надгор­
танником. Шум, порождаемый турбулентным потоком в гортанной полости, называется аспиративным (от лат.
aspi-
ratio
"дыхание"). Из сказанного видно, что общая картина явлений, на­
блюдаемых при образовании турбулентного шума, довольно сложна. При одинаковом уровне громкости речи и место источника(ов) шума зависят от размеров сужения, а также наличия и пространственной ориентации препятствий на пути воздушной струи, выходящей из сужения. В конеч­
ном счете этими факторами определяется разница в интен­
сивности шума у фрикативных согласных разного места об-
112 3.2. акустической речеобразования Рис. 3.4. Турбулентный шумовой источ­
ник в речи разования. Различия в работе голосовых связок при произ­
несении глухих и звонких фрикативных также влияют на ам­
плитуду турбулентного источника: глухие согласные характе­
ризуются более интенсивным шумом, чем соответствующие звонкие. Спектр турбулентного шума сплошной: в нем невоз­
можно выделить какие-то отдельные гармоники. Сведения о спектре собственно турбулентного источника получить тру­
дно, так как акустические свойства реально произносимых фрикативных звуков зависят также от передаточной функ­
ции речевого тракта. Предполагается, что спектр турбулент­
ного источника в основном однотипен и характеризуется плоской огибающей в частотном интервале 500-3 ООО Гц, ко­
торая спадает в направлении низких и высоких частот со скоростью -6 дБ на октаву (или обратно пропорционально квадрату частоты)
[Stevens Характеристики турбулентного источника иллюстриру­
ются рис. 3.4 (по [Чистович и др. 1976: 113 Глава 3. Акустика речи Импульсный источник звука Звуковой импульс, или взрыв, представляет собой скачкообразное изменение давления воздуха. Для образова­
ния звукового импульса необходимо создать в речевом тра­
кте значительное избыточное давление, полностью перекрыв выход воздуха на достаточно длительный интервал времени (не менее 30 мс). Поэтому импульсному звуку всегда пред­
шествует интервал полной смычки каких-то артикуляторов; проход в носовую полость также должен быть закрыт. При быстром размыкании смычки воздушный поток на выходе из нее резко возрастает, что и приводит к скачкообразному изменению давления. Описанные явления имеют место при произнесении глухих взрывных согласных типа русских [п], Одна­
ко фаза рекурсии взрывного согласного редко реализуется только взрывом: за ним может следовать турбулентный шум фрикативного и/или аспиративного Амплитуда импульсного звука зависит от давления воз­
духа позади смычки. При средней громкости речи более ин­
тенсивными будут взрывы тех согласных, место образования которых находится ближе к гортани. При произнесении та­
ких согласных воздух за смычкой накапливается быстрее и приобретает большее давление, чем при артикуляции соглас­
ных с местом образования, более далеким от гортани. Раз­
личия в избыточном давлении сказываются также на ампли­
туде взрыва у согласных, отличающихся работой голосовых связок: взрывы глухих согласных более интенсивны, чем со­
ответствующих звонких. Интенсивность взрыва одного и то­
го же согласного зависит от силы выдоха (величины подсвя-
давления). Импульсный звук характеризуется сплошным спект­
ром, имеющим плоскую огибающую, близкую к спектру бе­
лого шума. Механизм образования импульсного звука и его харак­
теристики показаны на рис. 3.5 (по [Чистович и др. Акустическая картина шумового участка взрывных согласных будет более подробно рассмотрена в параграфе 3.4.4. 114 3.2. акустической теории Рис. 3.5. Импульсный источник в речи Комбинаторика источников звука в речи Описывая выше источники звука в речи, мы учитыва­
ли прежде всего те классы звуков, для которых типично ис­
пользование того или иного источника в качестве единст­
венной акустической основы колебаний. Упоминались так­
же и такие звуки, в образовании которых участвуют несколь­
ко источников одновременно или же последовательно, т. е. друг за другом. Возможную комбинаторику звуковых источ­
ников удобно представить в виде табл. 1 на с. 116. 3.2.3. Частотно-избирательные свойства речевого тракта Конфигурация речевого тракта и его передаточная функция Широкие возможности резонаторной системы речево­
го тракта являются основой необычайного разнообразия 115 Глава 3. Акустика речи звуков человеческой речи. Количество фонетических проти­
вопоставлений, которые могут базироваться только на раз­
личиях в свойствах звуковых источников, весьма ограниче­
но. Поэтому целевые артикуляции звуков во многих своих аспектах направлены на создание речевого тракта с разными частотно-избирательными свойствами. Таблица 1 Источники звука в речи Тип источника с учетом комбинаторики Класс звуков Гласные и сонорные согласные Турбулентный Глухие фрикативные согласные Импульсный Глухие взрывные согласные Импульсный турбулентный (фрикативный и/или аспиративный, последовательно) Глухие взрывные согласные и аффрикаты Голосовой (одновременно) Звонкие фрикативные согласные Голосовой импульсный (сначала первый, затем одновременно) Звонкие взрывные согласные Голосовой импульсный турбу­
лентный (сначала первый, затем последовательность остальных одновременно с первым) Звонкие взрывные согласные и аффрикаты Конфигурацию, или форму, воздушных полостей, об­
разующих речевой тракт, можно охарактеризовать через пло­
щадь поперечного сечения тракта (англ.
area function)
в ка­
ждой точке вдоль его длины — от голосовых связок до губ. На рис. 3.6 [Kent, Read
1992: показано, каким обра­
зом конфигурация тракта может быть представлена в виде функции Любое изменение в площади поперечного сечения тра­
кта или в его общей длине приводит к образованию новой Изогнутость речевой трубки не оказывает существенного влияния на ее ре­
зонансные свойства. 116 3.2. Элементы акустической теории Голосовая Губы щель а, б — конфигурации тракта; в — функ­
ция площади поперечных сечений тра­
кта, взятых вдоль его длины в направ­
лении от голосовой щели к губам Рис. 3.6. Представление речевого тракта через функцию площади конфигурации и в той или иной степени модифицирует свойства речевого резонатора. Г. Фант в своей классической работе, посвященной акустике речи, доказал, что форма тра­
кта, описанная через функцию площади в указанном выше смысле, практически полностью задает его фильтрующие свойства. На рис. 3.7 в качестве иллюстрации приведены рентгенограмма и функция площади тракта для русского гласного [и]. Исследование Фанта показало также, что не все детали геометрической формы тракта обладают равной значимо­
стью для характеристики его фильтрующего действия. Ока­
залось, что наиболее существенны три параметра: 1) место главного язычного сужения; 2) площадь поперечного сече­
ния тракта в главном язычном сужении; 3) отношение пло­
щади ротового отверстия к его длине. Еще раньше амери­
канские ученые К. и А. Хауз получили аналогичные результаты, анализируя передаточную функцию тракта и 117 Глава 3. Акустика речи cm Рис. Рентгенограмма (а) и функция площади тракта (б) для гласного [и] Рис. 3.8. модель речевого тракта акустические характеристики гласных
[Stevens, House
1955]. В традиционных фонетических терминах перечисленные вы­
ше параметры приблизительно соответствуют ряду гласных и месту образования согласных, подъему гласных и способу образования согласных и степени огубленности. Рис. 3.8 (по [Daniloff et иллюстрирует модель речевого тракта при его описании с помощью главных геометрических пара­
метров. Возможность сведения сложной конфигурации тракта к небольшому количеству параметров, отвечающих за фор­
мирование акустико-слуховых контрастов между звуками, важна для решения многих задач: моделирования артикуля­
ционных механизмов речи, понимания связи между артику­
ляцией, акустикой и восприятием речи, речевых технологий и т. д. 118 3.2. акустической теории речеобразования и антиформанта передаточной функции Мы уже отмечали, что воздушный столб, заключенный в речевом тракте, является сложной колебательной системой. Ее передаточная функция может рассматриваться как слож­
ная резонансная кривая, которая имеет амплитудные макси­
мумы на собственных (резонансных) частотах. В речевой аку­
стике резонансные максимумы передаточной функции назы­
вают формантами (англ.
поскольку прежде всего они формируют фонетические различия между звуками. Форманты обозначаются символами
F2, нумерация соответствует порядку следования формант по шкале частот. Частоты формант принято обозначать как
и т. д. Понятия "резонансная частота речевого тракта" и "частота форманты" будут использоваться далее как Теоретически передаточная функция может иметь мно­
го формант, однако для образования и различения звуков речи существенны две (в некоторых случаях три или четыре) первые, наиболее низкие по частоте. Помимо частоты, фор­
манта как показатель резонансного усиления характеризует­
ся также шириной В (от англ.
bandwidth
"полоса частот"). Ширина форманты служит мерой частотной избирательно­
сти речевого тракта при резонансе (и мерой затухания резо­
нансных колебаний). Она определяется диапазоном частот по обе стороны от частоты форманты, которые получают усиление, примерно эквивалентное точному Для обозначения ширины формант используются символы и т. д. В создании фонетических различий между звуками ширина формант играет второстепенную роль. При артикуляции некоторых звуков возникают усло­
вия, которые приводят к появлению так называемых анти-
резонансов. речевого тракта, как это следует из названия, оказывают на колебания источника звука вли­
яние, противоположное воздействию резонансов. Они резко ослабляют амплитуду составляющих с частотами, близкими собственной частоте антирезонанса, что выражается в обра-
Существует несколько иное употребление термина "форманта", о чем будет сказано далее. В технически ориентированных описаниях резонансные час-
тоты речевого тракта называют также полюсами (от англ.
pole)
передаточ­
ной функции. По соглашению, принятому в акустике речи, в полосу форманты включа-
ются частоты, усиление которых составляет не менее 70,7 от максималь­
ного резонансного усиления на частоте форманты. Подробнее о ширине ре­
зонанса см. п. 3.3 приложения. Глава 3. Акустика речи зовании глубоких (до нуля) минимумов в передаточной функции или в сильном подавлении близких резонансных частот. Антирезонансы называют также антиформантами или нулями передаточной функции. Нули передаточной функ­
ции и их частоты обозначаются соответственно символами Z2 и т. д. (от англ.
zero
"нуль"). В общем виде передаточную функцию тракта при про­
изводстве речевых звуков можно представить выражением где
- функция, отражающая резонан-
сы речевого тракта (форманты или полюсы),
a — функ­
ция, характеризующая систему антирезонансов (антифор­
мант или Появление нулей в передаточной функ­
ции связано с сильной расчлененностью резонаторной сис­
темы тракта или с образованием в нем своеобразных акусти­
ческих "тупиков", т. е. замкнутых воздушных полостей, не имеющих прямого выхода во внешнюю воздушную среду. Такие конфигурации тракта характерны, прежде всего, для произнесения согласных и назализованных гласных. Пере­
даточная функция ротовых гласных, как правило, не содер­
жит нулей (антирезонансов), так как речевой резонатор функционирует как единая, связанная система. Из сказан­
ного следует, что свойства резонаторной системы тракта при произнесении гласных и согласных существенно различают­
ся. Рассмотрим эти различия более подробно. Передаточная функция тракта при производстве ротовых гласных F
-картина гласных При артикуляции ротовых гласных воздух свободно проходит через ротовую полость, проход в носовую полость закрыт. Голосовой источник, с участием которого образуют­
ся гласные, расположен на входе в фариНгально-ротовую часть тракта и, за исключением некоторых специальных слу­
чаев, не используется для создания звуковых контрастов ме­
жду гласными. Разные гласные могут произноситься при од­
ном и том же типе фонации, и, наоборот, один и тот же гласный может быть произнесен при разных типах фонации, Читатели, интересующиеся более строгим математическим определением передаточной функции, могут обратиться к работе 1964]. 120 3.2. Элементы акустической теории например, обычно или шепотом, с разным голосовым уси­
лием, на разной высоте голоса и т. д. В этих условиях передаточная функция и фонетическое качество гласного полностью задаются формой тракта и со­
ответствующими резонансными характеристиками: частотой и шириной формант. Ширина формант до известной степе­
ни определяется их частотой. Далее будет показано, что ам­
плитуды формант у гласных обусловлены соотношением их частот. Таким образом, в качестве независимых величин, оп­
ределяющих передаточную функцию, выступают только ча­
стоты формант, или Необходимо, однако, пом­
нить, что в конечном счете акустические свойства гласного обусловлены всеми параметрами передаточной функции. Особенности гласных удобнее начать рас­
сматривать с наиболее простого случая, который соответст­
вует артикуляции нейтрального гласного Акустические 121 Глава 3. Акустика речи условия образования этого звука, включая голосовой источ­
ник, максимально приближаются к случаю резонансных ко­
лебаний столба воздуха, заключенного в трубке постоянного сечения, которая с одного конца (у голосовых связок) за­
крыта, а с другого (у ротового отверстия) — открыта (рис. 3.9 б). Подобный цилиндрический резонатор является про­
стейшей моделью речевого тракта, порождающего гласнопо­
добный звук. Передаточная функция при производстве ос­
тальных звуков может рассматриваться как усложнение этой базовой модели, которое связано с созданием локального су­
жения или расширения, приводящих к изменению простой цилиндрической формы резонатора с постоянным сечением. Такой подход позволяет не только описать соотношение ме­
жду артикуляцией и акустикой речи, но и предсказать изме­
нения резонансных свойств тракта при различном положе­
нии языка и губ. Для понимания дальнейшего изложения приведем не­
которые сведения о резонансных свойствах воздушного столба в цилиндрической трубке, один конец которой за­
крыт, а другой открыт. Известно, что воздух, заключенный в такой полости, имеет не одну, а бесконечно много собст­
венных частот, значение которых зависит от длины трубки. Общая формула для частот собственных колебаний в этом случае выгдядит так: где п — натуральное чис­
ло, с — скорость распространения звука в воздухе, — дли­
на трубки. Формула показывает, что резонансы цилиндриче­
ской трубки, закрытой с одного конца, возникают на часто­
говоря, собственные частоты (форман­
ты) воздушного столба в такой трубке относятся друг к дру­
гу как нечетные целые числа Когда воздух в трубке колеблется с одной из собствен­
ных частот, возникает гармоническое собственное колеба­
ние, имеющее вид стоячей звуковой волны. Она образуется в результате сложения звуковой волны, распространяющей­
ся вдоль трубки в одном направлении, с отраженной волной, бегущей в обратном направлении. В любой стоячей волне есть участки колеблющегося тела, которые находятся в по­
кое (для них амплитуда колебаний всегда равна нулю), и участки, испытывающие максимальное смещение относи­
тельно положения равновесия (амплитуда колебаний макси­
122 3.2. Элементы акустической теории мальна). Участки, которые не совершают колебаний, назы­
ваются узлами, а участки с максимальной амплитудой коле­
баний — пучностями стоячей волны. Узлы всегда чередуют­
ся с пучностями, их местоположение не меняется с течени­
ем времени, но зависит от собственной частоты колеблюще­
гося тела и условий на его границах. Стоячая волна, представляющая собой собственное ко­
лебание воздуха внутри трубки, также характеризуется спе­
цифическим распределением амплитуды смещения частиц воздуха вдоль ее длины. Граничные условия (в нашем случае один конец трубки закрыт, другой — открыт) задают общее свойство всех собственных колебаний такого воздушного столба. Оно состоит в том, что у закрытого конца трубки ча­
стицы воздуха не колеблются — здесь всегда находится узел волны смещения, а у открытого конца смещение частиц все­
гда максимально — здесь образуется пучность волны смеще­
ния. Распределение узлов и пучностей смещения во внут­
ренних областях трубки различно для разных собственных колебаний и определяется их частотой (длиной волны). В физике при анализе колебаний воздуха внутри тех или иных емкостей часто предпочитают говорить не о сме­
щениях отдельных частиц, а о колебаниях скорости воздуш­
ного потока и звукового давления. Величины, колеблющие­
ся в стоячей звуковой волне, связаны следующими отноше­
ниями. Как уже говорилось выше, частицы, которые нахо­
дятся в узловых участках волны смещения, не колеблются, их скорость все время равна нулю. В то же время они пре­
терпевают наибольшие изменения давления и плотности, т. е. узлу смещения и скорости потока соответствуют пучно­
сти волны звукового давления и плотности. И наоборот, в тех участках трубки, где имеются пучности смещения и ско­
рости потока, давление и плотность практически не изменя­
ются — в таких местах находятся узлы колебаний давления и Каждой собственной частоте (форманте) колебаний воздуха в трубке соответствует свое количество и простран­
ственное расположение узлов и пучностей звукового давле­
ния и скорости потока. Для объяснения артикуляционно-
акустических соответствий, действующих при произнесении гласных, это наиболее важное свойство собственных (резо­
нансных) колебаний речевого тракта любой формы. Самая простая картина наблюдается на первой, наиболее низкой 123 Глава 3. Акустика речи собственной частоте: в этом случае имеются один узел и од­
на пучность. На рис. 3.9 в показано, как распределяются ам­
плитуды колебаний давления и объемной скорости, соответ­
ствующие первой форманте воздушного столба в простом цилиндрическом резонаторе. Пучность давления в этом слу­
чае находится у его закрытого конца, а узел — у открытого. Легко видеть, что первый резонанс характеризуется тем, что на длине трубки укладывается четверть длины синусоидаль­
ной волны давления (или скорости), а полная длина волны Картины стоячей волны давления и скорости потока для второй и третьей формант показаны на рис. 3.9 г, д. На частоте второй форманты каждая из волн имеет две пучности и два узла. Расстояние между узлами (или пуч­
ностями) одной волны равно половине ее общей длины, а на длине трубки укладывается три четверти длины волны с 4Т — На частоте третьей форманты волны давления и 3 скорости содержат три узла и три пучности — длина трубки вмещает пять четвертей волны. Таким образом, стоячие вол­
ны и резонанс возникают в рассматриваемом резонаторе в том случае, когда на длине трубки укладывается нечетное число четвертей длины бегущих волн давления и скорости. Из графиков видно, что эти волны сдвинуты по фазе на 90°. Из сказанного следует, что
F
-картина нейтрального гласного, при произнесении которого речевой тракт может рассматриваться как цилиндрическая трубка с одним закры­
тым концом, зависит только от длины тракта: чем больше длина, тем меньше частота всех формант. Расстояние между частотами формант одинаково и равно где
L
— длина тракта. Все остальные гласные характеризуются более слож­
ной конфигурацией, в которой присутствуют локальные су­
жения, образуемые языком и губами. Большое значение для объяснения акустических свойств тракта при произнесении гласных имела работа японских исследователей Т. Чиба и М. Каджияма
[Chiba, 1946]. Они показали, что если в тракте образуется локальное сужение, то частота форманты понижается или повышается в зависимости от того, как оно расположено от­
носительно участков, где находятся узлы и пучности давле-
124 3.2. Элементы акустической теории \ 1 ­ расстояние от открытого конца ротовой полости до голо­
совой щели х= А / + \ х= х=0 Рис. 3.10. Относительное изменение ча­
стоты первых трех формант в зависимо­
сти от места сужения в речевом тракте ния, соответствующие данной форманте в цилиндрической трубке той же длины. В частности, если сужение образуется в области узла колебаний давления (максимума объемной скорости) для данной форманты, то ее частота понижается (относительно величины, соответствующей той же трубке без сужения). Если же сужение находится в области пучно­
сти колебаний давления (минимума объемной скорости) для данной форманты, то ее частота повышается. Когда в ука­
занных областях речевой тракт расширяется, частота фор­
манты изменяется в противоположном направлении. Опи­
санные закономерности легли в основу так называемой пер­
турбационной теории образования гласных (англ.
perturba­
tion theory),
широко принятой в акустике речи. Их действие для первых трех формант иллюстрируется рис. [Kent, Read
1992: Ось X на каждом из гра­
фиков соответствует длине тракта. Знак "плюс" показывает, что образование сужения в данном участке трубки увеличи­
вает частоту форманты относительно значения, характерно­
го для нейтрального гласного; знак "минус" отражает обрат­
ную ситуацию. 125 Глава 3. Акустика речи Графики на рис. представляют собой частный слу­
чай номограммы. В общем случае номограммой называется совокупность графиков, которые показывают, как меняются резонансные частоты тракта при изменении артикуляцион­
ных параметров, задающих его геометрическую Но­
мограмма на рис. показывает, что образование сужения в некоторых участках тракта приводит к максимальным отно­
сительным сдвигам в частоте всех трех формант. Такие лока­
лизации порождают наиболее отчетливые акустико-слуховые контрасты гласных. На рис. видно также, что сдвиги ча­
стоты формант симметричны: сужения (или расширения), равноудаленные от тракта, вызывают одинаковые по величине и противоположные по знаку изменения ных частот. И наоборот, разные по знаку изменения площа­
ди, равноудаленные от границ тракта, вызывают максималь­
ное изменение частоты форманты в одном и том же направ­
лении. Например, сужение в задней части речевого тракта, которому сопутствует расширение в передней, должно приво­
дить к заметному увеличению Такая конфигурация дости­
гается смещением языка вниз и назад с дополнительным опу­
сканием нижней челюсти и соответствует артикуляции разных гласных. Максимального понижения следует ожи­
дать при образовании сужения в передней части речевого тра­
кта с одновременным расширением в задней. Это соответст­
вует максимально возможному для гласных смещению языка вперед и вверх с дополнительным подъемом нижней челюсти, что имеет место при артикуляции гласных. Рассмотрим, как изложенные правила предсказывают гласных в некоторых конкретных случаях (рис. по а1. 1980: Будем использовать данные для речевого тракта длиной 17,6 см (средняя длина тракта взрослого мужчины). В этом случае, согласно формуле для цилиндрической модели, частоты трех первых формант ней­
трального гласного равны 500, 1 500 и 2 500 Гц (при скоро­
сти звука, равной 35 000 Расстояние между частотами формант составляет 1 000 Гц, амплитуды формант одинако­
вы (рис. ж). Более подробно о номограммах можно прочитать в
[Stevens, House
1955; Фант 1964;
Lindblom, Sundberg
1971]. В акустической теории речеобразо-
вания номограммы используются для анализа связи между частотами фор­
мант и различными резонаторными полостями (или участками) речевого тракта, которые образуются при артикуляции речевых звуков. 2.2. Элементы акустической теории Губы 17,6 см Голосовая щель Форма речевого 500 1500 2500 3500 Частота (Гц) Рис. Влияние формы тракта на его резонансные свойства. Конфигурации тракта показаны слева, соответствую­
щие им передаточные функции — спра­
ва (остальные объяснения в тексте) 127 Глава 3. Акустика речи Из видно следующее. Увеличение общей длины тракта при сохранении его цилиндрической формы приводит к понижению частоты всех формант (рис. д), а уменьшение — к их повышению (рис. г). Различиями в длине тракта объясняются более высокие значения частот формант в женской и детской ре­
чи. Увеличение формантных частот при произнесении одних и тех же гласных составляет для женских голосов около % относительно мужского голоса, а для детских может дости­
гать 2. При данной длине тракта (т. е. для одного и того же говорящего) образование даже небольшого сужения приво­
дит к нарушению цилиндрической формы тракта, что резко меняет
F
-картину — расстояние между формантами по час­
тоте уже не равно 1 ООО Гц (как для обычной цилиндриче­
ской трубки длиной 17, 6 см), а зависит от места сужения. Значение 1 ООО Гц сохраняется только как показатель сред­
него расстояния между частотами формант (рис. а-в, е). 3. Создание узкого прохода в области губ (огубление) приводит к частоты всех формант (рис. е). 4. в передней части ротовой полости (рис. а для гласного
образующееся сдвигом языка вперед и вверх относительно нейтрального положения, при­
водит к резкому увеличению расстояния между
и
за счет понижения
и повышения
и
сближаются. 5. В результате сужения в задней части ротовой полос­
ти (рис. б для гласного которое образуется смеще­
нием языка назад и вверх относительно нейтрального поло­
жения, и одновременного сужения в области губ сокращает­
ся расстояние между
и
при их одновременном пониже­
нии; расстояние между
и
максимально. 6. Сужение в фарингальной части (рис. в для глас­
ного предполагающее сдвиг языка назад относительно нейтрального положения, приводит к резкому сокращению расстояния между
и
за счет повышения
и пониже­
ния
Детальный анализ отношений между изменениями в форме тракта и
F
-картиной гласных, который проводили ученые на специальных моделях и на реальном речевом ма­
териале, показал, что общие артикуляционно-акустические отношения, которые предсказываются пертурбационной теорией, являются очень устойчивыми в речи. Приведем еще 128 3.2. Элементы акустической теории Рис. 3.12. Формантное пространство потенциальных гласных одну иллюстрацию. На рис. 3.12 Stevens
1999] представ­
лены комбинации максимальных и минимальных частот
F1 и
F2,
возможных для гласных, и соответствующие им моде­
ли речевого тракта (функции площади). Рисунок характери­
зует формантное пространство потенциальных гласных, а также изменение частот
F1
и
F2
и форм тракта относитель­
но аналогичных параметров нейтрального гласного (ему со­
ответствует точка в центре Данные ориентированы на размеры женского тракта длиной 15,4 см; для мужского тракта частоты формант меньше приблизительно на 10-20 Модели тракта в угловых точках диаграммы обозначены транскрипционными символами гласных, которые имеют аналогичную
F
-картину. Анализируя рис. 3.12, можно установить, что ные частоты связаны с различиями гласных по традицион­
ным фонетическим признакам ряда, подъема и лабиализации. На рисунке видно, что первая форманта коррелирует с при­
знаком подъема: расстояние для передних нелабиализо-
129 Глава 3. Акустика речи ванных гласных (верхний подъем) и [ж] (нижний подъем) максимально, а для [ж] и [а] (нелабиализованные гласные нижнего подъема и разного ряда) значения приблизитель­
но одинаковы. Вторая форманта соотносится с различиями по признаку ряда. Расстояние по для гласных одного ряда с одной стороны, и гласных [а] - с другой, суще­
ственно меньше, чем для гласных разных рядов (ср. [ж] ~ [а] и ~ В то же время рисунок показывает, что между фо­
нетическими признаками гласных и существуют достаточно сложные отношения. Например, гласные, кото­
рые с точки зрения фонетической классификации относятся к одному и тому же ряду и имеют разную степень подъема, артикуляционно различаются не только площадью язычного сужения, но и его местоположением. Так, при артикуляции переднего гласного [ж] опускание языка сопровождается его смещением назад, что приводит не только к повышению но и к понижению (относительно гласного Вторая форманта, таким образом, оказывается связанной не только с рядом, но и с подъемом гласного. Как показывает сравнение пар гласных ~ [и] и [ж] ~ на влияет также огублен­
ность гласного. Таким образом, частота каждой из главных формант в той или иной степени зависит от всех признаков гласного. Это объясняется тем, что частоты формант опреде­
ляются общей конфигурацией тракта, создаваемой положени­
ем губ, языка и нижней челюсти, а артикуляционные призна­
ки фиксируют ее весьма приблизительно — в той степени, ко­
торая необходима для классификации гласных. Амплитудные характеристики формант При произнесении разных гласных изменяются как картина, так и амплитудные характеристики формант. Изве­
стно, что передаточная функция сложного резонатора с большим количеством резонансных частот может быть пред­
ставлена как простых резонансных кривых. Иными словами, значение передаточной функции сложного резонатора на любой частоте равно произведению значений отдельных резонансных кривых на той частоте (или в шкале децибелов их алгебраической сумме). Резонансные кривые для первых четырех формант нейтрального гласного схематически показаны на рис. 3.13. В сумме эти кривые с учетом всех более высоких формант задают нейт-
130 Элементы акустической теории а) 500 1500 2500 3500 Частота (Гц) Рис. Резонансные кривые для че­
тырех формант нейтрального гласного (а) и суммарная передаточная функ­
ция (б) рального гласного с частотами формант, равными 500, 1 500, 2 500 и 3 500 Гц, и равными амплитудами. Сдвиги частот приводят к закономерным изменениям в соотношении их амплитудных уровней в сум­
марной передаточной функции. Приведем результаты спе­
циального анализа соответствия между частотами формант и их амплитудами (см. также рис. 3.14 [Kent, Read
При понижении
F1
ее амплитуда уменьшается, а при повышении увеличивается. 2. Сдвиг любой форманты по частоте влияет в основ­
ном на амплитуду более высоких формант. Понижение
F1 приводит к уменьшению уровня всех остальных формант, а повышение
F1
— к их увеличению. Поэтому гласные с вы­
сокой
F1
типа русского [а] имеют большую собственную ин­
тенсивность, чем гласные с низкой
F1
типа [и] или это видно на рис. 3.14 а, д; ср. также рис. а-в. 3. При уменьшении расстояния между частотами со­
седних формант их амплитуды увеличиваются. Если частоты 131 Глава 3. Акустика речи сте Рис. 3.14. Зависимость между частотами формант и их амплитудными характе­
ристиками формант очень близки, в передаточной функции может ос­
таться только один общий видимый максимум с достаточно большой шириной (ср. приближение к этой ситуации на в и рис. 3.14 б, в). 4. Когда имеет низкую частоту и находится недале­
ко от огибающая передаточной функции после резко падает (рис. б, г). Это соответствует незначительному вкладу высоких формант в фонетическое качество ре­
зультирующего звука. 5. Если имеет высокую частоту и находится недале­
ко от огибающая передаточной функции после пада­
ет менее резко, а и более высокие форманты имеют боль­
шую амплитуду. В этом случае вклад третьей форманты в фонетическое качество звука является существенным (рис. 3.14 в). Частотные области формант ротовых гласных В реальной речи ротовых гласных зависит от множества факторов: фонемной принадлежности и фонети­
ческого качества гласного, фонетического контекста, инди­
132 Элементы акустической видуальных артикуляторных навыков говорящего, анатоми­
ческих размеров речевого тракта. В то же время полезно знать средний диапазон изменения каждой из трех главных формант и примерные значения ширины формантного уси­
ления. Эти данные приведены в табл. 2. Таблица 2 Характеристики первых трех формант ротовых гласных Передаточная функция тракта при производстве согласных Шумные согласные При произнесении шумных согласных речевой тракт так же, как при производстве гласных, оказывает фильтру­
ющее воздействие на звуковые колебания, создаваемые ис­
точником шума. В этом легко убедиться, если произнести ряд глухих фрикативных согласных, постепенно сдвигая ме­
сто сужения в направлении от голосовой щели к зубам. На слух согласные в таком ряду различаются "высотой" шума. Частотно-избирательное действие тракта, приводящее к этим определяется тремя факторами: местом су­
жения, которое разделяет тракт на две слабо связанные ре­
зонансные полости определенной длины, размером сужения и расположением источника шума впереди сужения или в нем самом. Рассмотрим действие указанных факторов на примере образования альвеолярного фрикативного согласного типа английского
На рис. 3.15 Kent, Read
1992] приведе­
ны артикуляционный профиль, идеализированная модель речевого тракта и огибающая спектра шума для этого сог­
ласного. Точкой обозначено приблизительное место источ­
ника шума. 133 Глава 3. Акустика речи Рис. 3.15. Производство фрикативных согласных (на примере альвеолярного согласного а — артикуляционный профиль; б - модель речевого тракта; в — огибающая шумового спектра В акустической ситуации, представленной на рис. 3.15, условия возбуждения резонансных колебаний в задней поло­
сти сильно затруднены. Значительное сужение создает аку­
стический барьер, который препятствует прохождению зву­
ковых колебаний как в заднюю полость, так и из нее. В ре­
зультате резонансные частоты этой полости оказывают не­
значительное влияние на окончательный спектр шума сог­
ласного, а вид передаточной функции тракта задается глав­
ным образом резонансами полости, расположенной впереди источника. Расположение источника звука перед сужением как бы исключает (частично или полностью) резонаторную полость, которая находится позади сужения, из процесса об­
разования согласного. 134 3.2. Элементы акустической теории речеобразования Отсутствие или незначительная амплитуда резонанс­
ных частот задней полости в передаточной функции тракта при производстве фрикативных согласных формально опи­
сывается с помощью понятия антирезонанса. Говорят, что антирезонансы ослабляют или полностью подавляют собст­
венные частоты полости, находящейся позади сужения. На рис. видно, что в спектре шума нет каких-либо сле­
дов нижних формант, частоты которых могли бы быть обу­
словлены длинной задней полостью Видимая шумовая энергия появляется в области, приблизительно соответству­
ющей четвертой форманте гласных. Резонансные частоты передней полости, определяю­
щие главные различия в шумовом спектре фрикативных со­
гласных, зависят от ее длины В первом приближении переднюю полость можно рассматривать как цилиндриче­
скую трубку, открытую у выхода из ротовой полости и за­
крытую со стороны сужения. При произнесении согласного длина этой трубки (для тракта взрослого мужчины) рав­
на приблизительно 1,5 см. При сделанных допущениях час­
тота первого (самого низкого) резонанса передней полости равна 5 830 Гц, что хорошо соответствует реальным спектрам шума этого согласного для мужского голоса. Чем дальше от выхода из ротовой полости расположе­
ны сужение и источник шума, тем ниже первый резонанс передней полости и все остальные резонансные частоты. В соответствии с этим меняется и воспринимаемая высота шу­
ма (сравните русские согласные [с], [ш] и Для соглас­
ного который образуется с участием аспиративного шу­
ма, передаточная функция определяется резонансными час­
тотами всей фарингально-ротовой полости, и принципы ее формирования те же, что для гласных. Если сужение находится на выходе из ротовой полости (к этому приближается артикуляция русского шум ис­
точника почти не подвергается частотной фильтрации и окончательный спектр согласного не содержит резонансных усилений. Передаточная функция тракта при произнесении глу­
хих взрывных согласных (и аффрикат) имеет много общего с рассмотренной выше акустической картиной для глухих фрикативных. Основные различия связаны с динамическим характером артикуляции этих звуков, состоящей из интерва-
135 Глава 3. Акустика речи смычки и рекурсии, в течение которых изменяются усло­
вия для возбуждения резонансных колебаний. На интервале глухой смычки такие колебания не возникают ни в одной из полостей из-за отсутствия источника звука. В фазе рекурсии при образовании собственно взрыва и фрикативного шума передаточная функция задается условиями, которые дейст­
вуют для фрикативных согласных того же места образова­
ния. Если после фрикативного источника формируется ас-
пиративный шум, передаточная функция имеет те же свой­
ства, которыми характеризуется образование согласного При артикуляции звонких шумных согласных голосо­
вой источник возбуждает резонансные колебания в полости, которая находится позади артикуляционного сужения или смычки. Однако возможности прохождения этих колебаний в вышележащие области тракта крайне ограничены. Таким образом, можно считать, что для всех шумных согласных пе­
редаточная функция тракта определяется собственными ча­
стотами полости, находящейся впереди источника шума. Носовые и боковые сонорные согласные Сонорные согласные произносятся с участием голосо­
вого источника при свободном проходе воздушного потока через речевой тракт. В этом отношении они похожи на ро­
товые гласные, поэтому анализ резонаторной системы, дей­
ствующей при их производстве, базируется на сравнении с гласными и опирается на пертурбационную теорию. Однако артикуляция носовых и боковых сонорных предполагает со­
здание преград, что усложняет передаточную функцию тра­
кта, внося в нее элементы сходства с шумными согласными. При произнесении носовых согласных нёбная занавес­
ка опущена, в ротовой полости создается смычка и звук из­
лучается через нос. Модели резонаторной системы тракта для носовых согласных [п] и схематически показаны на рис. Основной резонатор при производстве носовых соглас­
ных образуется фарингальной полостью, носоглоткой и но­
совыми проходами, которые сужаются к ноздрям. Внутрен­
ние поверхности носовой полости покрыты стыми оболочками. Основной резонатор на несколько сан­
тиметров длиннее ротовой части резонаторной системы тра­
кта. Без больших погрешностей можно считать, что при про­
изнесении велярного носового передаточная функция 136 3.2. Элементы акустической теории речеобразования В — место смычки билабиального А - альвеолярного V — велярного Рис. 3.16. Модели ной систе­
мы речевого тракта для носовых соглас­
ных разного места образования тракта определяется только основным резонатором; поэтому этот согласный иногда называют носовым зву­
ком. Анализ спектров велярного носового показывает, что основной резонатор имеет очень низкую первую форманту (так называемую форманту назализации) в области 200-300 Гц и слабые резонансы на частотах 1 ООО, 2 ООО и 3 ООО Гц (для тракта взрослого мужчины). При сравнении этих дан­
ных с первыми формантами нейтрального гласного 500, 1 500, 2 500 Гц нетрудно установить, что более низкая час­
тота и большая плотность формант у нейтрального носового звука обусловлены различиями в размерах (длине) действу­
ющих резонаторов, а низкая частота форманты назализа­
ции — еще и наличием сужения на выходе из носовой поло­
сти. Этими же факторами, а также высокими поглощающи­
ми свойствами анатомических структур носа объясняются малая амплитуда и большая ширина формант носового зву­
ка. Иначе говоря, резонансные колебания в основном носо­
вом резонаторе характеризуются значительным затуханием. Таким образом, отличительном свойством основного резо­
натора при производстве носовых согласных является усиле­
ние самых низких гармоник голосового источника и ослаб­
ление всех остальных. Образование носовых и [п] можно рассматривать как модификацию нейтрального носового звука. При их произнесении ротовая полость выступает в качестве допол­
нительного резонатора. Ротовой резонатор не имеет внешне-
137 Глава 3. Акустика речи го выхода в атмосферу и связан с основным резонатором че­
рез проход в области мягкого нёба. В зависимости от вели­
чины прохода резонансные частоты ротового резонатора ли­
бо никак не представлены в суммарной передаточной функ­
ции тракта, либо имеют незначительную амплитуду и сопро­
вождаются появлением антирезонансов на частотах, близких к резонансным. Частоты резонансов и антирезонансов рото­
вой полости определяются ее длиной и тесно связаны с ме­
стом образования носового согласного. Нужно отметить, что у разных людей наблюдаются большие различия в анатомическом строении носовой поло­
сти, а у одного и того же человека может значительно ме­
няться состояние слизистых оболочек носа (например, при насморке). Величина прохода, соединяющего основной и ро­
товой резонаторы, также колеблется в значительных преде­
лах. Это приводит к большой вариативности частотно-изби­
рательных свойств тракта при производстве носовых При артикуляции боковых сонорных (типа русского в передней части ротовой полости (по ее центральной оси) образуется смычка, которая обтекается воздушным по­
током, благодаря наличию относительно широких проходов по боковым сторонам языка. Общая длина воздушных путей при образовании боковых согласных больше, чем при про­
изводстве нейтрального гласного. Это приводит, как мы ви­
дели на примере носовых согласных, к увеличению плотно­
сти формант, понижению их частоты и уменьшению ампли­
туды (относительно нейтрального гласного). Так как суже­
ние находится в передней части тракта, происходит допол­
нительное понижение Частота зависит от формы и положения тела языка позади преграды и также может быть предсказана на основе пертурбационной теории. Например, в русском языке артикуляция [л] включает подъем задней части языка к мягкому В результате понижается еще больше и передаточная функция согласного сближается с гласного [у]. В отличие от гласных, в переда­
точной функции тракта при образовании боковых согласных имеется, по крайней мере, один выраженный антирезонанс. При произнесении назализованных гласных роль основного резонатора выполняет фарингально-ротовая часть речевого тракта, а в качестве до­
полнительного резонатора выступает носовая полость. В этом случае вли­
яние носового резонатора описывается как результат модификации тины соответствующего ротового гласного. 138 3.2. Элементы акустической теории речеобразования Он связан с образованием небольшой побочной полости по­
зади язычной преграды. Частота антирезонанса находится между и [Фант и его подавляющее воздействие зависит от частотного расстояния до каждой из них. Обыч­
но ослабляется сильнее. согласных и форматные переходы гласных Рассматривая ротовые гласные, мы отмечали, что при их образовании передаточная функция тракта полностью определяется его резонансными частотами, или Р­картиной. Важнейшей особенностью в речи является ее не­
прерывное и относительно плавное изменение во времени: при произнесении звуковых последовательностей артикуля­
ционные органы меняют свое положение без резких скач­
ков, что приводит к плавному изменению конфигурации тракта и его резонансных частот. Как уже говорилось, обра­
зование согласных характеризуется тем, что резонансные ча­
стоты некоторых полостей тракта не представлены в переда­
точной функции или сильно ослаблены. Поэтому в спект­
ральной картине звуковых последовательностей на границах между согласными и гласными наблюдаются обрывы или резкие ослабления нижних формант. Возможно также появ­
ление дополнительных носовых формант в области низких частот. Разрывы непрерывного хода формант особенно от­
четливо видны в спектральной картине звуковых цепочек, включающих сочетания шумных согласных с гласными. Учитывая особенности формирования спектра соглас­
ных, при их описании часто используют понятие локусной Под локусной Р­картиной понимается совокуп­
ность частот и т. д.) ротовой части тракта, которая соответствует целевому положению артику­
ляторов при выдержке согласного, независимо от того, как эти частоты проявляются в его окончательном спектре. Час­
тоты формант в локусной согласного называются локусами соответствующих Разрывы наблюдаемой Р­картины и понятие локуса иллюстрируются рис. на примере звукосочетаний и Понятие локуса иногда распространяется и на гласные: в этом случае локусом форманты называется ее частота в идеализированной (целевой) гласного при его произнесении вне контекста. 139 Глава 3. Акустика речи Рис. речевого сигнала при произнесении сочетаний шумных согласных с гласными. Звездочкой по­
казаны приблизительные значения для согласных В речевом потоке локусы согласных плавно переходят в соответствующие форманты соседних гласных, отражая перестройку артикуляторов и соответствующие изменения в форме речевого тракта. Смещения формантных частот, вы­
званные этими процессами, называются формантными реходами. На рис. такие переходы видны для на уча­
стках гласных, пограничных с согласными. Направление и величина формантных переходов зависят от соотношения локусных формантных частот соседних согласных и гласных. Эти акустические параметры несут основную информацию об изменениях в общей конфигурации речевого тракта. Принцип непрерывности в речи является основой реконструирования скрытых локусов согласных по речевым спектрограммам. Формантные переходы на гранич­
ных участках гласных обычно видны достаточно отчетливо. По ним с определенной точностью можно восстановить (пу­
тем экстраполяции) и формантные локусы согласных. Квантальная теория Конфигурации речевого тракта могут быть очень разно­
образными. Его возможности как средства создания звуков гораздо шире, чем у любого музыкального инструмента с фи­
зически близкими условиями звукообразования. В то же вре-
140 Элементы акустической в языках используется ограниченное количество различ­
ных звуковых типов (обычно причем многие звуки разных языков артикуляционно и акустически сходны, т. е. могут считаться представителями одного и того же звукового типа. Например, в подавляющем большинстве языков мира есть гласные, которые похожи по звучанию на русские [у], Американский ученый К. [Stevens
1972 а] выдвинул так называемую теорию, в которой попытался объяснить это несоответствие между неограни­
ченными возможностями речевого тракта и их ограниченным использованием в речи. Согласно этой теории для каждого артикуляционного параметра существуют такие области из­
менения, которые условно можно назвать зонами малой аку­
стической вариативности. Изменение параметра внутри та­
кой зоны порождает незначительные акустические различия, создавая слабые слуховые контрасты. И напротив, выход за пределы зоны приводит к резким (скачкообразным или кван-
тальным) изменениям в акустических характеристиках: в ре­
зультате возникают сильные слуховые контрасты. Иными словами, артикуляционно-акустические отношения являются не монотонными, а ступенчатыми: область непрерывного из­
менения артикуляционного параметра делится на несколько акустически стабильных зон, на границах которых происхо­
дят квантальные изменения акустических характеристик. Гласные [а] резко контрастируют на слух. Наи­
большие контрасты гласных, по Стивенсу, обусловлены та­
кими артикуляциями, при которых
F
-картина характеризу­
ется сближением частот каких-либо формант, из которых хотя бы одна достигает экстремального значения. При про­
изнесении гласных сближаются
и
ма­
ксимальна), —
и
минимальна), разных -
и
максимальна). Положение языка и губ при произнесении указанных гласных может достаточно сильно варьироваться, не вызывая существенных изменений в
F
-картине. Как считает этим гласным соответст­
вуют широкие квантальные зоны и говорящему не нужно тщательно контролировать положение речевых органов при их произнесении. Относительная свобода артикуляции и ус­
тойчивая
F
-картина, создающая резкие контрасты, и объяс­
няют их распространенность в языках мира. Основной тезис теории Стивенса состоит в следующем. При формировании звуковых инвентарей в 141 Глава 3. Акустика речи различных языках учитываются квантальные артикуляци-
онно-акустические отношения: для разных звуков исполь­
зуются прежде всего те артикуляции, которым соответству­
ют квантальные акустические различия. Принцип кван-
тальности действует и при произнесении звуковых после­
довательностей. При непрерывной и плавной перестройке артикуляционных органов в определенные моменты време­
ни либо резко изменяется акустическая картина речи (вне­
запно меняется источник звука и/или передаточная функ­
ция), либо какие-то важные акустические параметры (на­
пример, частоты формант) имеют локальные максимумы или минимумы. Подобные временные точки обладают осо­
бой значимостью для восприятия речи: их окрестности происходят такие изменения акустических параметров, ко­
торые несут наиболее существенную информацию о линг­
вистических признаках звуковых единиц, образующих ре­
чевое сообщение. По мнению Стивенса, организация зву­
ковых последовательностей с учетом квантальных артику-
ляционно-акустических и акустико-слуховых отношений является основой формирования дискретных звуковых форм в языке. Источники сведений о резонансной системе речевого тракта Для получения сведений о передаточной функции ре­
чевого тракта используются рентгенографические и спектро­
графические данные. Рентгенографические сведения служат основой для представления конфигурации речевого тракта в виде функ­
ции площади, характеризующей изменение поперечного се­
чения тракта вдоль его длины. Далее выбирается базовая акустическая модель резонаторной системы и, исходя из геометрических параметров тракта при произнесении рас­
сматриваемого звука, осуществляется количественный рас­
чет его передаточной функции. Иллюстрацией такого подхо­
да является исследование Г. Фанта [Фант 1964], выполнен­
ное на материале звуков русского языка. Оно может служить примером математического моделирования сложных акусти­
ческих процессов, происходящих в речевом тракте при арти­
куляции. Технические трудности, связанные с применением кинорентгена, накладывают сильные ограничения на ис-
142 3.2. Элементы акустической теории пользование рентгенографических данных при исследова­
нии резонансных свойств речевого тракта. Спектрографическая информация дает возможность получить приблизительные характеристики передаточной функции тракта и источников звуков без обращения к де­
тальным сведениям об артикуляционной картине речи. Та­
кой подход опирается на артикуляционную интерпретацию спектрограмм и общие представления об акустике речеобра­
зования. Ниже мы рассмотрим спектрограммы звуков глав­
ных фонетических классов одновременно с анализом их аку­
стических свойств. Однако до этого необходимо познако­
миться с основными методами и инструментальными сред­
ствами, которые используются в акустической фонетике. Методы и средства акустического анализа речи Звуковые колебания можно слышать, но их нельзя ви­
деть и непосредственно подвергнуть каким-то физическим измерениям. Акустический анализ речевого сигнала связан с предварительным преобразованием звуковых колебаний в электрические; это осуществляется с помощью микрофона. Полученная электрическая копия и создает тот сырой физи­
ческий материал, который может подвергаться дальнейшему акустическому В акустической фонетике используются определенные технические средства для записи и визуализации речевого сигнала, точнее, его электрической копии. Огромное коли­
чество сведений об акустике речи было получено с помощью электротехнических приборов, которые позволяли осущест­
влять не только запись и визуализацию звуковых колебаний, но и акустический анализ речевых отрезков. В настоящее время такие приборы все чаще вытесняются компьютерной техникой и специальными компьютерными программами анализа речи. Компьютерные методы значительно расширя­
ют технический арсенал акустической фонетики, не говоря уже о сокращении времени на проведение фонетических ис­
следований. Однако компьютер и программы — это всего Нужно учитывать, что микрофон с плохими техническими характеристи­
ками может вносить сильные искажения в запись речевого сигнала. 143 Глава 3. Акустика речи лишь новый мощный инструмент получения акустических данных, основные типы которых — осциллограммы и спек­
трограммы речи — остаются прежними. запись речевого сигнала Осциллографическая запись, или просто осциллограм­
ма, речевого сигнала (от лат.
"колебание" грам­
ма "запись") представляет собой график, который показы­
вает, как изменяется амплитуда звукового давления во вре­
мени при произнесении речевого отрезка. Иначе говоря, это графическое представление звуковых колебаний как та­
ковых, изображение функции
P(t),
где Р — звуковое давле­
ние,
время. Существуют разные инструментальные средства для получения осциллографической записи речи. В докомпьютерную эпоху для этого использовались осцилло­
Записи, получаемые с их помощью, называются аналоговыми, поскольку они представляют собой непре­
рывную фиксацию электрического аналога речевого сигна­
ла. В настоящее время осциллограммы, как правило, полу­
чают с помощью компьютерных средств. Компьютер дол­
жен быть снабжен особым устройством - звуковой картой (платой). Это устройство измеряет амплитуду электриче­
ской копии сигнала через очень короткие промежутки вре­
мени (обычно ООО или 22 ООО раз в секунду) и преобразу­
ет каждый результат измерения (или амплитудный отсчет, англ.
sample)
в цифровой код, который хранится в памяти компьютера. На основании этих измерений и строится ос­
циллограмма, которую можно увидеть на экране монитора. Звуковую карту называют также аналого-цифровым преоб­
разователем (англ.
analogue-to-digital converter
или сокра­
щенно
"A-D"),
а получаемые с его помощью осциллограм­
мы — цифровыми. Обычно звуковая карта имеет и обрат­
ный цифро-аналоговый преобразователь (англ.
digital-to-
analogue converter
или сокращенно
с помощью ко­
торого цифровое представление сигнала преобразуется в электрические колебания и затем через громкоговоритель — в звуковые. Благодаря таким преобразованиям речевой сиг­
нал можно не только "записать", превратив в последова­
тельность амплитудных измерений, но и прослушать. Подробное описание принципов их работы см. в 144 3.3. Методы и средства акустического анализа речи Рис. 3.18. Осциллограмма слова собака В качестве примера на рис. 3.18 приведена осцилло­
грамма слова собака, полученная с помощью компьютера. Осциллограммы содержат довольно много информации о речевом сигнале. Поскольку основные классы звуковых единиц соотносятся с различиями в источниках звука, по осциллограмме можно установить принадлежность тех или иных фрагментов сигнала к этим основным классам. Рас­
смотрим с этой точки зрения осциллограмму, приведенную на рис. Отрезок АВ соответствует длительному турбу­
лентному шуму глухого согласного [с]. Отрезки ВС, и имеют периодическую структуру и соответствуют гласным, образованным с помощью голосового источника. На рис. 3.18 видно, что гласные довольно сильно различаются по длительности и амплитуде колебаний. Отрезок также имеет периодическую структуру, порождаемую голосовым источником. Этот акустический фрагмент соотносится со звонкой смычкой согласного видно, что по амплитуде он сильно контрастирует с соседними гласными. Отрезок соответствующий взрыву выделить довольно трудно из-за его краткой длительности. Глухая смычка согласного которая характеризуется отсутствием какого-либо источ­
ника звука, отображается отрезком имеющим нулевую амплитуду. Отрезок соответствует взрывному отступу [к], в котором при большем масштабе рассмотрения можно было бы выделить несколько импульсов и последующую турбулентную фазу. Однако далеко не все речевые отрезки имеют звуковую структуру, которая так просто отражается на осциллограмме. Для сопоставления на рис. приведе­
на осциллограмма слова малина, в котором все звуки обра-
145 Глава 3. Акустика речи Рис. 3.19. Осциллограмма слова малина зованы с помощью голосового источника. Здесь тоже мож­
но наметить границы между звуками, опираясь на различия в амплитуде и зная, что сонорные согласные обычно менее интенсивны, чем гласные. Очевидно, однако, что границы на этой осциллограмме менее резкие и отчетливые (см. ни­
же рис. на котором приводится членение осциллограм­
мы и спектрограммы этого слова). Существенный недостаток осциллограмм состоит в том, что по ним трудно, а порой и невозможно определить акустические характеристики, которыми звуки одного клас­
са (с одним и тем же источником) отличаются друг от дру­
га. Такие характеристики задаются передаточной функцией речевого тракта и могут быть получены только из спектраль­
ного представления речевого сигнала. 3.3.2. Спектральное представление речевого сигнала Спектрограммой (от лат.
spectrum
"видимое" грамма "запись") называется графическое изображение спектра зву­
ковых колебаний. В акустической фонетике рассматривают­
ся только амплитудно-частотные спектры звуков
P(f)
и соот­
ветствующие им Такие спектрограммы по­
казывают относительную амплитуду (или интенсивность) частотных составляющих звука или, что то же самое, распре­
деление общей энергии звукового колебания по частотам. О роли фазовых характеристик составляющих сложного звука говорится в приложении. 146 3.3. Методы и средства акустического анализа речи Качественные различия между звуками отражаются прежде всего в их амплитудно-частотных спектрах. До не­
давнего времени для получения спектров использовались с помощью которых осуществлялся спектральный анализ электрической копии речевого сигна­
ла, непрерывной по своей природе. Сейчас для этого приме­
няются компьютеры и специальные программы обработки оцифрованной звуковой речи. С их помощью могут быть по­
лучены спектрограммы разного типа в зависимости от кон­
кретных задач исследования. В основе этих программ лежат те же принципы обработки речевого сигнала, что и в спект-
роанализаторах, однако объектом обработки является оциф­
рованная копия речевого сигнала, представленная отдельны­
ми временными отсчетами. Компьютерная спектрограмма может быть визуализована на экране монитора как отдель­
но, так и одновременно с осциллограммой. Мгновенные и динамические спектрограммы Мгновенные и динамические спектрограммы отлича­
ются друг от друга величиной отрезка речевого сигнала, спектр которого они отражают. Мгновенная спект­
рограмма
часто называемая просто или спек­
тральным срезом, представляет собой амплитудно-частот­
ный спектр сигнала, усредненный по небольшому времен­
отрезку (его величина зависит от выбранного режима спектрального анализа; обычно она равна мс). Спект­
ральные характеристики сигнала на таком маленьком вре­
менном интервале считаются относительно постоянными. В речи спектральная картина меняется достаточно бы­
стро, поэтому возникает необходимость либо строить много спектральных срезов и анализировать изменения, которые происходят в их последовательности, либо использовать та­
кой метод спектрального анализа, который позволил бы до­
статочно детально и непрерывно отслеживать динамику из­
менения спектральной картины речи во времени. Принци­
пы подобного метода, получившего название динамической спектрографии, и необходимая аппаратура были разработа-
Описание разных типов можно найти в 1977] и в [Деркач и др. 1983]. Компьютерные возможности спектрального анализа речи освещаются в [Златоустова и др. 1997]. 147 Глава 3. Акустика речи ны в 1946 г. в США
et 1946], и это стало важным событием для фонетической науки. Чуть позже американ­
ские исследователи Р. Г. Копп и Г. Грин опублико­
вали книгу под названием "Видимая речь"
[Potter et al. в которой впервые были представлены динамические спектрограммы звуков, слогов, слов и фраз английского и ряда других языков. С помощью метода динамической спек­
трографии были получены все серьезные результаты в аку­
стической фонетике, а современные фонетические учебники содержат обычно много динамических спектрограмм в каче­
стве иллюстративного материала. Динамическая спектрограмма — это трехмерное спект­
рально-временное изображение речевого сигнала. Горизон­
тальная ось изображения соответствует времени, вертикаль­
ная — частоте колебаний, а различия в интенсивности спек­
тральных составляющих отражаются в степени затемнения (яркости) изображения в соответствующих частотных облас­
тях. Динамические спектрограммы могут изображаться и в виде действительно трехмерных картинок, где интенсивно­
сти соответствует своя координатная ось. Однако в фонети­
ческой практике подобные трехмерные картинки использу­
ются редко. Динамические спектрограммы в их классическом вари­
анте не дают представления о точных значениях интенсив­
ности спектральных составляющих на отдельных участках речевого сигнала. Для получения этой информации прихо­
дится обращаться к спектральным срезам. По срезу можно получить спектральную огибающую для анализируемого от­
резка сигнала, в которой выделяются отчетливые резонанс­
ные максимумы. Их относительная интенсивность может быть точно измерена. Современные средства спектрального анализа речи, в том числе компьютерные, дают возможность получать как динамические спектрограммы, так и мгновен­
ные спектры. Узкополосные и широкополосные спектрограммы Различие между узкополосными и широкополосными спектрограммами связано с характеристикой основного тех­
нического элемента спектроанализатора — полосой пропус­
кания анализирующего фильтра. В приборных спектроанализаторах фильтр представля­
ет собой электрический резонатор, функционирование кото-
148 3.3. Методы и средства акустического анализа речи подчиняется законам резонансных колебаний. Для ана­
лиза используются так полосовые Полосой пропускания называется разность между макси­
мальной и минимальной частотами, пропускаемыми фильт­
ром. Полосовой фильтр функционирует подобно простому акустическому резонатору. Если на вход фильтра подается сложное колебание, то на выходе получается колебание, со­
стоящее только из тех составляющих входного колебания, частоты которых попадают в полосу пропускания фильтра. Чем шире эта полоса, тем больше исходных частотных со­
ставляющих пропускает фильтр, и наоборот. Составляющие входного колебания, частоты которых не попадают в полосу пропускания, сильно подавляются. Колебания, прошедшие через фильтр, преобразуются в электрическое напряжение, значение которого равняется их суммарной интенсивности. Напряжение с выхода фильтра подается на регистрирующее устройство, которое позволяет зафиксировать результат фильтрации на электрочувствительной бумаге или пленке. В процессе спектрального анализа частотное положе­
ние полосового фильтра изменяется в диапазоне, величина которого определяется конкретными задачами акустическо­
го анализа. При анализе гласных диапазон анализируемых частот обычно выбирается от 0 до 5 кГц. Если же требуется получить данные для всех звуков, в том числе для высокоча­
стотных фрикативных согласных, этот диапазон расширяет­
ся до 8-10 кГц. Принцип работы полосового фильтра, кото­
рый можно рассматривать как окно спектрального анализа, сдвигающееся по оси частот, схематически на рис. 3.20. Компьютерные программы спектрального анализа основаны на вычислительных процедурах, которые позволя­
ют получать результаты, аналогичные полосовой фильтра­
ции сигнала. Полоса пропускания фильтра, или его ширина
B(f),
ха­
рактеризует разрешающую способность спектроанализатора по частоте или, иначе, его способность разделять спектраль­
ные составляющие, имеющие близкие частоты. Различия между узкополосными и широкополосными спектрограмма­
ми особенно отчетливо проявляются при анализе периоди­
ческих звуков, имеющих гармоническую структуру, т. е. Краткая характеристика основных типов фильтров дается в п. 3.4. прило­
жения. 149 Глава 3. Акустика речи Рис. 3.20. Полосовая фильтрация рече­
вого сигнала гласных и сонорных согласных. Если ширина фильтра мень­
ше расстояния между гармониками голосового источника, фильтр будет выделять каждую отдельную гармонику анали­
зируемого сигнала. Если же ширина фильтра больше этого расстояния, фильтр будет выделять все соседние гармоники, частоты которых попадут в полосу пропускания. Рис. 3.21 иллюстрирует различия в разрешающей способности по ча­
стоте узкополосного (45 Гц) и широкополосного (300 Гц) фильтров на примере анализа сложного периодического зву­
ка с основной частотой 100 Гц. В фонетических исследованиях узкополосный спект­
ральный анализ обычно осуществляется с помощью фильт­
ра шириной 45 Гц. Основная частота голоса у людей, даже у мужчин с очень низким голосом, почти никогда не бывает меньше 50 Гц. такой фильтр позволяет полу­
чать информацию об отдельных гармониках речевого сигна­
ла для любого говорящего. Узкополосные спектрограммы удобны при анализе изменений основной частоты голоса, т. е. прежде всего в интонационных исследованиях. Однако они не очень подходят для анализа спектральных различий между звуками речи, так как гармоническая структура спек­
тра затемняет его формантную картину. При широкополосном спектральном анализе обычно используют фильтр шириной 300 Гц. Фильтр с такой шири­
ной полосы не выделяет отдельных гармоник в сигнале, ес­
ли основная частота не превышает 300 Гц, что характерно 150 3.3. Методы и средства акустического анализа речи Рис. 3.21. Разрешающая способность по частоте узкого и широкого полосовых фильтров для большинства мужских голосов. Это дает возможность более отчетливо выявить речевого сигнала, по­
скольку учитывается суммарная составляющих, ко­
торые попадают в область резонансных усилений речевого тракта. К сожалению, для высоких женских голосов фильтр шириной 300 Гц может дать смешанную формантно-гармо-
ническую картину, фонетическая интерпретация которой значительно усложняется. Поэтому большинство исследова­
ний в акустической фонетике выполнено на материале муж­
ского произнесения. С шириной фильтра тесно связана еще одна особен­
ность спектрального анализа, но уже во временной области. Для любого фильтра необходимо определенное время, чтобы сформировался выходной сигнал в ответ на внешнее воздей­
ствие. Это время приблизительно обратно пропорционально ширине фильтра; оно характеризует разрешающую способ­
ность анализатора по времени. Узкий фильтр с полосой 45 Гц имеет время реакции равное приблизитель­
но 20 мс, а широкий фильтр с полосой 300 Гц - 3 Та­
ким образом, разрешающие способности фильтра по часто­
те и времени находятся в обратных отношениях: широкий (тупой) резонатор — быстрый, а узкий (острый) резонатор — медленный. Интуитивно понятно, что точность в определе­
нии частоты колебаний требует большего времени наблюде­
ния за сигналом. Поэтому при спектральном анализе речи приходится выбирать характеристики фильтров в зависимо-
151 Глава 3. Акустика речи 3.22. Широкополосная динамиче­
ская спектрограмма и узкополосный спектральный срез (2) для английского гласного [х] ста от задач исследования. Чтобы проанализировать измене­
ния в основной частоте голоса, важно надежно выделить первую гармонику сигнала, частота которой меняется отно­
сительно плавно. Медленная узкого фильтра в этом случае не существенна. В то же время для анализа спект­
ральных различий между звуками в потоке речи, в частности для получения нужен быстрый анализатор, так как спектральная картина меняется достаточно быстро. Быстрое время реакции широкого фильтра позволяет получать информацию и о частоте основного тона сигнала, однако в иной форме, чем на узкополосных спектрограммах. А именно: на вокальных участках широкополосных спектро­
грамм обычно видна отчетливая и регулярная вертикальная штриховка по оси времени, которая отражает реакцию фильтра на последовательные периоды звуковой волны. Рас­
стояние между штрихами равно периоду голосовых колеба­
ний. Это хорошо видно на рис. 3.22, который иллюстрирует наиболее популярные типы спектрограмм, используемых в акустическом анализе речевых звуков (по а1. 1980: Одна из важнейших задач спектрального анализа со­
стоит в чтобы выявить и охарактеризовать формантную картину речевых отрезков. Как уже говорилось, на широко­
полосной динамической спектрограмме энергетический вклад частотных составляющих в общую энергию звуковых 152 3.3. Методы и средства акустического анализа речи Рис. 3.23. Отражение звука в гармоническом спектре гласного колебаний отражается в яркости изображения соответствую­
щих частотных областей. В частности, в черно-белом вари­
анте спектрограмм форманты изображаются как довольно широкие темные полосы, расположение которых относи­
тельно оси частот указывает на области концентрации энер­
гии. Однако нужно иметь в виду, что ширина темной поло­
сы, соотносимой с формантой, определяется полосой анали­
зирующего фильтра, а не шириной самой форманты. Поэто­
му точное значение частоты форманты по широкополосной спектрограмме установить нельзя. Обычно в качестве пока­
зателя частоты форманты выбирается значение, соответству­
ющее центру темной полосы. На узкополосных спектральных срезах звука можно определить по амплитудным максимумам (пикам) спектральной огибающей, частотное положение как правило, совпадает с резонансами передаточной функ­
ции тракта. Однако это не всегда просто сделать даже для гласных, образование которых характеризуется наиболее прямой связью между пиками спектральной огибающей и формантами передаточной функции. Дело в том, что спектр гласного задается как гармоническим спектром голосового источника, так и передаточной функцией тракта. Частота форманты (характеристика передаточной функции) не обя­
зательно совпадает с частотой какой-либо гармоники глас­
ного (характеристика голосового источника). Поэтому на спектральном срезе гармоника, образующая выраженный локальный пик, только с некоторым приближением указы­
вает на частотную область формантного усиления. Величина ошибки, с которой частота форманты может быть определе-
153 Глава 3. Акустика речи J
1 1 1 msec
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900 3.24. Широкополосная (а) и узко- ной спектрограмме выделена десятая полосная (б) динамические спектро- гармоника сигнала, которая в десяти-
граммы английской вопросительной кратном увеличении воспроизводит из-
фразы
Is Pat sad,
от
На узкополос- менение основной частоты голоса на по максимумам гармонического спектра, пропорциональ­
на расстоянию между последовательными гармониками (т. е. основной частоте голоса) и имеет порядок [Фант Таким образом, точность определения гласного по срезу зависит от плотности спектральных линий, т. е. от основного тона голоса. Это одна из главных причин, по ко­
торой в акустических исследованиях предпочитаются муж­
ские произнесения. Сложная картина отражения формант-
частот в гармоническом спектре гласного иллюстриру­
ется рис. 3.23. На рисунке видно, что частоты (формант) и частотное положение амплитудных максимумов в спектре гласного отождествлять, строго говоря, не следует. Однако если плотность спектральных линий достаточно велика, это различие становится незначительным. Поэтому в фонетиче­
ской литературе термин "форманта" нередко употребляется 154 3.3. Методы и средства акустического анализа речи для обозначения как резонансных частот тракта, так и амп­
литудных пиков в спектре вокального звука. Что же касается локусной Р-картины согласных, то ус­
тановить ее по единичному спектральному срезу практически невозможно. Скрытые формантные локусы реконструируют­
ся только с учетом Р-картины соседних вокальных звуков. Заканчивая обсуждение методов акустического анализа речи, приведем в качестве иллюстрации широкополосную и узкополосную динамические спектрограммы целой фразы (рис. 3.24 по 1982: На рисунке видно, что широкополосная спектрограмма не только хорошо выявляет форматную картину речевого сигнала, но столь же наглядно показывает различия в источ­
никах звука, нисколько не уступая в этом осциллограмме. Отсюда понятно, почему именно этот тип спектрограмм ши­
роко используется в акустической фонетике. Важно также и то, что благодаря связи между артикуляцией и акустикой ре­
чи широкополосные спектрограммы могут применяться для получения сведений о динамике речевых движений, что очень трудно сделать даже с помощью современных техни­
ческих средств артикуляционного анализа. 3.4. Акустические характеристики основных классов звуковых единиц С акустической точки зрения различия между звуками речи могут быть обусловлены как типом источника, так и характеристиками резонаторной системы речевого тракта. Эти различия находят непосредственное отражение в резуль­
тирующих звуковых спектрах, которые являются основой слуховых контрастов между звуками. Важными акустически­
ми параметрами звука являются также длительность и ин­
тенсивность, однако их роль в создании звуковых противо­
поставлений вторична. При акустическом анализе звуков речи приходится ре­
шать две проблемы. Во-первых, прежде чем изучать акусти­
ческие свойства тех или иных звуковых единиц, необходимо выделить в сигнале фрагменты, которые им соответствуют, т. е. осуществить фонетическую сегментацию сигнала. Во-
вторых, нужно определить, какие акустические свойства зву­
ка порождаются его собственными артикуляционными при-
155 Глава 3. Акустика речи знаками, а какие зависят от фонетического контекста: сосед­
них звуков, а также супрасегментных характеристик речево­
го сообщения — словесного ударения, ритма речевого отрез­
ка, интонации и т. д. Рассмотрим эти проблемы и пути их решения. Фонетическая сегментация речевого сигнала Обычно сегментация речевого сигнала осуществляется фонетистом, которому известно, что было произнесено. Это предварительное знание облегчает задачу сегментации, так как дает возможность использовать сведения об акустиче­
ских свойствах звуков для их вычленения в сигнале: искать всегда легче, если известно, что должно быть найдено. Важ­
но также, что современные компьютерные средства позволя­
ют одновременно работать с осциллограммой и спектро­
граммой сигнала, а также прослушивать любые его фрагмен­
Акустическая теория речеобразования выделяет два компонента звукообразования, в которых можно искать опору для членения речевого сигнала: источники звука и пе­
редаточную функцию речевого тракта. При анализе осциллограмм можно видеть, что физиче­
ская речевого сигнала определяется прежде всего различиями в источниках звука. То же самое верно и для спектрограмм. Однако в результате акустической сегментации по источникам звука в сигнале может быть выделено такое количество фрагментов, которое в общем случае не обяза­
тельно совпадает с количеством звуков в речевом отрезке. С одной стороны, будут выделяться фрагменты, которые явля­
ются акустическими частями одного и того же звука, напри­
мер, глухая пауза и шумовой компонент для звука [к] в слове собака (см. рис. В большинстве случаев это несоответ­
ствие легко устранить, зная артикуляционно-акустические признаки звуков. С другой стороны, при использовании од­
ного и того же источника большие фрагменты акустического сигнала могут оказаться по этому критерию нерасчлененны-
ми, как это имеет место, например, для слова малина. В этом случае более надежной опорой акустического членения являются изменения в передаточной функции тра­
кта, которые фиксируются на широкополосной спектро­
грамме в виде быстрой перестройки в распределении энер-
156 3.4. Акустические характеристики основных классов звуковых единиц Рис. 3.25. Членение осциллограммы и спектрограммы слова малина гии по частотам. На осциллограмме им часто соответствуют более или менее резкие перепады в общей интенсивности сигнала. Членимость на основе изменения передаточной функции наиболее отчетлива в тех случаях, когда фильтро­
вые свойства тракта меняются резко, как это происходит, например, при раскрытии ротовой смычки на границе носо­
вого согласного и ротового гласного (рис. 3.25). Чем более плавно меняются характеристики системы резонаторов при артикуляции соседних звуков, тем труднее установить физические границы между ними. Поэтому наи­
большие трудности возникают при сегментации сигналов, соответствующих последовательностям гласных и сочетани­
ям гласных с неносовыми сонорными согласными. В подоб­
ных случаях правильнее говорить о наличии в сигнале неко­
торой пограничной зоны, чем о границе в какой-то конкрет­
ной точке. Отсутствие четкой границы подтверждается и при прослушивании указанных последовательностей: даже на 157 Глава 3. Акустика речи слух часто оказывается невозможным точно определить, где кончается один звук и начинается другой. Таким образом, при сегментации сигнала возможны случаи, когда выбор границы связан со значительной степенью условности. 3.4.2. Зависимость акустических характеристик звуков от контекста Исследование акустических свойств звуков было бы значительно более простой задачей, если бы эти свойства не зависели от фонетического контекста, т. е. если бы звуки об­
ладали акустической инвариантностью. Однако, как было показано в главе 2, характерной особенностью артикуляци­
онного процесса является коартикуляция (артикуляционное взаимодействие между звуками) и артикуляционная редук­
ция (недостижение речевыми органами целевого состояния, требуемого звуком). Эти артикуляционные явления находят непосредственное отражение в изменениях конфигурации речевого тракта, а значит, и в его передаточной функции и спектральной картине звуков. Укажем наиболее важные аку­
стические следствия. В пределах звукового сегмента не всегда можно вы­
делить участок с устойчивыми, мало изменяющимися спек­
тральными характеристиками (стационарный участок, соот­
ветствующий артикуляционной выдержке). Недостижение артикуляционной цели приводит к недостижению целевого акустического эффекта и изменениям в слуховом качестве звука. 2. Даже если стационарный участок звука может быть выделен, его спектральные характеристики могут зависеть не только от него самого, но и от артикуляционных призна­
ков его соседей. 3. Наличие переходных артикуляционных состояний, совмещающих черты конечной и начальной фаз соседних звуков, приводит к образованию в спектрах соседних звуков переходных участков с быстро меняющейся спектральной картиной. В сочетаниях "согласный - гласный" и "гласный - со­
гласный" на начальных и конечных участках гласных отчет­
ливо видны формантные переходы, обусловленные коарти-
куляцией. Это, однако, не означает, что коартикуляция не распространяется на согласный. Анализируя частотно-изби-
158 3.4. Акустические характеристики основных классов звуковых единиц рательные свойства тракта, мы уже отмечали, что характери­
стики передаточной функции при произнесении большинст­
ва согласных таковы, что низкочастотная часть т. е. и либо полностью отсутствует в спектре соглас­
ного, либо сильно подавлена. В интервале таких согласных скрыты или плохо видны именно те форманты, по которым можно было бы проследить влияние гласного на артикуля­
цию соседнего согласного. Однако формантные ло-
кусы согласных можно восстановить, ориентируясь на пове­
дение формант соседних гласных и следы этих формант в спектре самого согласного. Специальный анализ показыва­
ет, что локусные частоты согласных, прежде всего не только влияют на направление и величину формантных переходов на граничных участках гласного, но и сами зави­
сят от качества соседних гласных. В реальной речи вариативность акустических свойств звуков не исчерпывается контекстными влияниями, хотя это, возможно, один из самых сильных факторов. Спект­
ральная картина гласных варьирует в гораздо большей сте­
пени, чем характеристики согласных. В то же время гласные могут быть легко произнесены вне что дает воз­
можность выявить идеализированную на созда­
ние которой направлена их целевая артикуляция. Отталки­
ваясь от таких статических целевых можно про­
анализировать систематические изменения, которым они подвергаются в зависимости от фонетического контекста и прочих факторов. Акустический анализ согласных удобнее начинать с идеализированных контекстов, соответствующих их произ­
несению перед или между гласными. В качестве такого "от­
правного" вокального контекста чаще всего выбирается квантальный гласный [а], поскольку в силу своих артикуля-
ционно-акустических свойств он оказывает наименьшее влияние на спектральные характеристики согласного. Далее в качестве иллюстративного материала мы будем использовать осциллограммы и широкополосные динамиче­
ские спектрограммы звуков русского и английского языков в мужском произнесении. Это не распространяется на безударные гласные в языках типа русского. 159 Глава 3. Акустика речи 3.4.3. Акустические характеристики гласных Гласные произносятся с участием голосового источни­
ка, который создает периодичность звуковой волны и гармо­
ническую структуру спектра. Качественные различия между гласными определяются
F
-картиной, точнее, взаимным рас­
положением частот первых трех формант, из которых наи­
большую значимость для восприятия имеют
и
F
-кар-
тина связана с артикуляционными признаками гласных до­
статочно сложными соотношениями, о чем уже говорилось выше при обсуждении резонансных свойств речевого тракта. В то же время общие тенденции формулируются просто. Ча­
стота
F1
обратно пропорциональна подъему гласного: чем больше подъем и закрытость гласного, тем меньше
и на­
оборот. Частота
F2
прямо пропорциональна языка: чем более передним является гласный, тем больше
и наоборот. Округление и вытягивание губ при произнесе­
нии лабиализованных гласных понижают частоту обеих фор­
мант, в особенности
F2. В языках, которые используют более тонкие различия гласных по подъему и ряду, чем в русском языке, действу­
ют те же соотношения между
F
-картиной и артикуляцией. Показательна в этом отношении спектральная картина гласных английского языка, которая отражает только описанные выше зависимости, но и тот факт, что язык, опускаясь, одновременно смещается назад, в результате че­
го сужается проход в фарингальной полости. Это особенно заметно при рассмотрении нелабиализованных гласных пе­
реднего ряда
[i], [е], [е], [аз] (рис. 3.26, по
et al. 1980: F
-картину гласных можно представить несколько ина­
че, расположив точки, соответствующие разным гласным, в пространстве частот
F1
и
F2,
как это показано для англий­
ских гласных на рис. 3.27 (по
[Borden et al.
Такое представление очень похоже на традиционное для фонетики Напомним, что абсолютные значения формантных частот зависят от раз­
меров речевого тракта говорящего. Поэтому, говоря об глас­
ных, имеют в виду взаимное расположение формант по частоте или их расположение относительно границ пространства говоряще­
го, а не абсолютные значения. В нашем иллюстративном материале абсо­
лютные значения формантных частот следует рассматривать лишь как ориентиры, достаточно типичные для мужского голоса. 160 3.4. Акустические характеристики основных классов звуковых единиц Рис. 3.26. Фо рма т на я картина гласных английского языка. Точками показано примерное расположение первых трех фо р ма т гласного изображение гласных в виде "трапецоида" (см. главу 5), на­
глядно демонстрируя связь между артикуляционными и аку­
стическими признаками. В речевом сообщении гласные обычно произносятся в сочетаниях с согласными, и их формантная картина подвер­
гается систематическим контекстным изменениям. Наиболее сильно влияют на гласные такие признаки согласных, как место образования преграды и дополнительные вокалические артикуляции (палатализация, веляризация и т. п.), так как от них сильно зависит конфигурация речевого тракта. Характеристики формантных переходов гласных (на­
правление и величина смещения частоты формант) опреде­
ляются соотношением локусных частот соседних согласных и гласных, а также степенью их коартикуляционного взаи­
модействия. Коартикуляционные эффекты заметнее всего проявляются на динамике поскольку частота этой фор­
манты наиболее тесно коррелирует с местом сужения в ре­
чевом тракте. На рис. 3.28 в качестве иллюстрации приведе­
ны схематические изображения русских гласных после твердых и мягких согласных разного места образова­
ния (по [Бондарко 161 Глава 3. Акустика речи Гласные (при про­
чих равных условиях) имеют также некоторые различия в собственной длительности, интенсив­
ности и основной часто­
те. Общие закономерно­
сти здесь таковы: чем бо­
лее открытым и по подъему является гласный, тем больше его длительность и интенсив­
ность, и тем ниже его средняя основная часто­
та. Среди гласных самы­
3.27. Основные гласные английского языка в пространстве формант Рис. 3.28. Изменение частоты и русских гласных после разных соглас­
162 4. характеристики основных классов звуковых единиц ш ш ш [б] И 3.29. Осциллограммы и спектро­
граммы русских взрывных согласных [к] и [г] ми длительными и интенсивными являются гласные. Наименее длительны и интенсивны и гласные. Указанные различия относительно невелики и в значительной степени "затемняются" действи­
ем более сильных просодических факторов: темпом речи, интонационным и ритмическим рисунком сообщения, сте­
пенью ударности гласного и т. п. 3.4.4. Акустические характеристики шумных согласных Шумные взрывные Согласные этого класса имеют динамически сложную артикуляцию, которой в сигнале соответствует последова­
тельность из двух участков: участка, соотносимого с артику-
Глава 3. Акустика речи ляционной смычкой, я шумового отрезка. Это хорошо видно как на осциллограммах, так и на спектрограммах взрывных согласных. На рис. 3.29 (с. 163) приведены спектрограммы русских взрывных согласных [п], [к] и [б], [д], на ко­
торых выделены участки смычек и шума Соглас­
ные произносились в одинаковом интервокальном контексте. Акустические характеристики интервала смычки При произнесении глухих согласных интервал смычки не несет никакой энергии. Акустически — это пауза, в тече­
ние которой не работает ни один источник звука и звуковые колебания отсутствуют. Такой отрезок сигнала иногда назы­
вают (от англ. слова
stop,
которым в англоязыч­
ной фонетической литературе обозначаются взрывные сог­
ласные). Когда глухой согласный произносится в начале фразы, соответствующую ему стоп-паузу невозможно отде­
лить от паузы молчания, предшествующей началу произне­
сения. То же самое происходит, когда согласный произно­
сится в конце фразы, если по каким-то причинам оказыва­
ется нереализованным его шумовой интервал. В позиции между вокальными звуками на начальном участке смычки у глухого взрывного нередко можно наблюдать 2-3 вокальных периода с резко ослабленной амплитудой. Подобное частич­
ное озвончение объясняется тем, что в момент смычки в области голосовой щели, расширяющейся для об­
разования глухого согласного, имеется перепад давлений, который поддерживает фонацию. Как только этот перепад становится недостаточным, голос исчезает. При произнесении звонких согласных на интервале смычки голосовые связки обычно колеблются, порождая глоттальную волну. На широкополосной спектрограмме на­
личие голоса фиксируется в виде темной полосы в самой низкой части спектра — в области частоты основного тона. Это так называемая голосовая полоса (англ.
voice Она может иметь вертикальную штриховку, отражая периодич­
ность голосового источника. При реализации звонкой смыч­
ки звук излучается только через шею и щеки. Это приводит к значительным потерям звуковой энергии, так что в излу­
чаемом сигнале остаются только самые интенсивные ниж­
ние гармоники. В связи с этим акустический участок звон­
кой смычки называют также звонкой паузой. Малая интен-
164 характеристики основных классов звуковых единиц сивность звонкой паузы особенно хорошо видна в соседстве с гласными (см. рис. 3.29). Колебания голосовых связок в интервале смычки воз­
можны только при условии достаточного перепада давления под и над связками. При его уменьшении ниже некоторой критической величины колебания прекращаются, и смычка звонкого согласного полностью или частично Так как частота колебаний связок тоже зависит от перепада давлений, основная частота голоса на звонких смычках ав­
томатически понижается. В потоке речи длительность смычек взрывных соглас­
ных очень сильно варьирует (примерно от 30 до 120 мс). При прочих равных условиях длительность смычек у глухих согласных несколько больше, чем у звонких. характеристики шумового интервала При произнесении взрывных согласных за интервалом смычки обычно следует участок шума. Он может отсутство­
вать, если в момент размыкания речевых органов избыточное давление позади смычки Это нередко наблю­
дается у звонких губных согласных типа русского [б] из-за большого объема ротовой полости, особенно в таких фонети­
ческих условиях, которым сопутствует уменьшение подсвязоч-
ного давления и/или сокращение длительности согласного. Шумовой участок, следующий за интервалом смычки, как правило, акустически неоднороден. Обсуждая свойства импульсного источника в речи, мы отмечали, что при про­
изводстве взрывных согласных за собственно взрывом, воз­
никающим в результате быстрого спада избыточного давле­
ния в момент раскрытия смычки, обычно следует шум фри-
кации. Он образуется из-за того, что смычка размыкается хотя и быстро, но не мгновенно: пока сужение в месте смычки еще мало, происходит турбулентное шумообразова-
ние. При произнесении глухих взрывных дальнейшее рас­
при артикуляции звонких шумных согласных перепад давления в облас­
ти голосовой щели, необходимый для образования голоса, может поддер­
живаться движениями, которые увеличивают объем фарингальной полос­
ти: понижением гортани, сдвигом корня языка вперед и/или расслаблени­
ем мускулатуры щек и стенок фаринкса. Звонкость смычек может поддер­
живаться также расслаблением голосовых связок. Без таких движений фо­
нация при наличии смычки могла бы продолжаться не более 60 мс 1983]. 165 Глава 3. Акустика речи взрыв согласного; фрикативный участок; аспирация; начало гласного Время (мс) О 20 40 Рис. 3.30. Схематическое представление акустической картины шумового участ­
ка при произнесении глухого взрывно­
го согласного ширение воздушного прохода в месте смычки может приве­
сти к появлению шума аспирации. Аспиративный шум соз­
дается в открытой голосовой щели из-за увеличения скоро­
сти воздушного потока, проходящего через щель. Возможная последовательность акустических событий в фазе рекурсии глухого взрывного согласного иллюстрируется рис. 3.30 (по [Stevens
Степень выраженности и длительность различных ви­
дов шума в интервале рекурсии взрывного согласного зави­
сят от скорости размыкания смычки и состояния голосовой щели. На динамической широкополосной спектрограмме взрыв согласного выглядит как узкая вертикальная линия, следующая непосредственно за интервалом смычки — стоп-
паузой или голосовой За взрывом идет участок, Обнаружение взрыва в сигнале требует от спектрального анализатора хо­
рошей разрешающей способности во времени. Акустические характеристики основных классов звуковых единиц Рис. 3.31. Простой [т] и аффрицирован-
ный в русском языке спектральная картина которого аналогична шуму фрикатив­
ного согласного того же места образования. Если смычка раскрывается медленно, импульсная (взрывная) фаза в шу­
ме взрывных согласных может быть смазана или даже отсут­
ствовать. В этом случае акустическая картина шума взрыв­
ных сближается с аффрикатами. Взрывные согласные, у ко­
торых шумовой участок содержит выраженный и длитель­
ный участок фрикативного шума, называют Сильная аффрицированность шума наблюдается, на­
пример, при произнесении мягких (палатализованных) пе­
реднеязычных взрывных в русском языке, особенно в пози­
ции перед гласными. Это видно на рис. 3.31, где представ­
лены осциллограммы и спектрограммы взрывных [т] и в звукосочетаниях и Взрывные согласные, при произнесении которых аспи-
ративный шум существенно превышает по длительности фрикации, называются Типичный пример реализации длительного аспиративного шума в фазе рекурсии дают глухие взрывные согласные английского язы-
167 Глава 3. Акустика речи ка в позиции перед ударными гласными (не после согласно­
го
В зарубежной фонетической литературе для описания различий между взрывными согласными в позиции перед вокальными звуками используется признак задержки голоса относительно момента взрыва согласного" (англ. voice onset time,
сокращенно
Этот признак учитывает состояние голосовой щели в момент размыкания смычки. При произнесении аспирированных взрывных голосовая щель в момент раскрытия смычки широко открыта. Это приводит к значительной задержке голосообразования, поя­
влению аспиративного шума и увеличению длительности шумового интервала по сравнению с простыми (неаспири-
рованными) взрывными
[Lisker, 1964]. Артикуляционно-акустическая неоднородность шумо­
вого интервала взрывных согласных находит отражение в различных акустических характеристиках: длительности, ин­
тенсивности и спектре шума. При произнесении простых взрывных шумовая фаза имеет небольшую длительность, обычно около 40-60 мс; при этом длительность собственно взрыва не превышает 3-5 мс. У аффрицированных и аспирированных согласных общая длительность шума существенно больше и может доходить до мс. Длительность шумового участка всех типов взрывных (простых, аффрицированных, аспирированных) в определенной степени зависит от места образования и глу­
хости/звонкости согласного. Основные тенденции здесь сле­
дующие: глухие обычно имеют более длительный шумовой участок, чем звонкие того же типа и места образования; дли­
тельность шумового интервала обратно пропорциональна удаленности преграды от голосовой щели. Полярными пред­
ставителями различий по длительности шума у взрывных со­
гласных являются звонкий губной согласный типа русского [б] и глухой аспирированный велярный согласный типа ан­
глийского
Интенсивность взрывной фазы и всего шумового ин­
тервала определяется теми же тенденциями, что и длитель­
ность. Спектральные характеристики шумового участка при образовании взрывных согласных задаются свойствами резо-
наторной системы речевого тракта, действующей в фазе ре­
курсии. В момент взрыва и сразу после него речевой тракт 168 Акустические характеристики основных классов звуковых единиц а — билабиальные; б — альвеолярные; с — велярные согласные Частота Рис. 3.32. Спектры взрывов для про­
стых взрывных согласных разного мес-
та образования представляет собой расчлененный резонатор с незначитель­
ной акустической связью между полостями, разделенными преградой. Результирующий спектр звука в этом случае за­
висит главным образом от размеров полости, находящейся перед преградой (источником шума). Из этого следует, что спектры взрывов и фрикативных участков у взрывных сог­
ласных должны быть тесно связаны с артикуляционными различиями по месту образования преграды. Для столь коротких отрезков сигнала, как взрывы, на­
дежные экспериментальные сведения о спектрах получить трудно. В литературе обычно приводятся усредненные дан­
ные для небольшого участка сигнала, который включает собственно взрыв и непосредственно следующий за ним фрагмент фрикативного шума. На рис. 3.32 [Kent, Read приведены усредненные спектры таких участков для согласных разного места образования, полученные на английском материале. Рисунок показывает, что взрывы губ­
ных согласных характеризуются плоским спектром, спадаю­
щим к высоким частотам. Так выглядит спектр шумового источника, который не модифицирован резонаторной систе­
мой речевого тракта. Альвеолярные взрывные характеризу­
ются наличием небольшой полости впереди преграды. Это 169 Глава 3. Акустика речи приводит к усилению спектральных составляющих источни­
ка шума в области высоких частот, соответствующих или гласных. Велярные согласные, при произнесении кото­
рых передняя полость существенно больше, характеризуют­
ся взрывами, в спектре которых усилены средние частоты, обычно в области или гласного. В потоке речи место язычной преграды при образовании велярных приспосабли­
вается (аккомодирует) к ряду последующего гласного. Поэ­
тому в спектре взрыва велярного, за которым следует глас­
ный переднего ряда, усиление будет наблюдаться в окрест­
ности гласного, а в остальных случаях — в окрестно­
сти Коартикуляция и связь спектральной картины сог­
ласных с длиной передней полости приводят также к тому, что спектры взрывов зависят от огубленности последующих гласных. взрывных согласных Разделение резонаторной системы тракта, обусловлен­
ное наличием смычки, в процессе ее размыкания и расши­
рения артикуляционного прохода постепенно ослабевает. Как только ширина прохода становится достаточно боль­
шой, в спектральной картине сигнала появляются усиления в области формантных частот, характеризующих резонатор­
ную систему тракта в целом. Возбуждение резонансных ко­
лебаний в этой фазе артикуляции взрывных согласных мо­
жет осуществляться только такими источниками, которые расположены в гортани: аспиративным шумом или голосом. На широкополосных спектрограммах сочетаний взрыв­
ных согласных с гласными на участке аспиративного шума (в случае сильно аспирированных согласных) или начальном участке гласного (после неаспирированных согласных) поя­
вляются формантные переходы, которые отражают пере­
стройку артикуляторов и изменения в форме речевого трак­
та. Длительность переходов составляет приблизительно 40­
50 На рис. 3.33 приведены идеализированные схемы пе­
реходов и для часто встречающихся сочетаний звон­
ких взрывных согласных с гласными (по а1. В сочетаниях "гласный­взрывной согласный" наблю­
даются симметричные, хотя и не всегда тождественные, из­
менения формантных частот, которые видны на конечном участке гласного. 3.4. Акустические характеристики основных классов звуковых единиц Рис. 3.33. Переходы и в сочетани­
ях звонких взрывных согласных с глас­
ными Рис. 3.34. для альвеолярного согласного в позиции перед разны­
ми гласными 171 Глава 3. Акустика речи Мы уже не раз отмечали, что наблюдаемые ные переходы являются основой реконструкции локусной F
­картины согласных, низкочастотная часть которой в спек­
трах шумных согласных, как правило, скрыта. На рис. 3.33 реконструированные локусы
F2
отмечены пунктирной ли­
нией, а на рис. 3.34 показана картина переходов, соответст­
вующая локусу
F2
для альвеолярного согласного
[d]
в соче­
таниях с разными гласными [Kent, Read
1992: Приведенные рисунки отражают идеализированную локусную картину согласных. Идеализация состоит в том, что локусы одного и того же согласного не мо­
гут быть представлены одной частотой: они в определенной степени изменяются под влиянием соседних гласных. Наи­
большая вариативность наблюдается для локуса
F2
у веляр­
ных согласных. На рис. 3.33 для согласных этого класса вы­
делены два разных в зависимости от ряда и лаби­
ализации последующего гласного. Более точные сведения о значениях форматных локу­
сов с учетом их контекстной вариативности приведены в табл. 3 для взрывных согласных английского языка (по 1983;
Stevens
мужской голос). Таблица 3 Локусы первых трех формант (в Гц) для взрывных согласных английского языка Место образования согласного Fl Лабиальные Около 0 перед гласными заднего ряда 1500­1800 перед гласными переднего ряда 2200­2500 Альвеолярные Около 0 1600­1800 2500­2700 Велярные Около 0 1000­1300 перед лабиализованными гласными заднего ряда 1500­1700 перед нелабиализованными гласными заднего ряда 2000­2400 перед гласными переднего ряда 2000­2300 перед гласными заднего ряда 2500­3000 перед гласными переднего ряда 172 3.4. Акустические характеристики основных классов звуковых единиц Отметим наиболее важные особенности локусной взрывных согласных. Из приведенных выше ри­
сунков и табл. 3 видно, что локус ¥\ отражает смычность со­
гласного, т. е. степень сужения речевого тракта, которая у взрывных согласных максимальна. Локусы ¥2 и, в несколь­
ко меньшей степени, непосредственно связаны с местом образования преграды. Локус ¥2 имеет самые низкие значе­
ния у губных согласных. У зубных и альвеолярных соглас­
ных он находится в средней части частотного диапазона, возможного для ¥2. Велярные согласные характеризуются, как уже отмечалось, большой вариативностью и самой ши­
рокой областью возможных локусов (от 1 ООО до 2 500 Гц). Эти закономерности распространяются и на согласные с другими способами образования, поэтому в дальнейшем из­
ложении мы не будем на них останавливаться. лишь, что для согласных с дополнительными язычными ар­
тикуляциями типа палатализации, веляризации или фарин­
гализации связь локусов ¥2 с местом образования сог­
ласного носит более сложный характер. Фрикативные согласные В отличие от взрывных фрикативные согласные имеют относительно однородную артикуляцию и более простые акустические свойства. Глухие фрикативные образуются при участии турбулентного источника шума, который возникает в результате создания в речевом тракте значительного арти­
куляционного сужения, звонкие — при одновременном уча­
стии турбулентного и голосового источников. На широко­
полосной спектрограмме фрикативный шум представлен за­
темненной полосой, частотное положение которой отража­
ет диапазон частот, образующих шум. Шумовая полоса час­
то имеет выраженную вертикальную штриховку. У глухих фрикативных положение этих штрихов в частотной и вре­
менной областях случайно, оно отражает нерегулярные свойства турбулентного шума. Звонкие фрикативные харак­
теризуются наличием амплитудной модуляции шума, кото­
рая происходит с периодом основного тона голоса. Модуля­
ция хорошо видна на осциллограммах этих согласных. На широкополосных спектрограммах наличие голоса фиксиру­
ется в виде голосовой полосы. Кроме того, в шумовой по­
лосе звонких фрикативных появляется упорядоченная вер­
4. Акустические характеристики основных классов звуковых единиц Рис. 3.36. Осциллограммы и спектро­
граммы глухих фрикативных согласных [ ф]. интервокальном контексте тикальная штриховка, которая отражает периодические из­
менения амплитуды шума, обусловленные пульсирующей глоттальной волной. В соответствии с общей закономерно­
стью, которая уже была отмечена для взрывных согласных, шум у глухих фрикативных имеет большую длительность и интенсивность, чем у звонких того же места образования. Описанные различия в акустических характеристиках глухих и звонких фрикативных согласных показаны на рис. 3.35 (по а1. 1980: на примере согласных англий­
ского языка. По интенсивности шума фрикативные согласные от­
четливо делятся на два класса: сибилянтные (свистяще-ши­
пящие) типа русских [с], [з], [ш], [ж] и все остальные. В ос­
нове деления лежат различия в условиях формирования шу­
мового источника, о чем уже говорилось выше. Интенсив­
ность шума минимальна у губных звонких согласных типа русского который по ряду свойств приближается к со­
норным согласным. Длительность фрикативных согласных сильно варьиру­
ет в зависимости от фонетического контекста (от 50 до 200 мс). Однако в целом эти согласные относятся к длитель­
ным звукам, так как в одинаковых произносительных усло-
Глава 3. Акустика речи виях их длительность значительно превышает продолжи­
тельность шумовых участков взрывных и аффрикат. Спектральные характеристики шума у фрикативных согласных зависят от длины резонаторной полости впереди сужения (источника шума), т. е. определяются теми же фа­
кторами, которые действуют в фазе рекурсии для фрикатив­
ного шума взрывных согласных. Области резонансного уси­
ления в спектрах фрикативных шумов обоих классов соглас­
ных тесно связаны с местом образования преграды. В силу большей длительности шума эта зависимость у фрикативных согласных выражена более отчетливо. Во избежание повто­
ров мы не рассматриваем подробно акустические различия фрикативных согласных разного места образования (спектр шума, соседних гласных, формантные локусы), поскольку они аналогичны тем, о которых уже было сказа­
но для взрывных согласных. В качестве иллюстрации типо­
вых различий приведем широкополосные спектрограммы глухих твердых фрикативных согласных русского языка в контексте между [а]-образными гласными (рис. 3.36). Аффрикаты Согласные этого класса по своим акустическим свойст­
вам занимают промежуточное положение между взрывными и фрикативными согласными. Так же, как взрывные, они имеют интервал смычки, который в зависимости от глухо­
сти/звонкости согласного представлен на спектрограмме стоп-паузой или голосовой полосой. Подобно фрикативным согласным, аффрикаты характеризуются наличием участка с отчетливым турбулентным шумом. Главные различия между аффрикатами и шумными согласными других классов связа­
ны с длительностью шумовой фазы. В одинаковых фонети­
ческих контекстах длительность шума у аффрикат больше, чем у взрывных того же места образования, а длительность смычки меньше. В то же время при прочих равных услови­
ях шумовая фаза аффрикат короче длительности фрикатив­
ных согласных. Существенным параметром является также время нарастания шума, обусловленное скоростью движения речевых органов в фазе создания щели. У аффрикат щель создается после смычки, и интенсивность шума растет быст­
рее, чем у фрикативных, но в то же время медленнее, чем у взрывных. 3.4. Акустические характеристики основных классов звуковых единиц Спектральные свойства шума и формантные переходы на участках соседних гласных обнаруживают картину, анало­
гичную взрывным и фрикативным согласным того же места образования. 3.4.5. Акустические характеристики сонорных согласных Носовые согласные По ротовой артикуляции носовые согласные не отли­
чаются от соответствующих звонких взрывных согласных. В обоих случаях на интервале смычки в качестве единственно­
го источника звука выступают голосовые связки. На спект­
рограмме это отражается в наличии голосовой полосы и вер­
тикальной штриховки, синхронной с периодом колебаний. Однако при произнесении носовых согласных воздух свободно проходит через нос, что препятствует созда­
нию значительного избыточного давления позади смычки и образованию взрыва после ее размыкания. Иногда, в осо­
бенности при произнесении велярного носового, ротовая смычка размыкается с небольшим взрывом. Участие носовой полости в производстве согласных приводит к появлению в их спектре дополнительных фор­
мант. Однако только самая низкая форманта (так называе­
мая форманта назализации с частотой около Гц) имеет интенсивность, которая сопоставима по величине с ротовыми формантами гласных. Усиление самых низких гармоник голосового источника проявляется на широкопо­
лосных спектрограммах в увеличении яркости (затемнения) изображения в области голосовой полосы. Более высокие носовые форманты, которые на спектрограмме выглядят как горизонтальные полосы, независимые от места образования согласного, как правило, сильно подавлены из-за больших потерь энергии при прохождении звуковых колебаний через носовую Локусная на участке носовой смычки выяв­
ляется с трудом из-за подавления ротовых формант антире-
зонансами ротовой полости. Ослабление или обрывы рото­
вых формант на границах гласных и носовых согласных обычно хорошо видны на спектрограммах (рис. 3.37, по а1. 1980: При полном подавлении ротовых Глава 3. Акустика речи Рис. 3.37. Спектрограммы носовых согласных в английском языке формант информация о месте образования носового соглас­
ного может быть восстановлена только по формантным пе­
реходам соседних гласных. В этом случае акустические свой­
ства смычки указывают лишь на носовой тембр согласного. Локусы носовых согласных и частотные характеристики формантных переходов аналогичны тем, что наблюдаются в сочетаниях гласных с взрывными согласными того же места образования. Несмотря на наличие свободного воздушного прохода через носовую полость, интенсивность носовых согласных существенного меньше интенсивности гласных. Часто она определяется только амплитудным уровнем первой носовой форманты. Неносовые сонорные согласные Согласные этого класса образуются при участии голо­
сового источника и наличии в речевом тракте сужения, че­
рез которое воздух проходит относительно свободно, как правило, без образования шума; проход в носовую полость закрыт. Наличие голосового источника хорошо передается периодичностью сигнала на осциллограмме, голосовой по­
лосой и вертикальной штриховкой — на широкополосной спектрограмме. Спектр неносовых сонорных обычно имеет отчетливую как у гласных (рис. 3.38, по 1980: Однако есть и некоторые особенности, ко­
торые мы кратко рассмотрим. 178 3.4. Акустические характеристики основных классов звуковых единиц Рис. 3.38. Спектрограммы неносовых сонорных согласных английского языка Центральные При образовании центральных аппроксимантов (типа русского [й] или английских звуков
[j]
[w],
воздух сво­
бодно проходит по центру ротовой полости. Артикуляцион­
ное сужение, обычно более значительное, чем у гласных, со­
здает определенное сопротивление воздушному потоку. Это приводит к потере энергии звуковых колебаний голосового источника, особенно заметной в области формант F2
и
F3,
и к уменьшению общей интенсивности этих соглас­
ных. Локусная
F
-картина центральных аппроксимантов сходна с
F
-картиной ближайших по артикуляции и звуча­
нию гласных, соответственно
[i],
[и] и [э~]. Поэтому эти зву­
ки называют также полугласными (англ.
semivowels).
Нали­
чие сужения в ротовой полости создает условия для пониже­
ния частоты
F1
300 Гц), которая минимальна у ного
Локусы
F2
и
F3
зависят главным образом от места язычного сужения и степени огубленности согласного. Не­
которую роль играет также и степень язычного сужения. Па­
латальный
имеет более высокие локусы этих формант, чем гласный
велярный
[w]
— более низкие, чем [и]. Аль­
веолярный сонорный входящий в консонантную систему Глава 3. Акустика речи английского характеризуется наиболее сложной кон­
фигурацией речевого тракта. При его произнесении (в пози­
ции начала слога) образуются три сужения: между кончиком языка и альвеопалатальной зоной твердого нёба, между зад­
ней частью языка и стенкой фаринкса, а также в области губ. Отличительной чертой такой конфигурации является очень низкая
F3,
что хорошо видно на рис. 3.38. Типовая F
-картина этого согласного характеризуется следующими частотами:
F1
- 300 Гц;
F2
- 1 ООО Гц;
F3
- 1 600 Гц. В сочетаниях с гласными формантные локусы аппрок-
симантов очень плавно переходят в форманты соседних гласных. Длительность формантных переходов, как правило, существенно больше продолжительности стационарного участка и превосходит длительность переходных участков в сочетаниях гласных с согласными других типов. Поэтому центральные аппроксиманты называют также (от англ.
glide
"скольжение"). Боковые (латеральные) согласные Артикуляция боковых сонорных согласных (типа рус­
ского [л] или английского характеризуется наличием преграды, образуемой кончиком языка с верхними зубами или альвеолами. Воздушный поток, идущий из голосовой щели, разделяется и обходит эту преграду по проходам, ко­
торые создаются вдоль боковых сторон языка. Образование суженных проходов в передней части ротовой полости и об­
щее удлинение тракта приводят к понижению
F1
и ослабле­
нию
F2
и
F3.
При артикуляции боковых согласных позади преграды над верхней поверхностью языка образуется не­
большая побочная полость, что ведет к появлению антире-
зонансов. Типичный для боковых согласных антирезонанс находится в области 2 500 Гц. Он в значительной сте­
пени подавляет близкую к нему
F3
и несколько ослабляет F2.
В связи с этим следующий за
F2
видимый максимум спектра в области 3 500 Гц часто соответствует
F4.
Од­
нако вторая форманта — центральная для локусной
F
-карти-
ны - обычно хорошо видна на спектрограмме. Ее частота зависит не только от места основного сужения, но и по­
ложения спинки языка, которая при артикуляции передне­
язычных боковых согласных не участвует в образовании ос­
новной преграды. Это приводит к большой контекстной ва-
180 3.4. Акустические характеристики основных классов звуковых единиц риативности бокового согласного (ср. "темный" и "свет­
лый" варианты в английском языке). В среднем боковых согласных имеет следующие характеристики: ~ 300 Гц; ~ 800­1 200 Гц; ~ 2 500­3 000 Гц. Формантные переходы на участках боковых сонорных в сочетаниях с гласными осуществляются, в отличие от глайдов, с большей скоростью и имеют меньшую длитель­
ность. Основными признаками фонетической границы в этих сочетаниях являются уменьшение общей интенсивно­
сти сигнала и ослабление главных ротовых формант на уча­
стке бокового согласного. Размыкание язычной преграды бокового согласного нередко сопровождается небольшим взрывом. Дрожащие согласные (вибранты) Образование дрожащих сонорных звуков связано с ко­
лебаниями какого­либо активного артикулятора в воздуш­
ном потоке, идущем через речевой тракт. При произнесе­
нии звуков типа русского [р] поднятая лопатка языка колеб­
лется относительно альвеопалатальной зоны нёба. Эти ко­
лебания приводят к чередованию более закрытого и менее закрытого воздушных проходов в месте преграды и соответ­
ственно к чередованию участков сигнала с разными акусти­
ческими свойствами. Количество колебаний (или ударов) даже при форсированном произнесении обычно не больше трех (рис. 3.39). Чаще всего этот согласный реализуется как одноударный. В закрытой фазе, т. е. при сужении воздушного прохо­
да в передней части ротовой полости, понижается и уменьшается уровень всех вышележащих формант. Эта часть вибрантной артикуляции похожа на очень краткую (20— 30 мс) смычку звонкого взрывного согласного; она отчетли­
во выявляется как на осциллограмме, так и на спектрограм­
ме. В отличие от взрывных согласных, вибрантная смычка не сопровождается последующим взрывом, так как ее дли­
тельность слишком мала для создания значительного избы­
точного давления. В открытой фазе ного вибранта похожа на гласный и приблизительно может быть представлена следующими частотами: ~ Гц, ~ 1 300­1 600 Гц, ~ 1 800­2 300 Гц. В сочетаниях с гласными провести границу между открытой фазой вибран­
181 Глава 3. Акустика речи Рис. 3.39. Осциллограмма и спектро­
грамма русского [р] ударный и одноударный варианты) в позиции между гласными та и соседним гласным довольно трудно: изменя­
ется плавно, без каких-либо заметных перепадов в интен­
сивности формант. Заканчивая рассмотрение основных классов звуков, от­
метим, что мы не стремились дать полное и исчерпывающее описание их акустических свойств. Приведенные нами дения очевидно неполны и иллюстративны. Детальная кар­
тина может быть получена только в рамках исследования конкретного языка, с учетом систематической вариативно­
сти акустических характеристик звуковых единиц в зависи­
мости от различных, в том числе контекстных, факторов. 182 3.5. Акустические характеристики звуковых средств 3.5. Акустические характеристики супрасегментных звуковых средств Кроме сегментных звуковых единиц, акустические ха­
рактеристики которых рассматривались в предыдущем раз­
деле, в любом языке имеются различные супрасегментные звуковые средства. К наиболее распространенным из них от­
носятся слоговые тоны в тональных языках, словесное уда­
рение, различные фонетические способы смыслового под­
черкивания слов во фразе, ритм, тональный (мелодический) рисунок фразы, громкость, темп, фонетически выраженная эмоциональная окраска речи и др. Супрасегментные средст­
ва имеют свою акустическую базу и свой набор типовых ха­
рактеристик. Акустическая база супрасегментных звуковых средств Слуховые контрасты между звуковыми сегментами аку­
стически базируются, как мы видели, на различиях в их спектрах, которые, в свою очередь, обусловлены типами ис­
точников звука и конфигурацией речевого тракта. Различия в таких показателях, как собственная длительность, интен­
сивность и основная частота голоса при производстве звуков разного качества, также присутствуют и вносят определен­
ный вклад в результирующее звучание. Однако эти различия незначительны и, как правило, производны от основных признаков целевых артикуляций. Иными словами, говоря­
щий не контролирует их независимо от основной артикуля­
ции звука. Напротив, именно длительность, интенсивность и ос­
новная частота голоса выступают в качестве главных конт­
ролируемых параметров, на базе которых создаются и реали­
зуются супрасегментные просодические противопоставления и схемы. Из-за такого доминирующего использования ука­
занные акустические параметры тоже называют просодиче­
скими. В эмоционально окрашенной речи в качестве супрасег­
ментных средств могут использоваться и разные типы фона­
ции, меняющие тембр голоса, и специфические артикуляци­
онные установки (разные речевые позы или артикуляцион-
183 Глава 3. Акустика речи ные тембровые окраски Различия в типах фонации акустически отражаются в спектре голосового источника, а разные артикуляционные установки влияют на конфигура­
цию речевого тракта и его резонансные свойства. В обоих случаях физической базой просодических тембровых разли­
чий являются интегральные спектральные характеристики, получаемые путем усреднения спектральной картины протя­
женных речевых отрезков (англ.
long-term spectrum
"долго­
временный спектр"). Как видим, жесткого разделения акустических параме­
тров по их использованию в области сегментных или сегментных явлений нет, хотя говорить о преобладающих тенденциях все-таки можно. В акустической фонетике существуют свои методы и средства получения акустических данных для каждого из просодических параметров. Сведения о длительности тех или иных речевых отрез­
ков, в том числе и отдельных звуков, требуют предваритель­
ной ручной сегментации речевого сигнала (на основе осцил­
лограмм и/или К сожалению, эти данные не могут быть в настоящее время получены автоматически из-
за отсутствия достаточно надежных автоматических методов фонетической сегментации речи. К важным элементам речевого потока относятся также паузы, которые образуются в результате намеренных остано­
вок в процессе артикуляции. Они возникают обычно на гра­
ницах достаточно протяженных речевых отрезков — между отдельными предложениями или их распространенными смысловыми фрагментами. Данные об интенсивности речевых отрезков получают путем измерения мгновенных амплитудных значений речево­
го сигнала, их выпрямления (возведения в квадрат) и усред­
нения на определенном временном Для этой 23 Существование специфических артикуляционных установок было замече­
но уже давно. Еще в начале века С. Волконский в книге "Выразительное слово" [Волконский 1913] отмечал: «У нас есть трагически-бытовой тон на Ы: "А ты, быярин, зныешь Этот весь в гортани. А то есть тон элегантной непринужденности - на Э: "Здрэвствуйте, дэрэгой Ивэн Ивэ-
Этот говор весь в челюстях. тон барышни- жеманницы — на У. "Ну чту это Этот весь на губах» (цит. по [Светозарова Популярный в фонетике способ получения усредненных показателей ин­
тенсивности на основе так называемых амплитуды сигна­
ла описан в п. 2.2. приложения. 3.5. Акустические характеристики звуковых средств процедуры могут использоваться как специальные приборы, так и компьютерные программные средства, которые обраба­
тывают оцифрованный сигнал. Важным параметром измере­
ния интенсивности является время усреднения исходных ам­
плитудных значений, которое в современных компьютерных программах анализа речи может выбираться в диапазоне от 5 до 50 мс (в зависимости от задач исследования). Чаще всего используется временной интервал около 20 мс: он достаточ­
но короткий для того, чтобы можно было зафиксировать не­
большие изменения интенсивности в пределах отдельных звуков, и достаточно длительный, чтобы сгладились модуля­
ции интенсивности, вызванные периодичностью вокальных отрезков сигнала. Кривая, отражающая изменение интенсив­
ности во времени при произнесении речевого отрезка, назы­
вается контуром, или огибающей, интенсивности. Информацию об основной частоте речевых отрезков получают на основе анализа формы речевой Это требует выделения и измерения длительности последова­
тельных голосовых периодов в сигнале. Такие измерения могут быть сделаны вручную, но чаще для этого используют специальные приборы, называемые интонографами, или компьютерные программы. Ни один из существующих авто­
матических методов измерения основной частоты не являет­
ся совершенным. На это есть объективные причины — пери­
одичность вокальных звуков со строгой физической точки зрения достаточно условна: последовательные периоды под­
вержены небольшим случайным флуктуациям как по дли­
тельности, так и по форме колебаний. Форма и длитель­
ность голосовых периодов быстро меняется на участках пе­
реходных коартикуляционных процессов, при интонацион­
ных перестройках и т. д. Поэтому при использовании кон­
кретных средств выделения и анализа основной частоты не­
обходимо знать их технические ограничения. В компьютер­
ных программах обычно предлагается выбор из нескольких возможностей, которые связаны с использованием разных процедур сглаживания (усреднения) исходных данных, на­
стройки амплитудных порогов, общего диапазона возможно­
го изменения и пр. Это позволяет выбрать такой режим Возможный, но менее распространенный способ получения сведений об основной частоте голоса базируется на узкополосном спектральном ана-
лизе. Глава 3. Акустика речи а) [1/10 400 Рис. ЗАО. Осциллограммы, контуры ин­
тенсивности и основной частоты для слов собака (слева) и малина (справа) анализа, который для данного говорящего дает минимальное количество сбоев. В результате анализа с предварительной "ручной" настройкой получается кривая изменения основ­
ной частоты во времени, которая называется также конту­
ром частоты основного тона (сокращенно ЧОТ), мелодиче­
ской кривой или интонограммой. На рис. 3.40 в качестве примера приведены осцилло­
граммы (а), контуры интенсивности (б) и основной частоты (в) для слов собака и малина, полученные с помощью ком­
пьютера. Обратите внимание на то, как глухость/звонкость согласных отражается в контуре 3.5.2. Акустические корреляты слоговой, словесной и фразовой просодии Данные о длительности, контуры интенсивности и ос­
новной частоты образуют для фонетистов исходный матери­
ал, который при любом просодическом исследовании нуж­
дается в специальной интерпретации, так как каждый из указанных параметров зависит от множества взаимодейст­
вующих фонетических факторов, как сегментной, так и су­
прасегментной природы. Трудность фонетического анализа усугубляется и тем, что пока еще плохо изучены и поняты произносительные механизмы, обеспечивающие супрасег­
186 3.5. Акустические характеристики звуковых средств Рис. 3.41. Изменение основной частоты в тонах тайского языка ментную сторону речи, а правильный анализ речевой аку­
стики невозможен без понимания того, чем эта акустика порождается. В данном разделе мы рассмотрим лишь наиболее яркие примеры использования акустических параметров в реализа­
ции различных просодических явлений. Нужно иметь в ви­
ду, что просодические звуковые средства, как и звуковые сегменты, характеризуются значительной акустической ва­
риативностью. Наше изложение будет ориентировано на идеализированные ситуации, для которых можно говорить о минимальном влиянии внешних факторов на акустическое воплощение просодических средств. Слоговая просодия (слоговые тоны) О слоговой просодии говорят в тех случаях, когда каж­
дый слог в слове обладает особым просодическим призна­
ком или набором признаков, которые в совокупности обра­
зуют обязательную и самостоятельную характеристику слога, невыводимую ни из его звукового состава, ни из его поло­
жения в слове. С точки зрения артикуляции слоговые про­
содии представляют собой специфический компонент про­
износительной слоговой схемы, который реализуется одно­
временно и координированно со звуковым составом слога. Яркие примеры слоговых можно найти в то­
нальных языках Китая, Юго-Восточной Азии, Африки и Центральной Америки. В этих языках каждый слог в слове 187 Глава 3. Акустика речи характеризуется особым тоном. Главным фонетическим компонентом тонового комплекса является закономерное изменение высоты голоса, которое может сопровождаться изменением интенсивности, длительности и типа фонации. Акустически изменение высоты голоса реализуется конту­
ром
как это видно из рис. 3.41, на котором представле­
ны пять тональных моделей, имеющихся в тайском языке (по
[Laver
1994: Рисунок показывает, что тайские то­
ны различаются областью голосового диапазона, в котором осуществляется движение
размахом, направлением и сложностью этого движения. Словесная просодия Наиболее ярким примером просодических средств этого типа является словесное ударение. Распространенный и естественный способ выделения ударной вершины слова состоит в том, что слог, находящийся под ударением, арти­
кулируется более тщательно и с большим мускульным уси­
лием, чем безударные слоги. Можно считать, что произно­
сительной установкой ударного слога является достижение артикуляционно-акустических целей образующих его зву­
ков. Так, ударные гласные обычно имеют стационарный участок и большую длительность, чем безударные гласные того же фонемного класса. В таких языках, как русский и английский, словесное ударение сопряжено с количествен­
ной и качественной редукцией безударных гласных, что на­
ходит отражение в их длительности и спектральных харак­
теристиках. Рассмотрим для примера акустическую картину рус­
ских слов муку и муку, которые фонологически отличаются только местом ударения (рис. 3.42). Спектральные различия гласных в этих словах хорошо видны без специальных измерений (рис. 3.42 б). Можно за­
метить, что в слове муку
F
-картина первого предударного [у] даже несколько ярче, чем ударного, а заударный [у] в слове муку имеет наименее отчетливую формантную структуру. Показатели длительности, которые можно получить по спектрограмме, таковы: в слове муку ударный гласный име­
ет длительность, равную мс, а заударный [у] - 174 В слове муку ударный [у] длится 262 мс, а первый предудар­
ный [у] - мс. 188 3.5. Акустические характеристики звуковых средств а) б) в) г) 15 500 500 3.42. Комплексная акустическая картина реализации словесного ударе­
ния в русском языке. а — осциллограммы; б — динамические спектрограммы; в — контуры интенсив­
ности; г — контуры основной частоты. Слева данные для слова муку, справа для муку. Границы ударных гласных показаны курсорами. 189 Глава 3. Акустика речи По интегральной интенсивности гласных (рис. 3.42 в) эти слова различаются незначительно: в обоих случаях неза­
висимо от места ударения первый гласный является более интенсивным. Место ударения влияет лишь на степень кон­
траста: в слове муку контраст по интенсивности гласных больше, чем в слове муку. Не очень сильно, на первый взгляд, отличаются и интонограммы (рис. 3.42 г): в обоих словах на первом слоге основная частота повышается, а на последнем — понижается. Однако более детальное рассмот­
рение показывает, что понижение тона реализуется по-раз­
ному в зависимости от места ударения. В слове муку тон на­
чинает падать на второй половине ударного гласного, пони­
жение тона захватывает конечный участок ударного гласно­
го и согласный заударного слога. Иная картина в слове му­
ку. Здесь тон понижается на самом ударном гласном. Таким образом, место ударения в рассматриваемых словах регули­
рует начало фразового падения тона. Для русского словесно­
го ударения важно, однако, не само понижение тона (оно определяется интонацией), а то, что от места ударного сло­
га в слове зависит область реализации фразовых в этом отношении ударный слог явно маркирован относитель­
но безударных. Его маркированность выражается и том, что во фразе, при установке на тщательный тип произнесе­
ния, ударный слог может быть выделен изменением даже в том случае, когда слово не несет особой интонационной нагрузки (это касается знаменательных слов). Из рассмотренного примера видно, что словесное уда­
рение в русском языке имеет комплексное акустическое вы­
ражение: фактически требуется реализовать разную степень выделенности слогов в слове и для этого используются раз­
личные акустические средства. Эксперименты показывают, что реализация словесного ударения в более сложных, неод­
нословных фразах подвергается значительной вариативности. Наиболее устойчивыми акустическими коррелятами слого­
вой ударности/безударности в русском языке являются спек­
тральные различия гласных и их по длительности. Фразовая просодия В области фразовой просодии, или интонации (в широ­
ком понимании этого термина), все просодические парамет­
ры "работают" очень активно, хотя и с разной нагрузкой. На-
190 3.5. Акустические звуковых средств иболее нагруженной является частота основного тона. Фразо­
вый контур ЧОТ отражает возможности управления всеми па­
раметрами голосовых связок, которые определяют высоту го­
лоса, тип фонации и степень голосового усилия. Фразовые просодические средства могут использоваться в речи двумя способами: интегрально - как общая характери­
стика протяженных речевых отрезков и локально — в тесной соотнесенности с ударными слогами отдельной фразы. Интегральное использование обусловлено общими ус­
тановками произнесения, такими, как общий темп, гром­
кость, высотный регистр голоса, ширина используемого го­
лосового диапазона, ориентация на полный/небрежный тип произнесения. Для каждой из этих характеристик можно вы­
делить опорный акустический параметр, однако в речи все просодические параметры определенным образом взаимо­
действуют между собой. Общий темп связан с длительностью фразы и составля­
ющих ее звуковых элементов - звуков и слогов. При конт­
ролируемом убыстрении темпа происходит относительное сокращение средней длительности звука и слога во при замедлении эти показатели возрастают. Громкость соотносится прежде всего с Различия в громкости обусловлены, как правило, разной сте­
пенью голосового усилия. Поэтому при изменении громко­
сти меняются также состояние голосовых связок и спектр го­
лосовых колебаний, а это влияет как на основную частоту го­
лоса, так и на спектральную картину звуков. При более гром­
ком произнесении возрастают показатели средней макси­
мальной интенсивности сигнала, изменяется в более вы­
соком и широком голосовом диапазоне, гласных выражена более отчетливо (см. ниже рис. 3.43 а, б, в). Регистр и диапазон изменения высоты голоса при про­
изнесении отрезка речи влияют на такие показатели конту-
Изменения значений просодических параметров оцениваются двумя спо­
собами: 1) относительно величин, которые характеризуют нормальные (немаркированные) условия произнесения; 2) относительно аналогичных показателей в разных речевых отрезках, для которых вопрос о нормально­
сти/маркированности не существен. Так, приведенные выше показатели темпа могут оцениваться как относительно показателей, характеризующих нормальный темп произнесения, так и относительно показателей любых отрезков, которые не оцениваются с точки зрения реализации в них ка­
кого-либо определенного темпа. Аналогично интерпретируются и осталь­
ные просодические характеристики. 191 Глава 3. Акустика речи ра основной частоты, как среднее значение и величина ее модуляции относительно среднего, измеренная либо на про­
тяжении всего отрезка речи, либо на его ударных слогах. Локальное использование просодических средств (че­
рез ударные слоги слов) более разнообразно и функциональ­
но существенно. Фразовая просодия, подобно слогу в то­
нальных языках, располагает своей системой тонов (тональ­
ных фигур), которые физически могут различаться направ­
лением, размахом и скоростью изменения расположени­
ем относительно границ голосового диапазона и относитель­
но границ ударного слога, в окрестности которого реализу­
ется фразовый тон. В его реализации могут участвовать и та­
кие параметры, как интенсивность и длительность элемен­
тов ударного слога. Из-за тесной связи фразовых тонов с ударными слогами их называют также фразовыми тональны­
ми акцентами (или фразовыми акцентными Кроме того, во фразовой просодии используются и специальные средства особого подчеркивания (смыслового акцентирования) слов, как тех, которые уже несут фразовый тональный акцент, так и тех, которые не отмечены фразо­
вым тоном. Теоретически разных способов подчеркивания может быть много: важно, чтобы при этом слово произноси­
лось иначе, чем обычно. Однако существуют и стандартные способы. К ним относится прежде всего увеличение голосо­
вого усилия при реализации ударного слога подчеркиваемо­
го слова. Такое локальное усиление имеет несколько акусти­
ческих следствий — возрастание интенсивности, увеличение интервала тонального движения и изменение его расположе­
ния относительно ударного гласного, увеличение длительно­
сти, увеличение яркости и ее обогащение за счет появления более высоких формант. Проиллюстрируем использование акустических пара­
метров в области фразовой просодии несколькими примера­
ми из русского языка. На рис. 3.43 приведены контуры ин­
тенсивности и основной частоты нескольких фраз, по кото­
рым можно проследить те акустические явления, о которых говорилось выше. Это лишь крохотный фрагмент в море многообразных и комплексных просодических явлений ре­
альной речи, однако и он показывает сложность материала, с которым приходится иметь дело исследователям фразовой просодии. 192 2.5. Акустические характеристики звуковых средств б) в) г) 3.43. Акустические характеристики просодии в русском языке: слева контуры интенсивности, справа — основной частоты. (а). [Как называется эта Мали­
( спокойный нейтральный ответ на вопрос, громкость средняя); (б). [Как, ты сказала, называется эта [Ты что, не (повтор сооб­
щения, громкость большая); (в). [Как, ты сказала, называется эта [Ти­
ше, я же сказала] (повтор сооб­
щения, громкость пониженная); (г). [А это что за ягода] Это (удостове-
рительный вопрос, восходяще- нисходя­
щий фразовый акцент) 193 Глава 3. Акустика речи В настоящей главе акустические характеристики звуко­
вых средств языка рассматривались в связи с их артикуляци­
онными признаками. Было отмечено, что артикуляционные описания, направленные прежде всего на классификацию звуковых сегментов, не всегда достаточно детальны для предсказания акустических свойств речевого тракта. Физи­
ческие явления, происходящие в "акустической" трубе гово­
рящего, имеют специфику, которую нужно учитывать, пыта­
ясь "вычислить" акустический результат артикуляционных движений. Активные исследования в акустической фонети­
ке продолжаются. Обнаруживаются сложные связи между артикуляционной и акустической сторонами речевого про­
цесса, которые выражаются, в частности, в явлениях ком­
пенсаторной артикуляции, когда один и тот же акустико-
слуховой эффект достигается при разном положении рече­
вых органов. В то же время все более очевидным становит­
ся то, что артикуляция подчинена достижению акустико-
слуховых целей. Она обеспечивает создание речевого сигна­
ла с такими акустическими свойствами, которые использу­
ются слушающим при восприятии и лингвистическом деко­
дировании речевого сообщения. Механизмы звукового вос­
приятия речи и его анатомо-физиологическая база изучают­
ся в перцептивной фонетике. Литература к главе 3 Л.В. Звуковой строй современного русского языка. 1977. Волконский С. Выразительное слово. СПб., 1913. Деркач Р.Я., Тура Б. Чабан Динамические спек­
тры речевых сигналов. Львов, 1983. Златоустова Потапова Р.К., Потапов Трунин-Донской В.Н. Об­
щая и прикладная фонетика. 1997. Светозарова Н.Д. Интонационная система русского языка. 1982. Фант Г. Акустическая теория речеобразования. 1964. Фант Г. Анализ и синтез речи. Новосибирск, 1970. Фланаган Дж. Анализ, синтез и восприятие речи. 1968. Чистович Л.А. и др. Физиология речи. Восприятие речи человеком. 1976. Borden G.J.,
Harris K.S., L.J. Speech science primer. Physiology, Acoustics and Perception of Speech. Baltimore,
1994. Chiba
T.,
Kajiyama
M.
The vowel: its nature and structure. Tokyo,
1946. Clark Yallop An Introduction to Phonetics and Phonology. Oxford
& Cambridge,
1990. 194 Акустические характеристики звуковых средств Feth L. The Physiology of Speech and Hearing. An Introduction. N. 1980. P., A.M., Cooper F.S. Acoustic loci and transitional cues for consonants JASA. 27. P. 55-66. Kent R.D., Read Ch. The acoustic analysis of speech. San Diego, 1992. D. Measurement of transitions in naturally produced stop consonant-vowel syllables JASA. 1983, 72. P. 379-389. Dunn Lacy L. J. The sound spectrograph JASA. 1946, 33. P. 19-49. Ladefoged P. A course in phonetics. 1982. Principles of Phonetics. Cambridge, 1994. Lindblom J. Acoustical consequences of lip, tongue, jaw, and larynx movement JASA. 1971, 50. P. 830-843. L, A. A cross language study in initial stops: acoustical mea­
surements Word. V. 20. P. 384-422. J.J. The origin of sound patterns in vocal tract constraints The pro­
duction of speech. N. 1983. Olive J. P., Greenwood A, Coleman J. Acoustics of American English Speech. A dynamic approach. N. Y, 1993. Potter R.K., Kopp G.A., Green Visible Speech. N. 1947. Shadle The effect of geometry on source mechanisms of fricative consonants of Phonetics. 1991, 19. P. 409-424. Stevens House Development of a quantitative description of vowel articulation JASA. 1955, 27. P. 484-493. Stevens K.N. 1972 a: Stevens K.N. The quantal nature of speech: evidence from data Human communication: a unified view. N.Y., 1972. Stevens 1972 Stevens K.N. Airflow and turbulent noise for fricative and stop consonants: static 1972, 50. P. 1182-1192. Stevens Articulation-Acoustic-Auditory Relationships The Handbook of Phonetic Sciences. Oxford, 1999. P. 507-538. Enlargement of the supraglottal cavity and its relation to stop consonant voicing 1983, 73. P. 1322-1336. Глава 4 ВОСПРИЯТИЕ РЕЧИ Этапы восприятия речи и задачи перцептивной фонетики Речевое высказывание, построенное говорящим и пре­
образованное им в звуковые колебания, доступно воспри­
ятию органами слуха. Деятельность слушающего в процессе звуковой коммуникации направлена на языковую реконст­
рукцию воспринимаемого сообщения и понимание его смы­
слового содержания. В решении этой задачи слушающий ис­
пользует не только акустическую информацию, извлекаемую из речевого сигнала слуховой системой, но и другие, преж­
де всего языковые знания, в том числе знание словаря язы­
ковых знаков и системы звуковых средств. В этом легко убе­
диться, если проанализировать восприятие речи на незнако­
мом языке. Мы, конечно, слышим то, что произносится, но не способны дать правильную лингвистическую интерпрета­
цию тех данных, которые предоставляет нам слуховой ана­
лиз. В лучшем случае можно очень приблизительно оценить звуковой состав произносимых слов или фраз, основываясь на знании и опыте использования звуковой системы собст­
венного языка. В то же время очевидно, что без опоры на акустическую информацию опознание звуковой структуры исходного сообщения, а значит и определение его словесно­
го наполнения, невозможны. В сложном акте языкового де­
кодирования всегда присутствует акустико-фонетический этап, который начинается с "приема" речевого сигнала на­
ружными структурами уха, а заканчивается построением внутреннего представления речевого сообщения в виде це­
почки фонем и различных просодических показателей (то­
нальных, акцентных, интонационных). Акустико-фонетический этап в деятельности слушаю­
щего далее мы будем называть звуковым Внутри этого этапа можно выделить несколько фаз обработ­
ки, каждая из которых осуществляется различными механиз­
мами и завершается созданием новой "версии" речевого сиг­
нала. Сначала в слуховой системе (в ее периферическом отде-
Этот этап называют также фонетическим декодированием или звуковым распознаванием речи. 196 Этапы восприятия речи и задачи перцептивной фонетики ле) производится первичный слуховой анализ, в результате которого речевой сигнал преобразуется в слуховое представ­
ление, напоминающее динамическую спектрограмму речи. На следующем этапе в отделах слуховой системы "спектрограмма" подвергается дальнейшей обра­
ботке: в ней выделяются акустические события и признаки, которые несут информацию о различных элементах фонети­
ческой характеристики высказывания. На последнем этапе происходит лингвистическая (фо­
нологическая) интерпретация звукового потока: выделен­
ные события и признаки используются для принятия реше­
ний о наличии в речевом сообщении (или его фрагменте) определенных фонем и различного рода Основные этапы звукового восприятия речи можно представить следующей схемой: 0. Прием акустического сигнала; Первичный слуховой анализ; 2. Выделение акустических событий и признаков; 3. Лингвистическая интерпретация звуковой стороны речевого сообщения. Для перцептивной фонетики (от лат. "воспри­
ятие") представляют интерес прежде всего второй и третий из указанных выше этапов. Конечная цель этого раздела фо­
нетической науки состоит в том, чтобы понять, какие пер­
цептивно-фонетические механизмы обеспечивают воспри­
ятие речи в естественных условиях звуковой коммуникации. Это чрезвычайно сложная задача, полное решение которой является делом будущего. В данной главе мы рассмотрим не­
которые гипотезы об устройстве и функционировании таких механизмов. Более непосредственные цели перцептивной фонетики связаны с исследованием лингвистических реакций носите­
лей языка на речевые сигналы: их способности опознавать и различать звуковые единицы языка, слоги, слова в разных экспериментальных условиях, оценивать и фонологически интерпретировать изменение акустических характеристик речевого сигнала и др. Наиболее важные результаты имею­
щихся исследований также будут рассмотрены ниже. Изложение начнем со знакомства с анатомо-физиологи-
ческой базой человеческого слуха (слуховым аппаратом) и об­
щими принципами слухового анализа звуковых сигналов. Как 197 Глава 4. Восприятие речи мы знаем, артикуляционная фонетика исторически шла от изучения речевых органов и их функций к пониманию и изу­
чению сложных процессов, происходящих при речепроизвод­
стве. Исследуя восприятие речи, нужно знать, что представ­
ляют собой слуховые органы человека и каковы их функции в обработке звуковой информации. В современных учебни­
ках по общей фонетике этому вопросу уделяется несравненно меньше внимания, чем описанию речевого аппарата. Отчасти это объясняется традиционной ориентацией фонетики на ар­
тикуляционную сторону речевого поведения, конечные фазы которого (органическая и акустическая) доступны наблюде­
нию и изучены достаточно подробно. О слуховом же воспри­
ятии, даже на начальных его этапах, известно пока мало: фа­
ктически все перцептивные процессы для непосредственно­
го наблюдения недоступны. В то же время ясно, что без по­
нимания того, как действуют общие слуховые механизмы че­
ловека, невозможно объяснить, как люди пользуются звуко­
вой речью в целях общения. Изложение имеющихся данных и гипотез - нелегкая задача, так как в этой области (как и в речепроизводстве) отчетливо проявляется пограничная при­
рода фонетики как научной дисциплины. Перцептивная фо­
нетика граничит с такими разделами научного знания, как физиология слуха, психоакустика и психобиология. Прием и первичный слуховой анализ речевого сигнала в органах слуха Первичный слуховой анализ речевого сигнала осущест­
вляется периферическим отделом слуховой системы, в кото­
рый входят наружное, среднее и внутреннее ухо (рис. по [Линдсей, Норман 1974] 4.2.1. Наружное ухо К системе наружных структур уха принадлежат ушная раковина и наружный слуховой проход, который заканчива­
ется барабанной перепонкой. Эта часть слухового аппарата играет относительно небольшую роль в восприятии, обеспе­
чивая направленный прием звуковых колебаний, приходя­
щих к слушающему из внешней среды. Расположение и форма ушной раковины уменьшают чувствительность слуха 198 Прием и первичный слуховой анализ речевого 1 - слуховой проход; 2 - барабанная пере­
понка; 3 - молоточек; 4 - наковаленка; 5 — стремечко; 6 - овальное окно; 7 - полукружные ка­
налы (вестибуляр­
ная 8 - улитка; 9 - круглое окно; 10 — слуховой нерв Рис. 4.1. Схематическое изображение слуховых органов человека к звуковым волнам, которые поступают сзади. Наружный слуховой проход в среднем имеет длину около 2,5 см и ве­
дет себя как акустический резонатор, усиливающий звуко­
вые частоты в диапазоне от 3 ООО до 5 ООО Гц приблизитель­
но в 2-4 раза (до 4.2.2. Среднее ухо Среднее ухо представляет собой костную полость, за­
полненную воздухом. С одной стороны эта полость ограни­
чена барабанной перепонкой, с другой — костной полостью улитки, которая относится к системе внутреннего уха. В по­
лости среднего уха находятся три слуховые косточки: моло­
точек, наковаленка и стремечко, названные так из-за их формы (см. рис. Барабанная перепонка, образующая границу между наружным и средним ухом, представляет собой тонкую мем­
брану овальной формы с конусообразным выступом во вну­
треннюю полость среднего уха. Колебания барабанной пере­
понки, возникающие под воздействием звука, приводят в движение молоточек, прикрепленный к ней одним своим концом. Через другой его конец колебания передаются на-
коваленке и стремечку. Пластинчатое основание стремечка укреплено в отверстии костной полости улитки. При пере-
199 Глава 4. Восприятие речи даче звуковых колебаний основание стремечка действует как поршень на жидкость, внутри улитки, вызывая в ней изменение давления. При прохождении через структуры среднего уха уро­
вень передаваемого давления увеличивается приблизитель­
но на 30 что соответствует отношению давлений на вхо­
де и выходе системы, равному 30. Такое усиление необходи­
мо, в особенности для восприятия тихих звуков, из-за боль­
шого различия в плотности и акустической проводимости воздуха и жидкости, заполняющей улитку. Если бы усиления не было, порог слышимости человеческого слуха был бы го­
раздо выше. Выравнивание рассогласования в акустическом сопротивлении воздуха и жидкости улитки является главной функцией среднего Усиление давления системой сред­
него уха происходит главным образом благодаря тому, что площадь колеблющейся части барабанной перепонки мм) существенно больше основания стремечка мм). Степень усиления зависит от частоты передавае­
мых колебаний: наиболее эффективно передаются колеба­
ния среднего частотного диапазона (800-3 000 Гц). В среднем ухе имеются две мышцы. Традиционно счи­
тается, что их функция состоит в защите внутренних систем уха от воздействия звуков очень большой интенсивности (выше 80 дБ) и длительности: в этом случае происходит реф­
лекторное сокращение мышц среднего уха, которое умень­
шает амплитуду колебаний барабанной перепонки. Обычно давление воздуха во внутренней полости сред­
него уха равно внешнему атмосферному давлению. Наруше­
ние этого баланса, знакомое многим по дискомфортным ощущениям при посадке или взлете самолета, ухудшает ра­
боту барабанной перепонки. За сохранение нужного балан­
са отвечает труба, соединяющая полость средне­
го уха с носоглоткой. В нормальных условиях труба закры­
та, она открывается на короткое время при глотании или зе­
вании. Эти движения рекомендуется делать для устранения эффекта "заложенных" ушей и дискомфортных ощущений. Выравнивающая функция среднего уха, выражающаяся в усилении переда­
ваемых колебаний, подобна функции обычного электрического трансфор­
матора. 200 4 2. Прием и первичный слуховой анализ речевого сигнала... 4.2.3. Внутреннее ухо Внутреннее ухо представляет собой сложный лабиринт соединенных друг с другом каналов (ходов), которые распо­
ложены в височной кости и заполнены жидкостью. Часть этого лабиринта образует вестибулярную систему, а одна из костных структур, имеющая форму спирали, относится к слуховой системе и называется улиткой. Схематическое изо­
бражение строения внутреннего уха человека дано на рис. 4.2 (по [Линдсей, Норман 1 — стремечко; 4 — средний канал; 7 — импанальный канал; 2 — круглое окно; 5 — кортиев орган; 8 — слуховой нерв ка- мембра-
нал; на; Рис. 4.2. Схематическое изображение строения внутреннего уха Улитка представляет собой полость внутри височной кости, которая закручивается вокруг костного стержня поч­
ти три раза. Длина костной спирали улитки составляет око­
ло 35 мм. По мере удаления от границы со средним ухом площадь поперечного сечения улитки уменьшается прибли­
зительно в 6 раз. 201 Глава 4. Восприятие речи 1 — вестибулярный 2 - средний канал; 3 — Рейснерова мембрана; 5 — костная стенка улиткового канала; 5 — внутренние волосковые клетки; 6 — наружные волосковые клетки; 7 - покровная мембрана; 8 - базилярная мембрана; 9 — нервные волокна; 10 — тимпанальный канал; — нервные клетки Рис. 4.3. Поперечный разрез улитки Внутри улитки вдоль всей ее длины от основания (или базальной части) до вершины (или апикального конца) про­
ходят две мембраны — базилярная (или основная) и Рейсне­
рова (рис. 4.3, воспроизводится по [Чистович и др. Базилярная мембрана с внутренней боковой стороны при­
креплена к костной перегородке, а с внешней — к тканям на противоположной стороне улитки. Мембраны делят полость улитки на три канала: вестибулярный, средний и нальный. Вестибулярный и тимпанальный каналы заполне­
ны жидкостью (перилимфой), которая по своим свойствам близка морской воде. Эти каналы соединяются у вершины улитки через небольшое отверстие, называемое 202 4.2. Прием и первичный слуховой анализ речевого сигнала... мой. Средний канал, ограниченный мембранами, образует замкнутую полость, заполненную жидкостью другого соста­
ва В этом канале находится рецепторный ап­
парат слуха — орган. В костной капсуле улитки на границе со средним ухом есть два отверстия, закрытые эластичными мембранами. Од­
но из них, овальное окно, соединено с основанием стремеч­
ка, последней косточкой среднего уха. Второе, круглое окно, служит для снижения избыточного давления в жидкости улитки. функция базилярной мембраны При передаче звуковых колебаний основание стремеч­
ка в такт с изменением звукового давления вдавливает мем­
брану овального окна в жидкость вестибулярного канала, со­
здавая в нем избыточное давление, которое практически мгновенно распространяется по всей длине улитки. Увели­
чение давления приводит в движение податливые структуры среднего канала — Рейснерову мембрану, жидкость средне­
го канала и базилярную мембрану, что, в свою очередь, вы­
зывает изменение давления жидкости в тимпанальном кана­
ле и смещение мембраны круглого окна. Реакция базилярной мембраны на отдельный импульс увеличения давления в жидкости улитки не является мгно­
венной и может быть описана следующим образом. Сначала мембрана "выбухает" в сторону тимпанального канала у сво­
его основания, затем в силу эластичности возвращается в положение равновесия. Возникшее выбухание перемещается вдоль длины мембраны к вершине за время, равное несколь­
ким Таким образом, на мембране возникает бегущая волна смещения ее локальных участков относительно поло­
жения, которые они занимают вне звука. Общая картина яв­
ления показана на рис. 4.4 (по а1. Если исходное звуковое колебание имеет форму сину­
соиды, т. е. состоит из чередующихся уплотнений и разре­
жений, на базилярной мембране возникает устойчивый ко­
лебательный процесс: каждый участок мембраны и мембра­
на в целом колеблются относительно положения равновесия с частотой возбуждающего тона. При этом относительная амплитуда колебаний отдельных участков мембраны различ­
на, а положение участка с максимальной амплитудой зави-
203 Глава 4. Восприятие речи сит от частоты возбуждаю­
щего тона. Если соединить амплитуды смещения пос­
ледовательных участков ко­
леблющейся мембраны плавной кривой, получится график огибающей смеще- М е м б р а н ы ОТКЛИКе зилярной мембраны на чистый тон, который можно рассматривать как характеристику возбуждения мем­
браны в целом (рис. 4.5 по а1. Максимальное значение огибающей соответствует тому участку мембраны, который испытывает наибольшее смеще-
ось со­
ответствует расстоянию участков мембраны от ее основания. Сплошная и жирная пунктирная ли­
нии показывают смеще­
ния мембраны, соответ­
ствующие двум последо­
вательным моментам времени. Тонкая пунктирная ли- ния - огибающая сме- 22 24 26 28 30 32 щений Рис. 4.5. Реакция базилярной мембраны на чистый тон ние (возбуждение). Высокие частоты приводят к максималь­
ному смещению мембраны у ее основания. При понижении частоты локализация максимального смещения сдвигается в направлении к ее вершине. Звуки низких частот вызывают активность мембраны на более обширном участке, чем вы­
сокие: бегущая волна смещений, проходя к области макси­
мального возбуждения мембраны, в той или иной степени активизирует все пробегаемые ею участки. В то же время по­
сле достижения максимума колебания быстро затухают, по­
этому звуки высоких частот почти не возбуждают апикаль­
ную часть мембраны. Реакция базилярной мембраны на частоту звуковых колебаний является следствием ее упругих свойств и анато­
мического строения. Разные участки мембраны отличаются шириной и жесткостью. Ширина мембраны увеличивается 204 42. Прием и первичный слуховой анализ речевою Рис. 4.6. — физические характеристи­
ки базилярной мембраны; б — чувстви­
тельность ее участков к разным звуко­
вым по направлению от основания к вершине примерно в десять раз, а упругость постепенно уменьшается: у основания мем­
брана более чем в 100 раз жестче, чем у вершины. Прибли­
зительно половина мембраны, считая от ее вершины, реаги­
рует на колебания с частотами от 0 до 2 ООО Гц, в то время как оставшаяся часть (у основания) — на остальные часто­
ты звукового диапазона. Такое распределение означает, что различия между звуками в области низких частот обнаружи­
ваются слуховой системой гораздо лучше, чем различия в высоких частотах. Можно сказать, что реакция мембраны на частоту сигнала приблизительно следует логарифмическому закону. Принципиальные особенности частотного отклика базилярной мембраны в связи с ее физическими характери­
стиками иллюстрирует рис. 4.6. До сих пор мы говорили о реакции базилярной мемб­
раны на частотные характеристики звуковых сигналов. Ин­
тенсивность звука также влияет на колебательный процесс, возникающий на мембране: чем сильнее звук, тем больше размах колебаний всех участков мембраны, в том числе и 205 Глава 4. Восприятие речи участка с максимальным смещением. Таким образом, размер зоны возбуждения вблизи точки максимального смещения определяется как частотой звука, так и его амплитудой. Связь местонахождения максимального возбуждения базилярной мембраны с частотой свидетельствует о ча­
стотно-избирательной или фильтрующей функции этого слу­
хового органа. Во внутреннем ухе человека осуществляется перекодирование частоты и интенсивности звукового сигна­
ла в активность, локализованную на определенном участке базилярной мембраны. Различные участки мембраны являются своеобразными биомеханическими а мембрана в целом может рассматриваться как набор фильт­
ров, упорядоченных по частоте и покрывающих в совокупно­
сти всю область частот, доступных восприятию человека. Детали спектрального анализа, осуществляемого бази­
лярной мембраной (ширина полосы ее "фильтров", способ­
ность отслеживать изменение спектральных характеристик сигнала во времени и т. д.), изучаются в физиологии слуха и Оказывается, что частотно-избирательные колебания базилярной мембраны дают достаточно грубую информацию о спектральных различиях между звуками, что приходит в противоречие с известными фактами о диффе­
ренциальных возможностях слуховой системы человека. Ос­
тается предположить, что спектрально-временная картина звуковых колебаний как-то детализируется и уточняется на дальнейших этапах слухового анализа. В частности, физио­
логи доказали, что чувствительность к частотному составу звукового сигнала значительно повышается на уровне нерв­
ных слуховых клеток, которые активизируются колебания­
ми базилярной мембраны. В физиологии слуха связь между местом максимального смещения ба­
зилярной мембраны и частотой возбуждающего сигнала называют тоното-
Этот же термин распространяется и на более высо­
кие уровни слуховой системы для обозначения пространственной упорядо­
ченности нервных элементов в соответствии с их частотной избирательно­
стью. Напомним, что в техническом спектральном анализе фильтр является уст­
ройством, которое, обрабатывая сигнал, пропускает колебания только опре­
деленных частот. Более подробное описание фильтров разных типов дается в п. 3.4. приложения. Большинство современных представлений о роли базилярной мембраны в слуховой обработке звуковых сигналов восходят к экспериментальным ис­
следованиям выдающегося физиолога Г. Бекеши 206 Прием и первичный слуховой анализ речевого сигнала... Рецепторный орган слуха Для того чтобы информация о физических параме­
трах звуковых колебаний могла дойти до структур мозга, нужно, во-первых, обнаружить то место на базилярной мем­
бране, которое в ответ на данный звук имеет максимальную амплитуду смещения, и, во-вторых, послать в мозг по про­
водящим нервным путям электрический сигнал о наличии и величине смещения. Эти задачи выполняются с помощью кортиева органа и связанных с ним волокон слухового нер­
ва (первых нейронов слухового пути). Кортиев орган расположен в среднем канале улитки (см. рис. 4.3) между базилярной и покровной, или альной, мембранами. Он представляет собой сложную систе­
му чувствительных волосковых клеток-рецепторов, которые выполняют функцию своего рода электромеханических дат­
чиков. У человека имеется около 20 ООО таких клеток, обра­
зующих два слоя — наружный (внешний) и внутренний. Ре-
цепторные клетки распределены вдоль базилярной мембраны по всей ее длине. На каждый мм длины приходится прибли­
зительно внутренних и 450 внешних волосковых клеток. Механизм работы "датчиков" кортиева органа заклю­
чается в следующем. Колебания локальных участков бази­
лярной мембраны, порожденные звуковым сигналом, при­
водят к смещению расположенных на них волосковых кле­
ток относительно лежащей сверху покровной мембраны. Возбуждение волосковых рецепторов имеет форму электри­
ческой активности. Специальные эксперименты показыва­
ют, что сигнал, генерируемый волосковой клеткой, без силь­
ных искажений воспроизводит смещение точки базилярной мембраны вверх, т. е. ее сдвиг в направлении к покровной мембране. При движении базилярной мембраны вниз сигна­
не возникает. Таким образом, электрическая копия зву­
кового сигнала, порождаемая волосковыми рецепторами, содержит положительные полупериоды локальных колеба­
ний мембраны, которые соответствуют фазе разрежения да­
вления в жидкости вестибулярного канала и движению овального окна наружу. Возбуждение волосковых клеток передается окончани­
ям и волокнам слухового нерва. В ответ на него в нервных волокнах генерируются электрические импульсы. Общая картина нейронной активности, возникающая в слуховом 207 Глава 4. Восприятие речи нерве как реакция на звуковой сигнал, может быть условно названа слуховым спектром. Рассмотрим ее главные особен­
ности, учитывая имеющиеся экспериментальные данные [Чистович и др. 1976; 1986]. 4.2.4. Кодирование звуковой информации в слуховом нерве Информация о колебаниях базилярной мембраны по­
ступает в мозг через слуховой нерв. Он относится к перифе­
рической нервной системе и состоит из отдельных волокон, которые выходят из нервных клеток - первых нейронов слухового пути. Каждый такой нейрон (а их у человека око­
ло 30 ООО) имеет два волокна: одно контактирует с волоско-
выми клетками, а другое, называемое аксоном, направлено в сторону мозга. Слуховой нерв служит прежде всего сен­
сорным органом: большинство его волокон передают ин­
формацию в мозг, т. е. являются афферентными. Есть также некоторое количество волокон с обратным движением ин­
формации, т. е. эфферентных, однако их роль в звуковом восприятии не ясна. Преобразования, которые осуществляются слухом с помощью первых слуховых нейронов, определяются общей природой этих клеток и специфической схемой их соедине­
ния с волосковыми рецепторами. Нейрон действует как пороговое электрическое устрой­
ство. В состоянии покоя он характеризуется фоновой спон­
танной активностью: генерирует слабые хаотические разря­
ды. При появлении внешнего раздражителя он некоторое время "терпит". Однако если раздражение продолжается и превышает по силе определенную критическую величину, называемую порогом чувствительности, нейрон разряжается, генерируя очень короткий электрический импульс, или спайк (от англ.
spike).
Амплитуда и длительность нервного импульса постоянны и не зависят от свойств раздражителя. Показателем активности (возбуждения) нейрона является средняя частота импульсации (количество импульсов, гене­
рируемых в 1 с), которая имеет верхний предел. Существо­
вание этого предела обусловлено тем, что после генерации импульса нейрон остается на некоторое время, равное при­
мерно 0,001 с, недееспособным. Поэтому теоретически ма­
ксимальная частота отклика нейрона не может превышать 208 Прием и первичный слуховой анализ речевого сигнала... 1 ООО импульсов в секунду, а на самом деле для многих ней­
ронов она еще ниже. Это ограничение определяет реакцию нейрона на увеличение интенсивности внешнего раздражи­
теля. Сначала частота импульсации растет пропорционально интенсивности раздражающего сигнала, затем наступает на­
сыщение, и дальнейшее возрастание силы раздражителя не сопровождается повышением частоты импульсации. Экспе­
рименты показывают, что для отдельного слухового нейрона динамический диапазон сигналов, который им отслеживает­
ся, обычно не превышает 30 дБ, что значительно меньше об­
щей чувствительности слуха к различиям в интенсивности звуков и их спектральных составляющих 100 дБ). Таким образом, реакция отдельного нейрона на интенсивность сиг­
нала существенно отличается от суммарного отклика воло­
кон слухового нерва. Нейрофизиологи ведут активные ис­
следования, направленные на поиск механизмов, объясняю­
щих это расхождение 1999]. Специфика соединения первых слуховых нейронов с волосковыми рецепторами состоит в следующем. Подавляю­
щее большинство нейронов (около 95 характеризуется тем, что каждый нейрон связан только с одной (внутренней) волосковой клеткой, а сама клетка соединена с нейро­
нами (схема "много нейронов — один рецептор"). Нейрон, участвующий в такой схеме, получает рецепторную инфор­
мацию от точечного участка базилярной мембраны, ограни­
ченного площадью волосковой клетки. Таким образом, на уровне первых нейронов продолжает осуществляться связь "частота сигнала — место на мембране — место в слуховом причем информация о частоте сигнала представлена очень детально и дублируется в нескольких нейронах. В слуховом нерве есть еще 5 % нейронов, каждый из которых соединен с несколькими (около 10-12) внешними волосковыми клетками, покрывающими достаточно боль­
шой участок мембраны (схема "один нейрон — много ре­
цепторов"). Предполагается, что такие нейроны имеют бо­
лее низкие пороги срабатывания по сравнению с нейрона­
ми, контактирующими с одной рецепторной клеткой, но ус­
тупают последним в частотной избирательности. В связи с обнаружением разных схем иннервации базилярной мембра­
ны физиологи говорят о наличии двух сенсорных систем слуха, отмечая, однако, что их взаимодействие требует даль­
нейшего изучения. 209 4. Восприятие речи Рис. 4.7. Схематическое изображение "электрической" связи базилярной мембраны с мозгом с помощью воло­
кон слухового нерва Данные электрофизиологии слуха свидетельствуют о том, что волокна слухового нерва служат своеобразными электрическими "проводами", по которым в мозг поступает информация об энергии звукового сигнала в различных ча­
стотных областях. Непосредственная связь большинства нервных клеток с "точками" базилярной мембраны позволя­
ет заключить, что слуховой нерв может рассматриваться как ее детальная проекция, а совокупность нервных волокон, упорядоченных по связи "частота — место", как пронумеро­
ванный набор электрических фильтров-резонаторов, каж­
дый из которых наиболее чувствителен к звуковым колеба­
ниям определенной частоты. С учетом спиралевидной фор­
мы улитки связь базилярной мембраны с мозгом, которая обеспечивается слуховым нервом, схематически представле­
на на рис. 4.7 Изложенные представления об устройстве слухового спектроанализатора являются в настоящее время общепри­
нятыми, но окончательной модели, описывающей свойства слуховых фильтров и их работу при анализе сложных звуков, пока нет. Физиологи провели большое количество экспери­
ментов для установления так называемых кривых частотной настройки (англ.
tuning curve)
одиночных нейронов слухово­
го нерва. Кривая настройки, или частотно-пороговая кри­
вая, характеризует пороги чувствительности нейрона к то­
нальным сигналам с разными частотами. Порог чувствитель­
ности к тону с данной частотой определяется минимальным уровнем интенсивности тона, при котором в нервном волок-
210 4.2. Прием и первичный слуховой анализ речевого По оси X - частота, дБ по оси — уровень звуко­
вого давления у барабан­
ной перепонки относи­
тельно абсолютного порога 0,1 0,2 0,5 1 2 5 кГц 4.8. Кривые частотной настройки слуховых нейронов не возникает ответный импульс. Частота тона, соответству­
ющая наименьшему порогу чувствительности, называется характеристической частотой нейрона. Она может рассмат­
риваться как аналог резонансной (центральной) частоты нейронного слухового фильтра. На рис. 4.8 в качестве иллюстрации приведены кривые настройки трех волокон слухового нерва с разными характе­
ристическими частотами, полученные экспериментальным путем (воспроизводится по [Чистович и др. На рис. 4.8 видно, что нейрон характеризуется острой избирательной реакцией на сигналы с частотами, равными или близкими к его характеристической частоте. Наклон кривых в сторону высоких частот, считая от минимума на ха­
рактеристической частоте, очень резкий (типичная величина наклона 200 дБ на октаву). Это означает, что практи­
чески не реагирует на сигналы с частотами, большими его характеристической частоты. Склоны в сторону низких час­
тот менее резкие, хотя также достаточно крутые (типичная величина наклона кривой, считая от минимума, составляет дБ на октаву). Кроме того, кривые для нейронов с вы­
сокими характеристическими частотами имеют большую ши­
рину в области и длинные "хвосты" в диапазоне низких частот. Из этого следует, что высокочастотные ней­
роны реагируют на широкий диапазон более низких звуков, если их интенсивность достаточно велика. Нейроны отличаются не только частотной полосой возбуждения, но и порогом обнаружения сигналов, частота Обратите внимание, что на рис. 4.8 ось частот имеет нелинейный масштаб. 211 Глава 4. Восприятие речи которых равна или близка их характеристической частоте. Максимальную чувствительность к сигналу имеют нейроны с частотами в области 1 000-4 ООО Гц, т. е. как раз в том ди­
апазоне, где находятся наиболее важные для речи частотные составляющие. Минимальные пороги чувствительности ос­
тальных нейронов значительно выше, особенно в области низких частот. Еще одна особенность слухового спектрального анали­
за состоит в том, что частотная полоса возбуждения нейрон­
ного фильтра зависит от интенсивности сигнала: при боль­
ших интенсивностях ширина полосы увеличивается, особен­
но в сторону частот более низких, чем характеристическая частота нейрона. Для очень громких звуков это приводит к ухудшению частотной избирательности слуха. При восприятии чистого тона в слуховом нерве возбу­
ждается пространственная область нейронов с центром, ко­
торый задается частотой возбуждающего тона. Размеры ак­
тивизированной области и относительная степень возбужде­
ния ее отдельных участков зависят как от частоты тона, так и от его интенсивности. В принципе, такой пространствен­
но-возбудительной реакции достаточно для получения ин­
формации о спектральном составе сложного звука, хотя, возможно, она будет несколько "размытой". Оказывается, однако, что в импульсной активности слухового нейрона со­
держится и более детальная информация о спектре возбуж­
дающего сигнала. Она заключена в длительности временных интервалов между последовательными импульсами возбуж­
дения, т. е. во временном рисунке импульсации нейрона. Как уже отмечалось, раздражителем для слухового нейрона является колебательный процесс, который вызван сигналом в той точке базилярной мембраны, где находится волосковая клетка, контактирующая с нейроном. Важным свойством нейрона является привязка генерируемых им импульсов к определенной фазе этого колебательного процесса. Чаще всего импульс возникает как реакция на максимальное по­
ложительное смещение соответствующей точки колеблю­
щейся мембраны. Благодаря фазовой привязке (англ.
phase locking)
временной рисунок импульсации нейрона, возбуж­
денного чистым тоном, характеризуется упорядоченностью: импульсы следуют друг за другом с временными интервала­
ми, которые близки либо периоду возбуждающего тона, ли­
бо его целочисленным произведениям (последнее имеет ме-
212 4.2. Прием и первичный слуховой анализ речевого сто в тех случаях, когда ка­
кой-то период возбуждаю­
щего колебания "пропуска­
ется" нейроном). Если сиг­
нал звучит достаточно дол­
го, длительность межим­
пульсных интервалов в ре­
акции нейрона группирует­
ся вокруг значений, задавае­
мых периодом возбуждаю­
щего сигнала. На рис. 4.9 приведены эксперименталь­
ные данные, которые пока­
зывают наличие такой груп­
пировки во временном ри­
сунке реакции одного и того же слухового нейрона на то­
нальные сигналы разной ча­
стоты (цитируется с некото­
рыми упрощениями по а1. Несмотря на сильные ограничения в максималь­
ной частоте импульсации для одиночного нейрона, группа активизированных нейронов с совпадающими или близкими характеристи­
ческими частотами может создавать временной рису­
нок суммарной активности, который позволяет отслежи­
вать периодичность тональ­
ных сигналов с частотой до 5 кГц. Фазовая привязка была обнаружена в реакциях нейронов не только на чис­
тые тоны, но и на сложные периодические сигналы, в том числе стационарные гласные. Исследователи считают, что подробная ин-
Рис. 4.9. Частота встречаемости межим­
пульсных интервалов разной длитель­
ности во временном рисунке реакции одиночного слухового нейрона на чис­
тые тоны с различными частотами Глава 4. Восприятие речи формация о частоте нижних формант гласного содержится прежде всего во временном рисунке возбуждения тех воло­
кон слухового нерва, характеристические частоты которых близки частоте форманты. Отмечается, однако, что надеж­
ность этой информации сильно зависит от формантной кар­
тины гласного. В то же время общая периодичность речевых звуков (или информация об основной частоте голоса) вос­
производится во временном рисунке многих волокон и вы­
деляется слуховым анализатором с большой степенью на­
дежности и подробности Этим, в частности, можно объяснить способность человека воспринимать высо­
ту голоса и ее изменения при разговоре по телефону, несмо­
тря на то что телефонный канал не пропускает сигналы с ча­
стотой меньше 300 Гц. Суммируя, можно сказать, что в значительной области звукового диапазона частота сигналов кодируется в слухо­
вой системе двумя способами: (номером) активизи­
рованного нейрона или группы соседних нейронов, т. е. "по оси частот", и периодом суммарного потока нейронной ак­
тивности в возбужденной частотной полосе, т. е. по оси вре­
Экспериментальные результаты, свидетельствующие о таком кодировании, лежат в основе двух психоакустиче­
ских теорий восприятия высоты тона: теории места и теории периодичности. Реакции слуховых нейронов имеют еще две особенно­
сти, которые важны для спектрального анализа речевых сиг­
налов, быстро меняющихся во времени. Нейроны умеют под­
черкивать временные моменты резкого изменения энергии в своей частотной что важно для слухового членения звукового сигнала. Подчеркиваются также области резкого изменения соотношения энергий в соседних частотных об­
ластях (обострение спектральных максимумов). Это сущест­
венно для выделения формант и отслеживания их динамики. Изложенные данные о свойствах и работе слуховых нейронов были получены в электрофизиологических опытах над животными. Они находят подтверждение и в психоаку-
Эти явления лежат в основе двух психоакустических теорий восприятия высоты тона: теории места и теории периодичности, Всем по собственному опыту известна резкая реакция зрения на включение света в темной комнате, за которой следует привыкание (адаптация). Слуху свойственна аналогичная реакция на появление и прекращение звукового сигнала, в том числе в отдельной частотной полосе. 214 4.2. Прием и первичный слуховой речевого сигнала... стических экспериментах, исследующих особенности вос­
приятия человеком специально сконструированных звуко­
вых сигналов. Сходство результатов говорит о том, что на­
блюдения над животными дают ценный материал для моде­
лирования спектрального анализа, осуществляемого челове­
ческим слухом. В свою очередь, психоакустические экспери­
менты интересны тем, что позволяют исследовать характе­
ристики слухового спектроанализатора косвенными метода­
ми, не требуя прямого наблюдения за реакциями нервных слуховых В настоящее время в психоакустике ве­
дутся интенсивные исследования, направленные на уточне­
ние "резонансных" свойств слуховых нейронных фильтров [Moore
На основе накопленных в науке сведений о кодирова­
нии звуковой информации в слуховом нерве можно сконст­
руировать общую картину отклика его волокон на звуковой сигнал, т. е. вычислить слуховой спектр звука. Подобные расчеты основываются на конкретных моделях слухового спектроанализатора, поэтому спектры для одного и того же звука, полученные на базе разных моделей, могут в деталях отличаться. В то же время сравнение модельных расчетов показывает, что принципиальные особенности слухового спектрального анализа отражаются в разных моделях одина­
ково
[Johnson
1997]. В качестве примера рассмотрим физи­
ческий и слуховой спектры синтезированного гласного
приведенные на рис. 4.10 (по
[Moore
Слуховые спек­
тры даны для двух реализаций гласного, отличающихся об­
щим уровнем интенсивности (50 и 80 Ось слуховых ча­
стот на рис. б учитывает деление общего диапазона ча­
стот, воспринимаемых слухом, на интервалы, равные шири­
не полос слуховых На этой оси расстояние меж­
ду физическими частотами приблизительно пропорциональ­
но расстоянию между точками базилярной мембраны, кото­
обладают максимальной чувствительностью к соответст­
вующим частотам. Согласно
[Moore
1999], частоты 500, 1 000, 2 000 и 3 000 Гц должны быть представлены на слу­
ховой шкале значениями 10,8; 15,6; 21,1 и 24,6. Более подробно о психоакустических исследованиях частотной избиратель­
ности слуха можно прочитать в [Фланаган 1968]. Ширина слуховых фильтров примерно соответствует так называемым кри­
тическим полосам слуха, существование которых было обнаружено уже давно. О критических полосах слуха см. ниже. 215 Глава 4. Восприятие речи Рис. 4.10. Физический (а) и слуховой (б) спектры синтезированного гласного [I] 216 4.2. Прием и первичный слуховой анализ речевого Отметим главные различия между спектрами, приве­
денными на рис. 4.10. Слуховые спектры содержат деталь­
ную информацию о низкочастотной области спектра гласно­
го (до 1 ООО Гц). Эта область занимает на слуховой спектро­
грамме больше половины всего изображения, а на физиче­
ской — только четвертую часть. Видно, что слух выделяет здесь отдельные гармоники, так что информация о первой форманте гласного в слуховом спектре напрямую не дана. Ее обнаружение требует дополнительной обработки, например, сравнения относительного уровня пиков, соответствующих нижним гармоникам. Верхние форманты на слуховых спек­
трах разделены хуже, чем на физическом. В слуховом спек­
тре рассматриваемого гласного видна единая область выра­
женного возбуждения, в которой верхние форманты образу­
ют небольшие максимумы. В то же время расстояние по ча­
стоте между этой областью и гармоническим пиком, близ­
ким к первой форманте, больше расстояния между первыми двумя формантами физического спектра. Наконец, рис. б показывает, что различия в общей интенсивности гласного почти не влияют на форму огибающей слуховых спектров. Таким образом, изменения в частотно-избиратель­
ных свойствах фильтров, связанные с интенсивностью сиг­
нала, незначительны для звуков, громкость которых не вы­
ходит за пределы диапазона, типичного для речи. Итак, в слуховом нерве, благодаря системе мембрана - волосковые рецепторы - слуховые нейроны" звуковые колебания преобразуются в пространственно-вре­
менную картину нейронного возбуждения, которо­
го передается частотой импульсации. Характеристики слухо­
вых фильтров не зависят от природы анализируемого сигна­
ла: речь, звуки животных, скрип двери, шум проезжающей машины анализируются с помощью одних и тех же средств. Фонетистам, конечно, хотелось бы иметь возможность рабо­
тать со "слуховыми спектрограммами". В Лаборатории фи­
зиологии речи Института физиологии им. И.П. Павлова уже давно и успешно разрабатывается модель периферического слухового анализатора, которая используется для исследова­
ния звуковых сигналов [Чистович и др. 1976; 1986]. Однако в широкой фонетической практике "слуховые спектрограм­
мы" используются В ряде современных компьютер-
Об основных отличиях слуховых и обычных спектрограмм речевых сигна­
лов см. более подробно [Кожевников и др. 1981]. Глава 4. Восприятие речи ных программ при проведении спектрального анализа мож­
но выбрать такие характеристики фильтров, которые более близки к слуховым, чем наиболее распространенный в аку­
стической фонетике способ широкополосной фильтрации (с фильтром 300 Гц). В некоторых программах предусмотрена возможность получения кохлеаграмм (от лат.
cochlea
"улит­
ка") — спектрально-временных изображений сигнала, кото­
рые похожи на традиционные динамические спектрограм­
мы, но строятся с учетом устоявшихся и широко признан­
ных представлений о человеческом "спектроанализаторе". Общие характеристики слуха и основные психоакустические шкалы Реакция базилярной мембраны и волокон слухового нерва на физические параметры звуковых колебаний опре­
деляют важнейшие свойства человеческого слуха. К ним, с одной стороны, относятся абсолютная и дифференциальная чувствительность слуха к звуковым сигналам разной интен­
сивности и частоты, а с другой — общая оценка громкости и высоты звуковых сигналов. Под абсолютной чувствительностью слуха понимается способность человека обнаруживать (просто слышать) звуки разной частоты и интенсивности. Дифференциальная чувст­
вительность слуха — это способность человека различать зву­
ки, которые имеют разную частоту и интенсивность. Для ис­
следования этих способностей обычно используют простые тональные сигналы (чистые Оценка чувствительности слуха к звукам конкретного диапазона частот осуществляется с помощью определения порогов слышимости (реакция на единичный стимул) или различения (реакция на два последо­
вательно предъявляемых стимула, отличающихся по одному физическому параметру — частоте или интенсивности). Для измерения абсолютных и дифференциальных порогов слуха применяют разные методы — психоакустические, основан­
ные на субъективных ответах испытуемых, и инструменталь­
ные, с помощью которых фиксируются электрические пока­
затели активности разных отделов слуховой системы. Человек обладает большой абсолютной чувствительно­
стью к звуковым сигналам с разными физическими характе­
ристиками. Диапазон частот, которые доступны слуху взрос­
лого человека, охватывает звуки с частотами от Гц до 218 4.2. Прием и первичный слуховой анализ речевою кГц. Однако способность слышать эти звуки зависит от их интенсивности: наибольшая чувствительность слуха отмечается в диапазоне кГц. На более низких и более высоких частотах чувствительность слуха гораздо меньше: чтобы услышать звуки этих частотных диапазонов, нужна существенно большая интенсивность, чем для звуков в диа­
пазоне кГц. Минимальная интенсивность тона, необхо­
димая для его восприятия, характеризует порог слышимости звука на данной частоте. Пороги слышимости для звуков разных частот обычно задаются в дБ относительно стандарт­
ного порога слышимости, соответствующего тону с частотой 1 кГц. Они приведены ниже на рис. Дифференциальная чувствительность слуха к различи­
ям по частоте очень велика. Однако для низких частот она несколько меньше, чем для более высоких. Например, отно­
сительный дифференциальный порог по частоте, т. е. вели­
чина минимального воспринимаемого различия по частоте между парой последовательно предъявляемых разных тонов, составляет для тона частотой 100 Гц 3 % и уменьшается до 0,3 % для средних и высоких частот. Реакция слуха на различия в интенсивности звуков также является очень тонкой: в области средних уровней ин­
тенсивности (порядка 40-50 дБ над порогом слышимости) и частот в диапазоне ООО Гц дифференциальный порог по интенсивности составляет всего дБ [Вартанян Общая оценка предельных дифференциальных воз­
можностей слуха показывает, что человек может различать около 300 000 разных по интенсивности и частоте тональ­
ных звуков. Слуховые ощущения громкости, высоты и тембра зву­
ковых сигналов сложным образом соотносятся с их физиче­
свойствами. Громкость звука определяется способностью человека оценивать и располагать воспринимаемые звуки на субъек­
тивной шкале "тихий-громкий". Эта оценка зависит как от интенсивности, так и от частоты звука. Логарифмическая шкала децибелов, обычно используемая для характеристики уровня интенсивности звуков, отражает субъективную оцен­
ку громкости не в полной мере. Устройство шкалы децибе­
лов соответствует логарифмическому закону ощущения громкости звуков, однако зависимость громкости от часто-
1981]. Глава 4. Восприятие речи ты в ней не На рис. изображены так на­
зываемые кривые равной громкости, на которых эта зависи­
мость отражена. Каждая кривая на этом рисунке относится к звукам разной частоты и интенсивности, которые вызыва­
ют ощущение одинаковой громкости. Самый нижний контур, изображенный на рис. пун­
ктирной линией, фиксирует абсолютную чувствительность слуха к различным частотам. Звуки, физические параметры которых лежат ниже этой линии, человек не слышит. Самый верхний контур соответствует очень громким звукам, вызыва­
ющим боль в ушах. Чем больше интенсивность тона, тем меньше его частота влияет на субъективное восприятие гром­
Кроме что в звуковом диапазоне, наибо-
Децибел — это число, соответствующее логарифму отношения интенсивно-
стей. Более подробно см. п. 2.1. приложения. Психологические факторы, влияющие на оценку громкости, учитываются при конструировании высококачественных усилителей звука. При малых уровнях записанных звуковых сигналов с их помощью можно усилить низ­
кие и высокие частотные составляющие, которые иначе могут оказаться за пределами порога слышимости. 220 4.2. Прием и первичный слуховой анализ речевого сигнала... лее важном для речи (500-5 ООО Гц; 40-90 дБ), влияние час­
тоты на оценку громкости не очень велико. Поэтому в рече­
вых исследованиях можно игнорировать зависимость громко­
сти от частоты и пользоваться шкалой децибелов. Однако даже для звуков одной частоты нет прямого со­
ответствия между интенсивностью звука и громкостью. На­
пример, если увеличить интенсивность тона с частотой 1 Гц на 10 дБ, т. е. в 10 раз, то его субъективная гром­
кость возрастет только в два раза. Чтобы учесть эту особен­
ность восприятия, была введена особая единица измерения громкости — сон. 1 сон — это громкость тона, соответству­
ющая частоте 1 000 Гц и интенсивности 40 дБ. Для получе­
ния оценки громкости на других частотах можно воспользо­
ваться контурами равных громкостей. На рис. все тоны контура, помеченного цифрой 40, имеют громкость, равную 1 сону. Относительно этого контура при каждом увеличении интенсивности на 10 дБ число сонов удваивается, а при со­
ответствующем уменьшении интенсивности уменьшается вдвое. В сонах выражают громкость чистых тонов. Громкость сложных звуков, которых в природе гораздо больше и к ко­
торым относятся все речевые звуки, определяют путем срав­
нения со стандартным тоном в 1 000 Гц, интенсивность ко­
торого может регулироваться. Величина в сонах, при кото­
рых стандартный тон кажется таким же громким, как и сложный звук, дает оценку громкости сложного звука. Уров­
ни громкости в сонах для некоторых типичных звуков пока­
заны на рис. 4.12. На рисунке видно, что речевые звуки за­
нимают на шкале громкости небольшую область от 1 до 30 сонов. Слышимость и оценка громкости зависят не только от частоты и интенсивности звука, но и от аналогичных свойств других звуков, действующих на ухо одновременно. При определенных соотношениях частоты и интенсивности один звук может "маскировать" другой, т. е. затруднять его восприятие. Так, маскирующий звук средней интенсивности оказывает относительно небольшое влияние на восприятие звуков, частота которых ниже его собственной, однако силь­
но влияет на слышимость более высоких звуков. Например, в присутствии маскирующего тона частотой 1 200 Гц и ин­
тенсивностью 60 дБ порог слышимости тона с частотой 2 000 Гц возрастает на 30 дБ по сравнению с порогом слы-
221 Глава 4. Восприятие речи Рис. Громкость сложных звуков в шкале сонов шимости в отсутствии маскирующего Повышение порога слышимости одного звука под воздействием другого, называемое маскировкой, широко используется в экспери­
ментальных исследованиях, в частности, в работах по вос­
приятию речи, когда надо "исключить" или затруднить вос­
приятие каких-то участков спектра речевого сигнала. Перцептивным эквивалентом частоты тона является высота. Ощущение высоты звука базируется на способности слушающего оценивать и располагать воспринимаемые зву­
ки на субъективной шкале "низкий-высокий". Оценка вы­
соты тональных сигналов в зависимости от их частоты так­
же имеет свои особенности. При увеличении или уменьше­
нии частоты вдвое воспринимаемая высота тона не обяза­
тельно изменяется пропорционально: оценка высоты раз­
лична для разных областей частотного диапазона. Поэтому для оценки высоты тона используется особая шкала, едини-
Эксперименты, иллюстрирующие эффект маскировки, описываются во многих книгах по психоакустике (см. [Фланаган 222 4.2. Прием и первичный слуховой анализ речевого Рис. Соответствие между физиче­
ской частотой (в Гц) и субъективной высотой тона (в мелах) ца которой называется ме­
лом. По принятому опреде­
лению, тон частотой 1 ООО Гц (при 60 дБ) имеет высоту, равную 1 ООО мелов. Соотношение между физи­
ческой частотой и шкалой мелов показано на рис. 4.13. Как видно из рисунка, в ди­
апазоне частот ООО Гц восприятие высоты прибли­
зительно соответствует фи­
зической частоте — число герц равно числу мелов. При дальнейшем увеличе­
нии частоты восприятие вы­
соты резко отстает: следую­
щий интервал в 1 ООО мелов соотносится с частотами 1 000-5 000 Гц. Таким образом, в слуховом ощущении высо­
ты шкала физических частот в своей высокочастотной об­
ласти как бы сжимается. Слуховым эквивалентом формы (спектра) звуковой волны является тембр звука. Если звук имеет синусоидаль­
ную форму, он воспринимается как простой тон неопреде­
ленной окраски. Если звук сложный и периодический, воз­
никает восприятие "музыкального" звука определенного ка­
чества. Различия в форме звуковой волны и, следовательно, в ее спектре определяют слуховые различия в тембре музы­
кальных инструментов при воспроизведении одной и той же ноты, разное качество гласных и тембральную окраску голо­
са говорящего в речи. Восприятие одновременно звучащих тонов и иных звуков характеризуется особой психоакустиче­
ской единицей — критической полосой частот. Термин "критическая полоса" ввел известный психо­
акустик X. Флетчер
[Fletcher
который изучал явление маскировки тонального сигнала полосовым шумом, средняя частота которого равнялась частоте тона. Он установил, что при увеличении полосы шума до определенной критической величины порог слышимости тона возрастает, а потом оста­
ется без изменения. Например, для тона с частотой 2 000 Гц порог слышимости возрастает до тех пор, пока ширина по-
223 Глава 4. Восприятие речи лосы одновременно звучащего шума увеличивается до 400 Гц. Дальнейшее увеличение полосы шума не влияет на порог слышимости тона. Ширина частотной полосы шума, при которой наступает стабилизация порога слышимости тона, и была названа критической полосой слуха для часто­
ты, равной частоте тона. Дальнейшие психоакустические ис­
следования показали, что критические полосы отражают ча­
стотную избирательность слуха, т. е. соотносятся с полосами пропускания слуховых фильтров. Ширина критической по­
лосы (в Гц) возрастает с увеличением ее средней частоты (рис. 4.14) и соответствует приблизительно 100 мелам. За­
метьте, что на частоте 1 000 Гц критическая полоса равна 200 Гц, а на частоте 000 Гц - 1 000 Гц. Это означает, что способность слуха разделять частотные составляющие слож­
ного сигнала падает с увеличением частоты. В наряду со шкалой для измере­
ния субъективной высоты тона часто используют шкалу Барков, единица которой равна критической полосе слуха. Эта шкала применяется при построении слуховых спектров речевых звуков и кохлеаграмм. Связь между частотой звука (в Гц) и его высотой в Барках иллюстрируется графи­
ком на рис. 4.15. Шкала Барков обозначается латинской буквой
Z
от фамилии исследователя (Zwicker),
который много занимался изучением критических полос слуха [Цвикер, Фельдкеллер 1971]. 224 4.3. Обработка звуковых сигналов в отделах... Как было отмечено выше, абсолютная и дифференци­
альная чувствительность слуха к физическим параметрам звука оцениваются обычно на материале чистых тонов. Вос­
приятие сложных звуков имеет свои особенности, которые влияют на количественные показатели слуховой чувстви­
тельности, о чем свидетельствуют описанный выше эффект маскировки и наличие критических полос слуха. 4.3. Обработка звуковых сигналов в центральных отделах слуховой системы Обработка звукового сигнала в слуховой системе чело­
века не ограничивается периферическим спектральным ана­
лизом. Мы уже говорили, что на выходе периферического анализатора создается слуховой спектр звука, под которым понимается распределение уровня возбуждения волокон слухового нерва, упорядоченных пространственно в соответ­
ствии с их характеристическими частотами. Изменение это­
го распределения во времени отражает спектрально-времен­
ную картину звукового сигнала. По имеющимся данным слуховой спектроанализатор обладает малой инерционно­
стью (менее 5 мс) и по степени отслеживания временных из­
менений спектра не уступает обычному широкополосному спектроанализатору, известному в акустической фонетике [Кожевников и др. 1981]. Текущий звуковой поток, представленный динамиче­
ской слуховой "спектрограммой", передается по слуховому нерву в мозг. О том, как эта детальная звуковая информа­
ция обрабатывается в центральных отделах нервной систе­
мы, известно, к сожалению, немного из-за трудностей в по­
лучении нейрофизиологических данных. До начала 60-х го­
дов считалось, что не только периферия, но и слуховая си­
стема в целом функционирует как спектральный анализа­
тор. Лингвистическая интерпретация речевых сигналов рас­
сматривалась как процедура определения фонемного значе­
ния текущих слуховых спектров (спектральных срезов) на основе сравнения со спектральными образцами (эталонами) фонем, набор которых должен храниться в памяти носите­
ля языка. Физиологические и психоакустические экспери­
менты, проведенные в годы, сильно изменили взгляды ученых на центральные механизмы слухового ана-
225 Глава 4. Восприятие речи лиза. В высших отделах слуховой системы были обнаруже­
ны специализированные нейроны, избирательно реагирую­
щие на некоторые особенности звуковых сигналов. Их на­
звали детекторами (обнаружителями) определенных акусти­
ческих свойств, или признаков, слуховых спектрограмм. Толчком к активному исследованию признаковых детекто­
ров послужили данные акустической фонетики. Опыт ана­
лиза динамических спектрограмм речи показал, что речевые сигналы обладают специфическими и быстро меняющими­
ся акустическими характеристиками, которые закономер­
ным образом связаны со слоговой организацией речи (чере­
дованием согласных и гласных), лингвистическими призна­
ками фонем и динамикой артикуляции. Еще одним стиму­
лом для поиска детекторов акустических признаков были результаты исследований в области зрительного воспри­
ятия. В течение годов нейрофизиологи не только обнаружили, но и описали основные виды нейронов-дете­
кторов в зрительных центрах животных и человека [Лин-
дсей, Норман 1974]. Вопрос о том, есть ли общие черты в обработке информации различными сенсорными система­
ми, всегда представлял большой интерес для физиологии нервной деятельности. 4.3.1. Выделение акустико-слуховых признаков звукового сигнала Центральный отдел слуховой системы имеет сложное нейроанатомическое строение. Образующие его нейроны организованы в несколько уровней, постепенно приближаю­
щихся к слуховой коре мозга, которая является конечной точкой так называемого классического слухового пути. Связь между уровнями в основном последовательная: нейро­
ны данного уровня, получая информацию от предыдущего, передают ее после определенных преобразований следующе­
му уровню. На всем пути сохраняются узкая настройка нерв­
ных клеток на определенные частоты, свойственная нейро­
нам слухового нерва, и связь этих частот с пространствен­
ным расположением нейронов и их группировок в пределах своего уровня. Это значит, что каждая группа нейронов об­
рабатывает информацию в ограниченной частотной полосе, а анализ спектральной информации на всем пути ее прохо­
ждения к мозгу происходит в отдельных "сквозных" 226 4.3. Обработка звуковых сигналов в центральных отделах... ных каналах, в совокупности представляющих частотный диапазон человеческого слуха. По мнению многих физиологов и психоакустиков, в работе этой многоканальной системы можно выделить два этапа: обработку спектральной информации в отдельных ча­
стотных каналах, т. е. локально по спектру, и объединение результатов локального анализа в акустико-слуховые при­
знаки звукового сигнала. Локальный слуховой анализ осуществляется централь­
ными нейронами, которые "работают" в одном и том же ча­
стотном канале. Основной принцип обработки сигнала со­
стоит в обнаружении амплитудно-временных и амплитудно-
частотных изменений (неравномерностей) в отклике пери­
ферического анализатора в соответствующей частотной по­
лосе. Изменения амплитуды или частоты сигнала по оси времени предложено называть акустическими событиями, а неравномерности по оси частот (это, прежде всего, спект­
ральные максимумы) — особенностями огибающей слухово­
го спектра. Особую чувствительность слуховой системы к акустическим изменениям в сигнале подтверждают нейро­
физиологические эксперименты, в ходе которых исследова­
тели выявили два типа реакций центральных слуховых ней­
ронов - фазическую и тоническую [Чистович и др. Фазические нейроны чувствительны к изменению акустиче­
ских свойств сигнала, т. е. выделяют акустические события. Кроме того, они характеризуются избирательной реакцией на разные классы событий: одни нейроны реагируют на по­
явление (увеличение) энергии звука, другие — на ее исчезно­
вение (уменьшение); третьи — на величину (или скорость) изменения энергии (резкие/нерезкие изменения). Обнару­
жены фазические нейроны, которые избирательно отклика­
ются на изменение частоты тонального сигнала: одни из них возбуждаются при наличии изменения, другие чувствитель­
ны только к понижению или повышению частоты. Таким образом, в реакциях фазических нейронов содержится ин­
формация как о наличии изменений в сигнале, так и об их типах. Исследования показывают, что подавляющее боль­
шинство центральных нейронов на всех уровнях слухового пути имеют фазические реакции. Тонические нейроны, по имеющимся представлениям, характеризуются непрерыв­
ным откликом на звуковой сигнал. Их реакции обычно изу­
чаются на материале стационарных звуков, в частности, 227 Глава 4. Восприятие речи гласных. Экспериментально показано, что в отклике тониче­
ских нейронов подчеркиваются такие особенности слухово­
го спектра, как наличие и степень выраженности спектраль­
ного максимума в анализируемой полосе частот. Кроме то­
го, при изучении отклика на стационарные гласные на низ­
ших уровнях слухового пути обнаружены нейроны, которые очень точно реагируют на периодичность гласного: их им­
пульсные реакции имеют фазовую привязку к каждому пе­
риоду основного тона 1999]. Предполагается, что реакция этих элементов играет важную роль в передаче те­
кущей информации о высоте голоса. Вопрос о взаимодействии фазических и тонических нервных элементов при обработке быстро меняющегося зву­
кового потока, подобного речи, остается открытым. В рабо­
те [Чистович и др. 1976] была выдвинута гипотеза, согласно которой сигналы фазических нейронов, возникающие в мо­
менты обнаружения акустических событий, играют роль им­
пульсов опроса, позволяющих считывать во временной ок­
рестности обнаруженного акустического события информа­
цию о текущем слуховом спектре звука, которая содержится в отклике тонических нейронов. За время, прошедшее с мо­
мента публикации указанной работы, эта гипотеза получила подтверждение в целом ряде экспериментальных исследова­
ний, однако, по свидетельству самих экспериментаторов, до полного понимания механизмов локального слухового ана­
лиза еще далеко. Не менее сложным является и вопрос об объединении акустических событий и особенностей спектральной огиба­
ющей, обнаруженных в отдельных частотных полосах. Спе­
циалисты полагают, что отклики однотипных нейронов-де­
текторов, работающих в разных частотных полосах, каким-
то образом объединяются по диапазонам (группам частот­
ных каналов) и по оси времени. На основе такого объедине­
ния формируются полные акустические события, например, начало или конец звука, начало или конец высокочастотной или низкочастотной полосы шума, частотно-временные ко­
ординаты нисходящего или восходящего формантного пере­
ходов, наличие двухвершинной (двухформантной) или одно­
вершинной (одноформантной) конфигурации спектральной огибающей и т. д. В последнее время заметно активизировались нейро­
физиологические исследования на речевом Экс-
228 Обработка звуковых сигналов в центральных перименты проводятся на животных с такими параметрами слуховой системы, которые похожи на человека (кошки, мелкие грызуны). Сходство слухового отклика нейронных элементов животных с перцептивными реакциями челове­
ка на неречевые и речевые сигналы приводит исследовате­
лей к следующим выводам. Речевые сигналы обрабатываются человеком с помо­
щью общих слуховых механизмов. Слуховая система челове­
ка действует как процессор, хорошо приспособленный к анализу звуковых сигналов, быстро меняющихся по своим акустическим характеристикам. Не обнаружено доказа­
тельств и даже условий существования в самой слуховой си­
стеме особых детекторов фонем или различительных при­
знаков, которые бы действовали по типу "акустический сти­
мул фонемная (фонологическая) реакция". Идентифика­
ция звуковых единиц и распознавание звуковой стороны ре­
чевого сообщения происходят в высших отделах мозга на ос­
нове механизмов речемыслительной деятельности с исполь­
зованием всех доступных видов информации. 2. При обработке речевых сигналов нейронные структу­
ры слуха наиболее ярко и надежно выделяют те акустические признаки, которые необходимы и полезны для последующей фонологической интерпретации. Это означает, что фоноло­
гические контрасты, образующие звуковую систему языка, и в целом звуковая организация речи формируются с учетом рабочих возможностей и ограничений нейронных элементов, участвующих в слуховом анализе звуковых Несмотря на значительный прогресс, достигнутый в понимании функций и устройства слуховой системы, цело­
стный процесс обработки речевых сигналов в мозге челове­
ка таит в себе много загадок. Недостаточно изучены такие важные стороны этого процесса, как взаимодействие слухо­
вой информации с различными отделами мозга: с двигатель­
ными центрами, контролирующими артикуляцию, с систе­
мами памяти, которые осуществляют запоминание текущих результатов слухового анализа, с центральными структура­
ми, которые управляют работой слуховой системы на разных уровнях ее организации. До сих пор не ясно, как обрабаты­
вается звучащая речь в разных полушариях мозга, хотя из­
вестно, что левому "мозгу" принадлежит главная роль в лингвистической интерпретации речи. Все эти проблемы ждут своих исследователей. 229 Глава 4. Восприятие речи 4.4. Фонетически полезные признаки речевого сигнала В предыдущем разделе мы говорили о том, что слухо­
вая система выделяет в речевом сигнале акустические при­
знаки, которые образуют базу для лингвистической интер­
претации речевого сообщения. Одни авторы называют такие признаки полезными, другие — акустическими (слуховыми) ключами к звуковому распознаванию речи. Умение человека использовать различные акустические ключи при восприятии речи на родном языке рассматрива­
ется как проявление фонологического слуха [Бондарко 1981]. В перцептивной фонетике поиски акустических клю­
чей к распознаванию звуковых единиц языка начались го­
раздо раньше, чем эксперименты физиологов слуха и психо­
акустиков на речевом материале. Первые исследования, в которых изучались перцептивные и лингвистические реак­
ции людей на те или иные изменения в акустических харак-
230 Фонетически полезные признаки речевого сигнала теристиках речевых или речеподобных сигналов, были про­
ведены в начале 50-х годов. К этому времени фонетисты на­
копили достаточно большой опыт анализа динамических спектрограмм различных речевых образцов на разных язы­
ках и выявили много закономерностей, которые связывают акустические, артикуляционные и лингвистические харак­
теристики речевых сообщений. Возникла естественная зада­
ча — выяснить, какие из обнаруженных закономерностей и каким образом используют носители языка, распознавая звучащую речь. В данном разделе мы рассмотрим результаты исследо­
ваний, относящихся к этому вопросу, но сначала необходи­
мо познакомиться с методами экспериментальной работы, которые применяются в перцептивной фонетике. Методы исследования звукового восприятия речи При проведении перцептивного эксперимента на рече­
вом материале исследователь должен сформулировать зада­
чу, которую он предполагает решить с помощью тестирова­
ния испытуемых. От ее содержания зависит организацион­
ная сторона исследования: выбор речевого материала, спо­
соб его получения, подбор участников эксперимента и т. д. Задачи перцептивных экспериментов связаны, как пра­
вило, с изучением способности человека классифицировать, различать или оценивать сходство между речевыми или ре-
чеподобными стимулами. В опытах на классификацию (или идентификацию) испытуемый должен отнести предъявляе­
мый ему стимул к некоторому классу, обозначив его каким-
либо условным образом (буквой алфавита или транскрипци­
онным Набор различаемых классов (звуков, сло­
гов, слов) может быть ограничен экспериментатором (клас­
сификация методом вынужденного, или форсированного, выбора), не ограничен (классификация методом свободного выбора), может разрешаться или не разрешаться отказ от обязательного ответа (ответ "не знаю"). Предполагается, что в тестах на классификацию слушающий пытается тем или иным образом отождествить (идентифицировать) восприни­
маемый сигнал либо с каким-то из классов, задаваемых экс­
периментатором, либо, в случае свободного выбора, с внут­
ренними слуховыми образами. 231 Глава 4. Восприятие речи Важной, хотя и более сложной, разновидностью мето­
да идентификации является имитация, когда испытуемому предлагается произнести то, что было услышано. В экспериментах на различение испытуемым предъяв­
ляют два отдельных звуковых стимула, и он должен отве­
тить, отличаются они друг от друга или нет. Такие экспери­
менты ориентированы на получение сведений о способности испытуемых оценивать сходство/различие между предъявля­
емыми стимулами, не навязывая обязательной задачи их предварительной классификации. Часто используется так называемый АВХ-формат предъявления стимулов, который имеет много разновидностей. Опишем в качестве примера одну из них. Испытуемому предъявляется последователь­
ность из трех стимулов А, В, X, взятых из эксперименталь­
ного набора. Стимулы А и В различаются по какому-то од­
ному или нескольким акустическим параметрам, и это сооб­
щается испытуемому. Стимул X в разных последовательно­
стях совпадает либо с А, либо с В. Задача испытуемого за­
ключается в том, чтобы при прослушивании каждой тройки указать, на какой из стимулов А или В больше похож сти­
мул X. Каждая последовательность стимулов предъявляется неоднократно, и по характеру ответов испытуемого можно выделить те тройки, где выбор А или В является случайным, т. е. в 50 % случаев X считается похожим на А и в 50 % — на В. Такая реакция позволяет выявить пары стимулов А и В, которые испытуемый не различает. В экспериментах с синтезированными речевыми образ­
цами часто используется метод активного подбора акустиче­
ских параметров для получения сигналов, которые макси­
мально похожи на единицы или стимулы, задаваемые экспе­
риментатором. В этом случае испытуемый должен с помо­
щью синтезирующего устройства подобрать тот набор пара­
метров, который, по его мнению, максимально соответству­
ет задаваемым звуковым образцам. Рассмотрим теперь организационную сторону перцеп­
тивных экспериментов. Тип экспериментального материала выбирается в соответствии с задачами исследования. В каче­
стве звуковых стимулов могут использоваться акустические фрагменты, меньшие звука, фрагменты звуковой размерно­
сти, слоги или звуковые последовательности типа "гласный-
или отдельные слова, фразы, отрывки связного текста. Осмысленные речевые отрезки (слова, фра-
232 Фонетически полезные признаки речевою сигнала зы) не очень годятся для выявления фонетически полезных акустических признаков. Восприятие таких отрезков зависит не только от акустической информации, содержащейся в сигнале, но и от подсказки, которая создается знанием сло­
варя, действующих в языке правил синтаксической и смы­
словой сочетаемости слов. Поэтому при поиске акустиче­
ских ключей предпочитается речевой материал, не несущий смысла, в том числе и специально придуманные псевдосло­
ва или фразы (бессмысленные звуковые комплексы, кото­
рые построены в соответствии с законами данного языка. Ср. например, такие "русские" псевдослова, как и т. п.). Однако и восприятие псевдослов несво­
бодно от действия неакустических факторов, поскольку на перцептивные реакции носителей языка могут влиять зна­
ния о законах сочетаемости фонем, частоте их употребле­
ния, словесные ассоциации и т. п. Экспериментальный ма­
териал, состоящий из акустических фрагментов, соответст­
вующих отдельным звукам или слогам, позволяет более на­
дежно выделять акустические ключи для опознания звуко­
вых единиц. Способы получения акустических фрагментов, пред­
ставляющих выбранный тип экспериментальных стимулов, также разнообразны. Это могут быть фрагменты звучащей речи, например, слоги или звуки, выделенные из произне­
сенных слов, или же отрезки синтезированной, искусствен­
ной речи. При анализе акустических ключей необходимо иметь возможность систематически изменять физические параметры сигнала с тем, чтобы далее проверять, как эти из­
менения влияют на восприятие. В этом случае широко при­
меняются синтезированные речеподобные стимулы, тем бо­
лее что многие современные синтезаторы речи позволяют получать звучащую речь достаточно высокого качества. Пре-
имущество естественных образцов состоит в их натурально­
сти. Многие виды изменения акустических параметров в та­
ких образцах сейчас можно легко осуществить с помощью звуковых компьютерных редакторов: вычленить/удалить оп­
ределенный фрагмент, увеличить/уменьшить длительность или амплитуду, пересадить какие-то куски из одного сигна­
ла в другой. Однако ряд важных модификаций, например, контролируемое изменение частоты формант гласных или основного тона голоса, без использования синтезаторов осу­
ществить практически невозможно. 233 Глава 4. Восприятие речи При проведении перцептивного исследования экспе­
риментатор обязательно составляет инструкцию, в которой должны быть четко определены задания для испытуемых. В зависимости от целей исследования к участию в экспери­
ментах могут привлекаться фонетисты, квалифицированные специалисты-лингвисты, просто носители изучаемого языка и даже люди, не владеющие им. Как видим, организация опытов по восприятию речи — непростая задача, которая требует большой предварительной подготовки и ясных представлений о том, для чего прово­
дится каждый Один из наиболее трудных мо­
ментов планирования перцептивного теста состоит в том, чтобы испытуемых выполнять эксперименталь­
ные задания на основе сложившихся навыков звукового вос­
приятия речи, а не путем текущей подстройки к особенно­
стям конкретного эксперимента. Психологам хорошо из­
вестна разница между поведением человека в условиях тес­
тирования, которое всегда ограничено определенным соста­
вом тестирующих вопросов, и реальными поступками, когда те же вопросы приходится решать в естественных, неэкспе­
риментальных ситуациях. Чтобы избежать влияния экспери­
ментальной процедуры на перцептивные реакции испытуе­
мых, рекомендуется разнообразить набор эксперименталь­
ных стимулов, вводя в него "отвлекающие" речевые образ­
цы, не имеющие отношения к цели эксперимента, исклю­
чить многократное предъявление испытуемым одних и тех же стимулов и не использовать один и тот же набор при те­
стировании испытуемых более одного раза [Венцов, Касевич 1994]. В большинстве перцептивных экспериментов, опи­
санных в литературе, указанные условия, к сожалению, не выполняются. Это не снижает научной ценности результа­
тов, полученных учеными, однако вопрос о том, в какой сте­
пени реакции и умения испытуемых, обнаруженные в ходе эксперимента, соответствуют реальным процессам звукового восприятия речи, остается открытым. Более подробно организация перцептивных экспериментов обсуждается в [Бондарко 1981]. Там же описываются результаты опытов по восприятию речи на русском языке. 234 Фонетически полезные признаки речевого сигнала 4.4.2. Акустические ключи для распознавания фонем и их последовательностей Исследователи восприятия речи исходят из допущения, что на этапе языковой реконструкции сообщения слушаю­
щий восстанавливает цепочку фонем, которая была реализо­
вана в речевом сигнале. Как было отмечено выше, отдельные звуки, слоги и псевдослова образуют наиболее удобный мате­
риал для определения акустических ключей, которые исполь­
зуются в этом процессе. Перцептивные эксперименты, на­
правленные на поиск таких ключей, группируются вокруг двух направлений. В одних тестах исследуется способность человека производить слуховое членение речевого сигнала, т. е. обнаруживать резкие изменения в его акустических свой­
ствах и делить сигнал на отрезки, которые таких изменений не содержат. В других — изучается умение слушателей субъе­
ктивно оценивать (измерять) акустические характеристики выделенных отрезков и соотносить эти оценки с фонемны­
ми единицами языка и их фонологическими признаками. Акустические ключи для слухового членения речевого сигнала Большое количество экспериментов, в которых анали­
зировалось слуховое членение, или перцептивная сегмента­
ция, речевого сигнала, описано в [Чистович и др. Ре­
зультаты перцептивных тестов на материале синтезирован­
ных речеподобных стимулов подтвердили, что слух человека очень чувствителен к резким изменениям акустических па­
раметров сигнала во времени. Например, если на протяже­
нии звучания сигнала, подобного гласному, в какой-то мо­
мент времени происходит скачок амплитуды звукового дав­
ления, сигнал может восприниматься по-разному: как глас­
ный, как двойной гласный или же как последовательность гласных и сонорных согласных (Г, ГГ, СГ, ГС). Конкретная фонетическая интерпретация зависит от величины ампли­
тудного скачка, его скорости и положения относительно границ воспринимаемого сигнала. В экспериментах по слогов было установлено, что для слогов типа СГ стабильность вос­
приятия слоговой структуры и опознание ее отдельных эле­
ментов существенно выше в тех случаях, когда первый звук 235 Глава 4. Восприятие речи является шумным, а не сонорным согласным 1981]. Это говорит о различной чувствительности слуха к акустическим изменениям разного типа: на границе шумно­
го согласного и гласного происходит не только более резкий скачок амплитуды, чем в слогах с сонорными, но и смена источника звука. Трудности членения речевого сигнала на вокальных участках, соответствующих сочетаниям гласных с сонорны­
ми согласными, хорошо известны фонетистам. Эксперимен­
ты показывают, что при опознании слогов типа СГ наи­
большее количество ошибок, связанных с опознанием сло­
говой структуры, приходится на слабые безударные слоги, которые часто воспринимаются как единый гласный [Бон­
дарко 1981]. Перепады интенсивности на вокальных участ­
могут быть поддержаны резкими изменениями ны, как это имеет место на границе гласных с носовыми со­
гласными. В этом случае фонетически полезными являются два типа акустических ключей: перепад интенсивности и из­
менение спектра в низкочастотной области, где на участке носового согласного появляется сильная форманта назализа­
ции и ослабляются ротовые форманты. Поэтому для сочета­
ний гласных с носовыми сонантами, особенно типа ГСГ, ве­
роятность слухового членения выше, чем для сочетаний с такими сонорными, которые характеризуются плавным хо­
дом формант (типа русских [л, и Что же касается перцептивной сегментации шумовых участков, соответствующих последовательности шумных со­
гласных, то здесь экспериментальных данных слишком ма­
ло, чтобы сформулировать какие-то закономерности. Исследователи, занимающиеся изучением слухового членения, считают, что обнаружение акустических измене­
ний в сигнале приводит к образованию граничных маркеров (меток), которые используются слушающим для считывания и оценки спектральной информации в их окрестности. Предполагается также, что слух вырабатывает разные марке­
ры для положительных и отрицательных приращений амп­
литуды сигнала. В первом случае образуются метки начал акустических отрезков, во втором - метки концов. В част­
ности, экспериментально показано, что слуховая система с большой надежностью формирует метки начал и концов гласных в сигналах, соответствующих последовательностям гласных и шумных согласных. Образование таких маркеров 236 4.4. Фонетически полезные признаки речевого сигнала является основой для измерения длительности отрезков сиг­
нала, вычленяемых слухом. Перцептивная сегментация напоминает акустическое членение, которое производит фонетист при интерпретации динамических спектрограмм (или осциллограмм) неизвест­
ных речевых образцов. Однако есть и существенные разли­
чия. Работа фонетиста основана на оценке визуальной ин­
формации, и сведения о пороговых величинах амплитудных изменений, которые приводят к слуховому членению сигна­
ла, как правило, не учитываются. К сожалению, и в науке этот вопрос до сих пор не решен. Кроме того, слуховое чле­
нение характеризуется определенными временными ограни­
чениями. Экспериментальные данные свидетельствуют, что акустические изменения, которые оцениваются слухом как последовательные начальные маркеры, должны быть отделе­
ны во времени интервалом, превышающим в среднем Если изменения обнаруживаются на интервале меньшей величины, они интерпретируются как одновременные и не приводят к образованию отдельного отрезка. Величина кри­
тического временного интервала сильно зависит от физиче­
ских свойств сигнала. Например, для вычленения отрезка взрыва глухого согласного перед гласным достаточно, чтобы интервал между началом шума и началом гласного был больше 10-15 мс. Важно также иметь в виду, что слуховое членение осуществляется текущим образом, по мере посту­
пления звуковой информации по слуховому нерву. При этом сенсорная система обработки сигнала может "видеть" одно­
временно только небольшой его фрагмент: по оценкам спе­
циалистов, временное окно анализа равняется приблизи­
тельно 250 мс 1979]. От размеров окна зависит возможность измерения длительности выделяемых отрезков, а также все слуховые операции, для которых необходимы де-
тальные сведения о спектрально-временной картине речево­
го потока. Современное состояние научных знаний о том, как че­
ловек производит слуховое членение звучащей речи, нельзя признать полным и исчерпывающим. Правда, ученые уже создают рабочие компьютерные модели, в которых воспро­
изводятся главные особенности этой процедуры [Чистович и др. В этих моделях метки членения фиксируют вре­
менные моменты резких изменений в акустических характе­
ристиках сигнала. Они могут соответствовать таким акусти-
237 Глава 4. Восприятие речи ко-фонетическим событиям, как начало шума, взрыва, во­
кального участка, гласного, конец гласного, конец звука. Образование метки определяется свойствами нервных эле­
ментов слуховой системы, которые обнаруживают акустиче­
ские изменения. Речевые сигналы, соответствующие двум произнесениям одного и того же речевого образца, могут по­
лучить разное слуховое членение в зависимости от физиче­
ской выраженности изменений. Перцептивная сегментация не совпадает с членением на звуки (фрагменты фонемной размерности) в лингвистическом понимании. Некоторые от­
резки, выделяемые слухом, могут рассматриваться как ли­
нейные компоненты звуковых единиц. Например, на участ­
ках реализации глухих согласных в позиции между гласны­
ми обычно выделяются такие отрезки, как пауза и шум взрыва. В других случаях один перцептивный отрезок может соответствовать целой последовательности звуков. В то же время слуховое членение явно коррелирует с артикуляцией и резкими изменениями в работе источников звука и пере­
стройками в передаточной функции речевого тракта. Из­
лишняя детализация такой акустически ориентированной сегментации может быть устранена в процессе дальнейшей фонологической интерпретации, а недостаточная — едва ли. Полезность перцептивной сегментации заключается не только в том, что она создает фонетически значимое члене­
ние речевого потока. Помимо этого, появляется возмож­
ность использовать акустические ключи, которые заключе­
ны в физических характеристиках граничных меток и выде­
ленных отрезков сигнала. Основные акустические ключи для фонемной идентификации Главным критерием при оценке фонетической полез­
ности тех или иных акустических характеристик речевого сигнала является их вклад в идентификацию и различение звуковых единиц языка. Поэтому вопрос о наборе акустиче­
ских ключей, которые использует человек для опознания фонемного состава речевого сообщения, требует исследова­
ния того, как носители данного языка классифицируют и различают те или иные речевые образцы. В то же время об­
щие свойства целевых артикуляций основных классов зву­
ков, закономерности коартикуляции и формирования рече-
238 Фонетически полезные признаки речевого сигнала вого сигнала, а также особенности обработки звуковых сиг­
налов человеческим слухом (в частности, описанное выше слуховое членение), вносят в звуковое восприятие речи оп­
ределенные универсальные черты, позволяя выделить глав­
ные типы слуховых признаков фонем. Ниже мы приводим сведения, обобщающие результаты перцептивных экспери­
ментов, при проведении которых в качестве испытуемых привлекались носители разных языков. Мы не ставим перед собой задачи исчерпывающего изложения имеющихся дан­
ных, поэтому ограничимся рассмотрением слуховых призна­
ков гласных и шумных согласных. Для любого языка звуковые противопоставления, свя­
занные со способом образования, базируются на таких аку­
стических ключах, которые обладают максимальной устой­
чивостью и надежностью обнаружения. Это касается прежде всего противопоставления шумных согласных и вокальных звуков, к которым относятся гласные и сонорные согласные, а также противопоставлений по способу образования для шумных согласных. Важная акустическая информация о признаке содержится в частотных характеристиках акустических изменений, на основе кото­
рых производится слуховое Экспериментально установлено, что метки слухового членения "привязаны" к определенным частотным областям. Например, метка нача­
ла гласного распространяется обычно на область частот от О до кГц, а метка, соответствующая началу шума, появляется именно в том частотном где он обна­
руживается, т. е. в области средних или высоких На вокальный характер отрезка указывают и такие свойства, как периодичность и наличие формантной структуры. Человече­
ский слух отчетливо фиксирует присутствие этих свойств в звуковом сигнале. Противопоставление шумных согласных по способу образования базиру-
К выводу о том, что сегментация речевого сигнала осуществляется одновре-
менно с интерпретацией выделяемых отрезков по типу источника звука (или способу образования), приводит и опыт фонетической интерпретации спектрограмм неизвестных слов [Зиновьева 1989]. В предыдущем разделе отмечалось, что изменения амплитуды (энергии) в сигнале сначала обнаруживаются слухом локально, в отдельных частотных полосах, а затем объединяются. В результате формируется информация о "полном" изменении, которая и задает частотное положение метки [ Родио-
нов и др. 1976]. 239 Глава 4. Восприятие речи ется на ключах иной природы. Для восприятия согласных этих классов важна последовательность определенных аку­
стических отрезков и их соотношение по длительности. Так, например, взрывным и аффрикатам в позиции между глас­
ными соответствует последовательность, состоящая из паузы (глухой или звонкой) и отрезка шума. Если длительность па­
узы больше или равна длительности шума, последователь­
ность воспринимается как взрывной согласный. Опознание аффрикат основано на обратном соотношении длительно­
стей отрезков. Появление же паузы (даже очень краткой) пе­
ред длительным шумом искажает восприятие фрикативных согласных. В начале слова (фразы) акустическую паузу глу­
хих взрывных и аффрикат выделить невозможно. В этой по­
зиции "работают" другие ключи: скорость нарастания энер­
гии и характер ее изменения на начальном участке шума, а также длительность шумового отрезка. Акустические ключи, используемые для идентифика­
ции гласных, содержатся, прежде всего, в формантной кар­
тине их собственных отрезков. В слуховых спектрах глас­
ных имеется, как правило, больше двух формантных макси­
мумов, которые хорошо обнаруживаются и даже подчерки­
ваются на дальнейших этапах слухового анализа [Чистович и др. 1976]. Еще в 1952 г. были проведены эксперименты, ко­
торые показали, что с помощью двух формант можно синте­
зировать почти все возможные гласные а1. 1952]. При этом было обнаружено, что для синтеза гласных перед­
него ряда (типа русских [и] и частота должна суще­
ственно превышать значения, типичные для соответствую­
щих естественных гласных. Оказалось также, что для синте­
за гласных заднего ряда (типа русских [у] и достаточно одной форманты. В связи с этим возник вопрос о вкладе различных формант в восприятие гласных. В последующих экспериментах исследователям удалось установить, что идентификация гласного зависит как от рас­
стояния между формантными максимумами по частоте, так и от их относительной амплитуды [Чистович, Люблинская Если расстояние между формантами по частоте мень­
ше некоторой критической на восприятие глас­
ного влияет только та форманта, которая имеет существен­
На слуховой шкале частот эта величина равна 3­3,5 Барк (см. выше п. 4.2.5). 240 4.4. Фонетически полезные признаки речевого но большую амплитуду. Если же разность между амплитуда­
ми формант невелика (не превышает 30 дБ), полезным при­
знаком гласного становится частота, значение которой нахо­
дится между частотами реальных формантных максимумов. Описанное явление — оценка двух (или более) формантных максимумов одним значением частоты в зависимости от ам­
плитудных отношений между формантами — получило на­
звание эффекта локального центра тяжести. При расстоянии между частотами формант, большем критической величины, подобного эффекта не наблюдается. В этом случае частота каждой форманты сохраняет свою значимость для воспри­
ятия, но относительная амплитуда формант также влияет на результаты идентификации гласных. Учитывая изложенные наблюдения, американский уче­
ный К. предложил уточнить акустико-слуховые ос­
нования для классификации гласных по ряду и подъему [Stevens
Для передних гласных разность по частоте меньше критической величины (3 Барк), а для больше. Различия по подъему соотнесены с разностью
где
— основная частота гласного. Для гласных верхнего подъема, в отличие от остальных, эта разность меньше кри­
тической величины. Акустико-слуховые контрасты носят от­
носительный характер, что позволяет освободиться от из­
вестной зависимости физических частот формант от разме­
ров речевого тракта говорящего. Предпринимались и другие попытки проанализировать связь картины с восприятием гласных. В боль­
шом количестве экспериментов на разных языков ставилась задача определить области, которые с точки зре­
ния восприятия занимают разные гласные в пространстве возможных значений частот
F1
и
F2
(эффект локального центра тяжести не Перцептивные эксперимен­
ты такого рода проводятся обычно с набором изолирован­
ных стационарных гласных, полученных с помощью синте­
за. Восприятие гласных исследуется с помощью методов ак­
тивного подбора формантных частот или же методом иден­
тификации. В последнем случае экспериментальный мате­
риал включает стимулы, частота формант которых изменяет­
ся в определенном диапазоне. При предъявлении стимула испытуемый должен указать гласный, который он слышит. Набор различаемых гласных задается экспериментатором. Цель эксперимента состоит в том, чтобы найти значения ча-
241 Глава 4. Восприятие речи стот формант, при которых два соседних по ряду или подъему гласных выбирают­
ся испытуемыми с одинако­
вой вероятностью (50 % от­
вет). Совокупность таких значений образует фонем­
ную границу между гласны­
ми в пространстве формант­
ных частот. На рис. 4.17 в качестве примера приведе­
ны результаты эксперимен­
та по идентификации двух­
формантных гласных носи­
телями немецкого языка (воспроизводится тович и др. Из рисунка видно, что большинство фонемных границ хорошо аппрокси­
мируются прямыми ми, параллельными оси или ¥2. Это означает, что фонемная идентификация основывается, как правило, на одной из формант. Для гласных, которые различаются по признаку ряда, существенной является частота ¥2, для раз­
личий по признаку подъема ­ частота Аналогичные ре­
зультаты были получены и для других языков. При проведе­
нии экспериментов обнаружилось, что время, которое затра­
чивает испытуемый на принятие фонемного решения, зако­
номерно возрастает при приближении физических парамет­
ров стимула к области фонемной границы. По мнению следователей, это говорит о том, что, принимая фонемное решение, испытуемый оценивает сходство стимула с каки­
ми­то внутренними образами, которые соответствуют эта­
лонным (типовым) реализациям выделяемых фонемных классов. Как уже отмечалось, в экспериментах по определению фонемных границ применяются стационарные гласнопо­
добные сигналы, т. е. экспериментальная ситуация очень далека от естественной речи. Бондарко, анализируя ре­
242 4.4. Фонетически полезные признаки речевого сигнала зультаты таких экспериментов, справедливо отмечает, что они свидетельствуют прежде всего об универсальной спо­
собности слуха делить гласноподобные стимулы на классы, опираясь на частоты формант Иными словами, зна­
чимость формантных ключей для опознания гласных под­
тверждается, но механизм их использования в естественных условиях остается неясным. Из акустических исследований хорошо известно, что наличие стационарного участка в гласном является в речи скорее исключением, чем прави­
лом, а формантная картина гласного сильно меняется под влиянием звукового окружения. Поэтому неудивительно, что даже при небольшом приближении экспериментального материала к естественным речевым условиям обнаруживает­
ся зависимость опознания гласноподобного стимула от кон­
текста. Оказывается, что один и тот же стимул может ин­
терпретироваться по-разному в зависимости от окружающих согласных. Например, стимул с
Гц и
Гц при изолированном предъявлении опознается носителями рус­
ского языка как гласный [а], в слоге [п — ш] также как [а], а в слоге [т — с] чаще как [о] [Бондарко 1981]. Это указыва­
ет на то, что испытуемые каким-то образом знают, как реа­
лизуется та или иная фонема в конкретном звуковом кон­
тексте. Теоретически контекстное варьирование гласных мо­
жет приводить к формированию "знаний" двоякого рода. С одной стороны, носитель языка может расширить набор раз­
личаемых классов гласных, т. е. использовать систему слу­
ховых эталонов, количество которых превосходит число гласных фонем в языке. В этом случае опознавание гласных в контексте производится так же, как идентификация изо­
лированных гласных, - на основе оценки сходства с имею­
щимися эталонами. С другой стороны, гласные могут распо­
знаваться с помощью особой обработки формантной карти­
ны соответствующих отрезков сигнала. Динамика формант­
ных движений (в особенности
F2)
на отрезке гласного зави­
сит одновременно от его собственного качества, места обра­
зования и признаков дополнительной вокалической артику­
ляции соседних согласных. Слушающий может использовать информацию, которая содержится в динамических формант­
ных ключах, для идентификации указанных признаков сог­
ласных и, опираясь на полученный результат, "вычислять" фонемную принадлежность гласного с учетом кон-
243 Глава 4. Восприятие речи текста. Исходными точками для подобных вычислений мо­
гут служить эталоны изолированных (внеконтекстных) глас­
Вопрос о том, как на самом деле учитываются разно­
образные контекстные влияния при фонемном распознава­
нии гласных, находится в стадии интенсивного изучения. Для его решения большое значение имеют результаты пер­
цептивных экспериментов, в которых исследуются акустиче­
ские признаки, несущие информацию о месте образования согласных. Акустический анализ шумных согласных показывает, что от места образования зависят как физические свойства шумового отрезка согласного, так и характеристики перехо­
дов
F2
на граничных участках соседних гласных. Уже в пер­
вых перцептивных экспериментах было обнаружено, что большинство шумных согласных, в особенности взрывных, плохо опознается вне контекста. Участки взрывов имеют не­
значительную длительность, и, возможно, это является глав­
ной причиной их плохого опознавания. Вторая причина — отсутствие необходимых акустических ключей на шумовом отрезке согласного. Исследованию восприятия взрывных согласных, раз­
личающихся местом образования, посвящено большое ко­
личество работ. В качестве экспериментального материала в них использовались синтезированные стимулы, напоми­
нающие естественные слоги СГ (или, реже, ГС). В одних экспериментах анализировались особенности идентифика­
ции согласных при переменных параметрах спектра взрыва и постоянных частотах
F1
и
F2,
в других — при отсутствии взрыва и переменных характеристиках перехода
F2 et 1952; 1954]. В настоящее время большой популярностью пользуется гипотеза, согласно которой наи­
более важные ключи для распознавания места образования шумных согласных (взрывных и фрикативных) содержатся в окрестности начала последующего гласного, на времен­
ном интервале, равном приблизительно мс
[Stevens Для понимания различий между описанными возможностями удобно иметь в виду следующую аналогию. В русском языке, как известно, одно и то же слово имеет несколько грамматических форм, т. е. представлено совокупно­
стью словоформ или парадигмой. Мы можем помнить либо все словофор­
мы как отдельные единицы, либо только одну исходную форму, а осталь­
ные выводить по правилам тогда, когда это оказывается необходимым. 244 4.4. Фонетически полезные признаки речевого 1985]. В случае взрывных этот интервал начинается меткой взрыва. В ряде экспериментов удалось установить, что иденти­
фикация места образования определяется несколькими признаками указанного интервала: наличием/отсутствием выраженной полосы усиления шума, ее шириной и частот­
ным положением относительно в начале гласно­
го. Важен также характер изменения интенсивности сигна­
ла при переходе от шума к гласному в той части спектра, где расположена область усиления шума. Наблюдаемые особен­
ности восприятия сводятся к следующему. Диффузный шум без выраженной области усиления и увеличение интенсивности сигнала в области высоких час­
тот (выше ¥4 последующего гласного) на границе с гласным соотносится с восприятием губных согласных. Широкопо­
лосный шум с выраженной областью усиления в области ¥4 последующего гласного (или выше) и уменьшение интен­
сивности в этой области при переходе к гласному соответст­
вуют восприятию зубных и альвеолярных согласных. полосный шум (ширина меньше критической полосы слуха) с выраженной областью усиления в области последующе­
го гласного и мало изменяющаяся интенсивность в этой об­
ласти при переходе к гласному приводят к восприятию постальвеолярных согласных. Велярным согласным соответ­
ствуют характеристики, аналогичные постальвеолярным, од­
нако область усиления шума ниже — вблизи ¥2 последую­
щего гласного. В качестве дополнительного признака может выступать интенсивность шума: переднеязычные при прочих равных условиях громче остальных согласных. Для восприятия согласных, различающихся местом об­
разования, важны и формантные ключи, привязанные к гра­
ничным меткам соседних гласных. При отсутствии взрыва у взрывного согласного (такое бывает в естественной речи) они становятся единственными признаками, сигнализирую­
щими противопоставления согласных по месту артикуляции. В слогах типа СГ восприятие губных согласных связано с низким положением начала контура ¥2 (приблизительно в области, типичной для ¥2 у гласного и ровным или вос­
ходящим характером дальнейшего движения в зависимости от ряда и лабиализации самого гласного. Идентификация переднеязычных согласных соотносится с начальным поло­
жением ¥2 в области, характерной для этой форманты у 245 Глава 4. Восприятие речи гласного Дальнейшее развитие ого контура оп­
ределяется указанными артикуляционными признака­
ми гласного. Восприятие велярных согласных достигается при разных начальных значениях ¥2, однако важно, чтобы начало контура совпадало по частоте с областью усиле­
ния на предшествующем шумовом отрезке. Существенный признак велярных согласных ­ сближение начальных точек контуров ¥2 и В слогах типа ГС, лишенных взрыва, восприятие кон­
сонантных различий по месту образования достигается толь­
ко с помощью формантных ключей. При этом частотное по­
ложение ключей на граничной метке конца гласного анало­
гично описанному выше для метки начала, а направление частотных изменений формант относительно середины гласного является зеркальным отражением того, что наблю­
дается в слоге СГ. Акустические ключи для признака "глухости/звонко­
сти" согласных исследовались многими авторами и особен­
но интенсивно на материале согласных английского языка. Этот фонологический признак является наиболее ярким примером множественности акустических ключей. В пер­
цептивных тестах обнаружено, что на восприятие данного противопоставления влияют (в разной степени) почти все акустические признаки, которые сопровождают его артику­
ляционную реализацию. Если собрать результаты, получен­
ные разными исследователями, то набор акустических клю­
чей для этого признака должен включать (только в сочета­
ниях взрывных согласных с гласными) следующие показате­
ли: наличие/отсутствие периодичности в окрестности слухо­
вой метки начала или конца гласного; длительность времен­
ного интервала между моментом взрыва и началом фонации; наличие начального перехода ¥\ в последующем гласном; длительность шумового участка и выраженность в нем фор­
мантных усилений; интенсивность шумового участка отно­
сительно интенсивности последующего гласного в области начальной метки последнего; характер изменений основной частоты голоса в области метки взрыва; длительность пред­
шествующего гласного. Вся совокупность рассмотренных нами эксперимен­
тальных данных говорит о том, что связь между акустико­
слуховыми признаками речевого сигнала и их фонологиче­
скими коррелятами имеет сложную природу. Прежде всего 246 4.4. Фонетически полезные признаки речевого обращает на себя внимание разная картина соответствия ме­
жду слуховыми и лингвистическими свойствами согласных и гласных. Акустические ключи для согласных распределяются по разным отрезкам сигнала (взрывные согласные в положении между гласными могут иметь ключи в окрестности границ четырех Они локализуются в основном в области границ перцептивных отрезков, и по крайней мере некото­
рые из них не зависят от звукового окружения. Для фоноло­
гических признаков согласных характерна множественность ключей. Иначе говоря, действует схема "много клю­
а набор ключей может зависеть от кон­
текста. Когда ключей много, возникает вопрос о весе от­
дельных ключей для восприятия звукового противопоставле­
ния, а также о необходимом или допустимом балансе коли­
чественных отношений между ними (так называемые
Эта проблема представляется непростой для пер­
цептивного исследования. Для ее решения необходимо од­
новременно контролировать несколько акустических пара­
метров с тем, чтобы найти такие комбинации, которые но­
ситель языка оценивает как знакомый акустический комп­
лекс. В экспериментах, описанных в литературе, до сих пор исследовался, как правило, один акустический параметр. Акустические ключи для фонологических признаков гласных находятся на отрезке самого гласного. Для них не характерна соотнесенность с границами отрезка, а контекст­
ная зависимость, напротив, является типичной чертой. Са­
мих ключей немного, и почти все связаны с картиной гласного. Наблюдается тенденция к тесной корре­
ляции
F1
с подъемом гласного,
a F2
- с рядом, однако для некоторых гласных такой однозначной связи нет. В настоящее время неизвестны механизмы сбора и объ­
единения информации, передаваемой акустическими ключа­
ми, в фонологические признаки и фонемные единицы язы­
ка. Большинство исследователей считают, что такие механиз­
мы действуют за пределами слуховой системы человека. Категориальность восприятия При проведении перцептивных тестов, в которых изу­
чалось влияние характеристик перехода
на восприятие взрывных согласных
[b, d, g]
носителями английского язы-
247 Глава 4. Восприятие речи ка, исследователи обнаружили интересное явление, при­
влекшее внимание многих ученых и послужившее толчком к большому количеству специальных экспериментов et 1957]. Экспериментаторы сначала тест на идентифи­
кацию (с вынужденным и свободным выбором). В результа­
те этого теста было установлено, что испытуемые уверенно делят экспериментальный набор стимулов на три класса; были определены также категориальные (фонемные) грани­
цы между взрывными согласными по параметрам изменения переходов
F2.
После этого на том же материале и с теми же испытуемыми был проведен эксперимент на различение стимулов. Оказалось, что испытуемые не различают стиму­
лы, которые были отнесены ими к одному и тому же классу даже при большом физическом различии между ними. В то же время стимулы, близкие по физическим характеристи­
кам, но оказавшиеся в опыте на идентификацию в разных классах, различались очень хорошо. Неспособность испыту­
емых различать стимулы, которые они относят к одному фо­
немному классу, назвали восприятия. Результаты описанного эксперимента могли служить основанием для фонологического объяснения категориаль-
ности восприятия: физически разные звуки, которые вос­
принимаются испытуемыми как один из согласных
[b, d, не различаются потому, что в английском языке они явля­
ются реализациями одной и той же фонемы. Однако после­
дующие эксперименты показали, что такое объяснение уп­
рощает реальную ситуацию. Оказалось, что новорожденные дети и некоторые животные (грызуны, обезьяны-макаки, шиншиллы) в специальных экспериментах на различение реагируют на слоги с указанными взрывными так же, как взрослые носители английского языка, т. е. обнаруживают острую чувствительность к некоторым физическим значе­
ниям перехода
F2,
никак не реагируя на другие. Из этого можно сделать вывод, что реакция слуха на непрерывные из­
менения некоторых акустических параметров имеет кван-
тальный (скачкообразный) характер. Опираясь на результаты экспериментов по изучению квантальных свойств слуха при восприятии речевых сигна­
лов, американский исследователь К. расширил свою теорию "квантальности", которая была первоначально сформулирована им для артикуляционно-акустических от-
248 4.4. Фонетически полезные признаки речевого сигнала ношений между звуками (см. об этом главу 3). Напомним, что согласно этой теории для каждого артикуляционного па­
раметра (или набора параметров) существуют такие области изменения, которые создают резкие акустические контрасты даже при относительно неточной артикуляции. Это учитыва­
ется при образовании звуковых инвентарей в языках мира: для создания звуков предпочитаются прежде всего те арти­
куляции, которым соответствуют квантальные акустические различия. Акустико-слуховые квантальные отношения, на­
блюдаемые для ряда акустических параметров речевого сиг­
нала, тоже влияют, по мнению Стивенса, на использование звуковых различий для фонологических целей (выражения смысловых противопоставлений). Согласно гипотезе, развиваемой Стивенсом, в языках должны чаще встречаться звуковые противопоставления, ко­
торые базируются на акустико-слуховых отно­
шениях
[Stevens
1989; 1999]. Биологические возможности и ограничения, действующие как при речепроизводстве, так и при восприятии речи, задают определенные рамки для фор­
мирования звукового строя разных языков, что приводит к наличию сходных черт в составе фонемных инвентарей и звуковой организации речи. Однако нет оснований считать, что эти биологические рамки "диктуют", какие звуковые контрасты должны быть выбраны людьми для выражения смысловых различий в конкретном языке. Эксперименты с разными акустическими параметрами, в которых проверялась категориальность восприятия звуко­
вых различий, создаваемых на их основе, добавили новые штрихи к особенностям соотношения ские признаки" для согласных и гласных. Было обнаружено, что большинство акустических признаков, физические хара­
ктеристики которых влияют на восприятие согласных, име­
ют категориальную природу. Что же касается гласных, то здесь ситуация оказалась сложнее: при их изолированном предъявлении испытуемые различали и такие стимулы, ко­
торые в тесте на идентификацию были отнесены к одному и тому же классу. Категориальность восприятия до сих пор является объектом многих исследований. 249 Глава 4. Восприятие речи 4.4.3. Акустические ключи для идентификации звуковых средств Слоговые тоны, словесное ударение, различные эле­
менты интонационного оформления фразы так же, как фо­
немные единицы языка, имеют свои наборы акустических ключей, которые принято называть просодическими. Раз­
граничение между фонемными и просодическими ключами связано не столько с их акустической базой, сколько с тем, на какие звуковые противопоставления они "работают". В то же время можно говорить о преобладающей функцио­
нальной нагрузке разных акустических параметров, имея в виду информационный вклад и вес акустических ключей, которые создаются на их основе. С этой точки зрения дли­
тельность, интенсивность и частота основного тона могут считаться главными (но не единственными) универсальны­
ми носителями просодической информации, особенно для эмоционально нейтральных речевых сообщений. Исследования восприятия и опознания слоговых тонов в тональных языках [Румянцев 1972; Касевич и др. 1990] по­
казывают, что ведущим акустическим параметром является частота основного тона (ЧОТ) на (гласном). Основные типы просодических ключей, которые могут бази­
роваться на этом параметре, сводятся к следующим призна­
наличие/отсутствие перелома в изменении ЧОТ и его тип (максимум, минимум); наличие/отсутствие изменения ЧОТ при отсутствии перелома (кинетический/ровный); на­
правление изменения ЧОТ (восходящее, нисходящее); сте­
пень или диапазон изменения ЧОТ (значительное/незначи­
тельное); частотная область начала и конца изменения ЧОТ для однонаправленных изменений или частотное положение точки тонального перелома для двунаправленных сложных изменений (высокий/средний/низкий). Еще раз напомним, что речь идет об оценке, которая дается слуховой системой: то, что по объективным акустическим показателям выглядит как небольшое увеличение или уменьшение ЧОТ, субъек­
тивно может оцениваться как ровный тон. К совокупности собственно тональных ключей могут добавляться также просодические признаки другой приро­
ды, основанные на относительной интенсивности и длитель­
ности слогоносителя, а также на спектральных коррелятах различных типов фонации. Фонационная информация со-
250 4.4. Фонетически полезные признаки речевого сигнала держится прежде всего в спектральных характеристиках го­
лосового источника и через него влияет на окончательную спектральную картину слога, несущего тон. Исследуя опознание слоговых тонов, важно определить такие комбинации акустических признаков, которые полу­
чают разную качественную оценку при восприятии. Боль­
шое значение имеет количественный баланс разных просо­
дических ключей, создающий наиболее естественное вос­
приятие каждого тона во всех возможных фонетических контекстах его употребления. Своим комплексом акустических ключей обладает и сло­
весное ударение, точнее, степень слога (гласно­
го) во фразе, на основе которой может быть принято решение о месте ударного слога в слове. Кроме собственно просодиче­
ских ключей, для словесного ударения важны также ключи, содержащиеся в спектральных характеристиках гласных. Достаточно интенсивные исследования восприятия словесного ударения проведены на материале русского язы­
ка [Златоустова 1962; Бондарко 1981; Касевич и др. 1990; Светозарова 1982]. Они показали, что наиболее надежным признаком ударности гласного является значительное изме­
нение частоты основного тона, либо в виде движения тона на самом гласном, либо в виде изменения тонального поло­
жения гласного относительно соседних гласных. Однако на­
личие изменения ЧОТ на ударном гласном обусловлено фразовой и стилем произношения (тщатель­
ная/беглая речь). В слабых фразовых позициях, особенно в беглой речи, этот признак может отсутствовать. Существенным признаком степени выделенности глас­
ного служит величина контраста по длительности с соседни­
ми звуками, прежде всего с последующим а так-
В главе 3 отмечалось, что сфера реализации локальных фразовых тональных фигур (акцентов) связана с ударным слогом. Для определения места словес­
ного ударения в русском языке важно именно наличие этой привязки. Признак контраста удобен тем, что не зависит от темпа речи, под воздейст­
вием которого существенно меняются абсолютные длительности гласных. В то же время, если понимать этот признак как простое отношение "боль­
ше/меньше", то он не слишком надежен для определения места ударения, поскольку длительность гласного при любом темпе определяется также ка­
чеством гласного. Поэтому длительность гласного [а] в первом предударном слоге, как правило, больше длительности следующего ударного [и] ( особен­
но, если дальше нет Однако величина временного контраста удар­
ного с последующим безударным в аналогичных условиях существен-
251 Глава 4. Восприятие речи же степень сокращения квазистационарного участка, кото­
рая сопровождается увеличением доли переходных участков на отрезке гласного. Слабые безударные гласные часто пре­
вращаются в своего рода вокальные прокладки. Их акусти­
ческие характеристики полностью определяются окружаю­
щими согласными, и это само по себе является признаком минимальной степени выделенности. С формантными параметрами связан также такой по­
лезный признак словесного ударения, как изменение тины гласного в сторону сближения с нейтральным гласным (или позицией речевой позы): чем меньше выделен гласный, тем больше его артикуляторная редукция и утрата индивиду­
ального качества. Определенное значение для русского словесного ударе­
ния имеет и величина относительного контраста гласного по интенсивности, особенно с последующим гласным. Однако надежность этого признака меньше в сравнении с остальны­
ми признаками выделенности. В области интонации специальных исследований, по­
священных тому, какие акустические ключи человек ис­
пользует для опознания различных элементов интонацион­
ного оформления речевого сообщения, пока немного, хотя интерес к этой проблеме постоянно растет. Основные сведе­
ния, которые имеются, относятся к интонации эмоциональ­
но нейтральных сообщений, особенно в ситуациях, когда с интонацией непосредственно связано различие сообщений по смыслу, как, например, в русских повествовательных и вопросительных фразах Мы на дачу Мы по­
едем на дачу Мы поедем
на дачу и т. Главные просодические ключи в этих случаях содер­
жатся в изменениях частоты основного тона на отрезках Наибольший вес имеют признаки, которые заклю­
чены в отрезках ударных гласных. В качестве полезных мо­
гут выступать те же типы тональных ключей, которые были кратко описаны выше для слоговых тонов. Важным признаком фразовых акцентов является место тонального перелома относительно границ ударного гласно­
го. Поскольку временная область реализации фразовых ак-
данные о перцептивной оценке акустических характе­
ристик важнейших типов русской интонации приводятся в [Светозарова 1982]. 252 4.4. Фонетически полезные признаки речевого сигнала центных фигур часто выходит за пределы ударного слога, к собственным тональным признакам ударных гласных доба­
вляются признаки межслоговых тональных контрастов. Ка­
ждый гласный может быть оценен (с учетом определенных порогов, задаваемых слухом) относительно соседнего глас­
ного по частотному положению (выше/ниже) и величине (интервалу) тонального контраста. Величина относительного контраста длительности гласных, о котором шла речь выше при обсуждении просо­
дических ключей словесного ударения, важна и для воспри­
ятия ритма фразы. К этому признаку, создаваемому на осно­
ве временного параметра, добавляется еще один временной ключ: период (или частота) следования гласных, который несет информацию о темпе произнесения [Чистович и др. Для восприятия сильных смысловых акцентов большое значение имеет относительный контраст гласных по интен­
сивности. Важен также признак положения речевого отрез­
ка относительно границ общего диапазона интенсивностей, типичных для речи. По этому признаку могут производить­
ся перцептивные оценки громкости типа К особым интонационным признакам относится появ­
ление акустической паузы в звуковом окружении, отличном от акустической паузы глухого согласного, и качественная оценка величины этой паузы (значительная/незначительная или с большим числом градаций). В целом можно предполагать, что при восприятии ре­
чевого сообщения слушающий выделяет особые просодиче­
ские события и оценивает их характеристики с помощью просодических признаков, об основных типах которых гово­
рилось выше. Далее на базе этого комплексного и достаточ­
но детального просодического описания слушающий реша­
ет, есть ли в сообщении выделенные, подчеркнутые слова, определяет место и тип локальных фразовых акцентов, уста­
навливает интонационную модель фразы или ее отдельного смыслового фрагмента и т. д. Для того чтобы понять, как это происходит, еще многое предстоит исследовать. Этап выделения полезных признаков в речевом сигна­
ле занимает промежуточное положение между этапом, на котором слуховая система осуществляет спектрально-вре­
менной анализ сигнала, и этапом фонологической интер-
253 Глава 4. Восприятие речи претации, результатом которого является характеристика со­
общения в терминах звуковых единиц языка. В обычных ус­
ловиях восприятия речи акустические ключи выполняют не­
обходимую, но вспомогательную функцию носителей фоно­
логически значимой информации. Слушающий запоминает фонологические решения, а не акустические признаки сиг­
нала, на основе которых они были приняты. По этой при­
чине исследование того, что происходит на этапе выделения признаков и признаки выделяет слуховая система, яв­
ляется трудной экспериментальной задачей как в методиче­
ском, так и в организационном отношениях [Венцов, Касе-
вич 1994]. 4.5. Лингвистическая интерпретация речевого сообщения На основе акустических ключей разной природы слу­
шающий строит лингвистическое описание звуковой сторо­
ны речевого сообщения — определяет состав образующих его фонемных единиц и просодических показателей (тонов, словесных ударений, элементов интона­
ционного оформления). Эта задача решается На последнем, собственно лингвистическом этапе звукового восприятия речи. Восприятие речи и фонологическая интерпретация сообщения В обычных условиях звуковое восприятие речи подчи­
нено более важной цели: опознанию слов, из которых состо­
ит речевое сообщение, а также установлению смысловых и синтаксических связей между ними. Более того, "устную речь мы воспринимаем как осмысленную по­
следовательность слов, а не как нагромождение звуков, ко­
торые необходимо как-то перевести, чтобы они приобрели смысл" [Линдсей, Норман 1974: 13]. Таким образом, звуко­
вое восприятие "вплетено" в общий процесс опознания слу­
шающим языковой структуры сообщения и должно рассма­
триваться как важная, но в то же время промежуточная за­
дача выделения языковых ключей звуковой природы, необ­
ходимых для опознания слов и их последовательностей. 254 4.5. интерпретация речевою сообщения Для опознания слов слушающий располагает гораздо более мощными источниками информации, чем извлечен­
ные из речевого сигнала акустические признаки. Наиболее надежный источник — это знание языка, на котором по­
строено речевое сообщение. Языковые знания человека весьма разнообразны: они включают знание инвентаря фо­
нем и законов их сочетаемости (например, в русском языке нет гласных фонем, противопоставленных по назализации; в начале русского слова невозможна последовательность языковых знаков, а значит, и тех фонемных цепочек и которые не просто возможны в данном языке, а соответствуют реальным словам (в русском языке нет слов или /сабака/, а слово /сабака/ есть), законов оформления синтаксических связей (в русском языке невоз­
можно словосочетание большого дому), законов сочетаемо­
сти слов по смыслу (ср. известный пример Бесцветные зеле­
ные идеи яростно спят, где эти законы нарушаются) и т. д. Использование языковых знаний, а также результатов текущего восприятия (совокупности слов, уже опознанных к данному моменту распознавания) позволяет людям воспри­
нимать и понимать речь в условиях сильных акустических помех и искажений речевого сигнала, о чем свидетельствует наша повседневная речевая практика. Вот что пишут по это­
му поводу известные психологи П. Линдсей и Д. Норман: "Будь наша речь поэкономнее или будь люди не так способ­
ны к использованию контекстной информации для регуля­
ции собственного восприятия, общение представляло бы му­
чительный и ненадежный процесс. К каждому слову прихо­
дилось бы внимательно прислушиваться; одно пропущенное слово, один искаженный слог — и целое предложение мог­
ло бы утратить смысл и оказаться неверно понятым. Мы не могли бы ни на минуту ослабить внимание. Самый ничтож­
ный шум мог бы привести к катастрофе. Таким образом, из­
быточность языка позволяет нам избирательно концентри­
ровать внимание на отдельных фрагментах сообщения, предвосхищать следующие его части, сосредоточиваться на ключевых словах и фразах, несущих основной смысл сооб­
щения. В результате мы можем позволить себе принимать сообщение, не напрягаясь, будучи уверенными, что, даже пропустив множество деталей, мы все же уловим основной смысл сказанного или прочитанного" [Линдсей, Норман 1974: 140]. К этому можно добавить, что и говорящему при-
255 Глава 4. Восприятие речи шлось бы затрачивать гораздо больше внимания и усилий при артикуляции, если бы ему нужно было тщательно про­
износить каждое слово своего сообщения, чтобы быть уве­
ренным в том, что его правильно поймет слушающий. К сожалению, мы не можем подробно рассматривать увлекательную тему взаимодействия разных источников ин­
формации при восприятии речи. Для фонетистов важно, что интерпретация речевого сигнала в терминах звуковых еди­
ниц языка возможна и без обращения к словарю: при звуко­
вом восприятии слогов и бессмысленных звукосочетаний (псевдослов и псевдофраз), неизвестных слушающему слов или собственных имен. Зиндер справедливо отмечает, что "усвоение всякого нового слова и начинается с того, что оно воспринимается как бессмысленное звукосочетание" [Зиндер 1979: 32]. Если бы человек не умел интерпретиро­
вать звучание новых слов через звуковые единицы языка, система которых ему известна, он был бы лишен способно­
сти строить и пополнять свой словарь. Таким образом, не­
обходимо различать общую способность человека узнавать в речевом сигнале звуковые единицы родного языка и разное использование этой способности в конкретных речевых си­
туациях (с обычной возможностью опираться на источники информации, лежащие за пределами звуковой системы язы­
ка, или без этой возможности). В чем же выражается общая способность к фонологи­
ческой интерпретации речи, с помощью каких механизмов слушающий переходит от представления речевого сигнала, в котором выделены определенные отрезки и акустические признаки, к описанию, содержащему звуковые единицы языка? Рассмотрим этот вопрос, ограничиваясь вначале ги­
потезами о том, как может осуществляться собственно зву­
ковое восприятие речи. 4.5.2. Фонемная идентификация в условиях чисто звукового восприятия речи Существует несколько гипотез относительно механиз­
мов, позволяющих человеку узнавать (распознавать) в рече­
вом сигнале фонемные последовательности. Несмотря на некоторые теоретические различия, большинство исследова­
телей основываются на допущении, что звуковая сторона языковых знаков в памяти человека представлена фонемны-
256 4.5. Лингвистическая интерпретация речевого сообщения ми а фонемный инвентарь и дифференциаль­
ные фонологические признаки являются важнейшей частью его языковых знаний. При этих допущениях задача фонемной интерпретации состоит в том, чтобы преобразовать или перевести слуховое изображение речевого сигнала, в котором выделены акусти­
ческие ключи, в последовательность полностью или частич­
но опознанных фонемных единиц. Возможность частичного опознавания должна учитываться сразу, так как артикуляци­
онная редукция, неопределенность, смазанность и утрата важных акустических ключей являются бесспорными, экс­
периментально доказанными фактами человеческой речи, которые легко прогнозируются артикуляционным поведени­
ем говорящего, его склонностью к экономии произноси­
тельных усилий. Для всех моделей звукового восприятия ре­
чи принципиально важным является также вопрос о том, ка­
ким образом слушающий справляется с акустическими следствиями коартикуляции, приводящей к значительному, хотя и систематическому, варьированию акустических хара­
ктеристик фонемных единиц языка. Авторы существующих моделей дают разные и, к сожалению, не всегда отчетливые ответы на этот Гипотезы, объясняющие механизмы фонемной интер­
претации, можно условно разделить на три класса: артику­
ляционного источника, перцептивного эталона (эталонов) или перцептивного прототипа и признаковые. В основе этих гипотез лежат различные идеи о том, что представляют со­
бой объекты распознавания, по-разному трактуются также способы или процедуры распознавания. Под способом распознавания понимаются приемы или правила, с помощью которых слушающий приводит в соот­
ветствие имеющуюся у него текущую акустическую инфор­
мацию и опознаваемые фонемные единицы, принадлежащие его внутренним языковым знаниям. Обсуждаются три воз­
можных способа: 1) фонологический анализ посредством "внутреннего" синтеза (предварительный анализ акустиче­
ских данных формирование фонемных гипотез внут­
ренний синтез возможных акустических следствий из каж-
Для упрощения изложения мы отвлекаемся от просодических характеристик слова и сложного вопроса о фонологическом представлении слова в тональ­
ных языках. 257 Глава 4. Восприятие речи дой гипотезы оценка правдоподобия выдвинутых гипотез на основе сравнения внутреннего синтеза с имеющимися данными); 2) прямая идентификация (сравнение с имею­
щимся в памяти набором фонем, представленных в удобном для распознавания виде); 3) фонологический анализ акусти­
ческих ключей (распознавание на основе специальных пра­
вил фонологической интерпретации). Наиболее известный вариант гипотезы артикуляцион­
ного источника, который называется также моторной тео­
рией восприятия речи, базируется на двух идеях
Mattingly
1985; Во-первых, предполагается, что рече­
вые и неречевые сигналы обрабатываются слуховой систе­
мой с помощью разных механизмов. Человек, воспринимая речь, фиксирует как полезные только те акустические разли­
чия, которые тесно связаны с артикуляцией. Например, экс­
перименты показывают, что восприятие слога
[sta]
носите­
лями английского языка зависит от длительности глухой па­
узы между отрезком шума
[s]
и последующим гласным. Ес­
ли ее длительность меньше 50 мс, согласный
[t]
не воспри­
нимается. Авторы моторной теории объясняют этот резуль­
тат тем, что артикуляционно смычка глухого согласного в английском языке не может быть короче указанного интер­
вала, и это учитывается при восприятии. Способность чело­
веческого слуха фиксировать наличие гораздо более корот­
ких пауз (меньше 5 мс) в составе других звуков, например, неречевых шумов, сторонники указанной теории рассматри­
вают как результат действия неречевых механизмов слуха. Допускается возможность двойной обработки сигнала, т. е. одновременное действие как речевых, так и неречевых меха­
низмов. Первый механизм выделяет в сигнале акустические признаки, которые могут быть соотнесены с артикуляцией, второй — все остальные. Таким способом могут обрабаты­
ваться речевые сигналы на фоне звуковых помех. Вторая идея моторной теории состоит в том, в процессе восприятия слушающий на основе выделенных акустических признаков восстанавливает целевые артикуляционные жесты, реализа­
ция которых привела к образованию сигнала с наблюдаемы­
ми акустическими характеристиками. Целевые жесты рас­
сматриваются как элементы глубинных артикуляционных планов, которые не зависят от контекста, имеют прямую связь с фонологическими признаками и представляют собой стандартизованные способы достижения нужных акустико-
258 5. Лингвистическая интерпретация речевого сообщения слуховых эффектов. Артикуляционная реконструкция, по мнению авторов теории, основана на артику­
ляционном синтезе, в котором участвует речепроизвоизво-
система слушающего. Таким образом, результаты зву­
кового восприятия речи определяются в конечном счете с помощью артикуляционных механизмов, от понимания и интерпретации которых сильно зависит обоснованность тео­
ретических постулатов моторной теории. Авторы остальных теорий исходят из чисто слуховой (сенсорной) природы звукового восприятия, не включающе­
го (в норме) артикуляционной реконструкции сообщения. Считается, что механизмы восприятия и речепроизводства соотносятся между собой не прямо, а через фонологические признаки фонемных единиц языка. Большинство специали­
стов не признают и существование особых слуховых меха­
низмов, анализирующих речевые сигналы. Напротив, пред­
полагается, что слуховая система человека, как и некоторых видов от рождения содержит нервные элементы (детекторы), приспособленные к анализу любых сигналов с быстро меняющимися акустическими свойствами, в том числе сложных сигналов, которые способен производить ре­
чевой тракт человека. Физиология слуховой системы челове­
ка является результатом длительного процесса эволюции, в котором огромную роль сыграло значение звуковой речи для жизни человека. Благодаря этому существует хорошее био­
логическое согласование между звуками, которые человек потенциально может произнести, и звуковыми различиями, которые человеческий слух способен обнаружить в речевых сигналах. Поэтому ребенку не нужно специально учиться выделять акустические признаки, которые соотносятся с ар­
тикуляцией, и вычислять целевые артикуляционные жесты для восприятия речевых сообщений, как это предполагается моторной теорией восприятия речи. Ему нужно приобрести умение соотносить выделяемые слухом акустические при-
Простейшим существом, которое производит звуковые сигналы с акустиче­
ской структурой, сходной с человеческой речью, является древесная лягуш­
ка. Ее аппарат включает гортань и примитивный над­
гортанный тракт, а производимые сигналы различаются основной частотой и частотами формант. показано, что в слуховой системе лягушки есть нервные клетки, обладающие избирательной чувствительно­
стью к формантным частотам звуков, которые являются поведенчески зна­
чимыми для этого вида животных 1988]. 259 Глава 4. Восприятие речи знаки со смысловыми различиями в речевых сообщениях взрослых и развить артикуляционные навыки, которые поз­
волили бы создавать нужные акустические различия в собст­
венной речи (известно, что артикуляция у ребенка развива­
ется значительно медленнее способности воспринимать и понимать речевые сообщения). Умение соотносить акусти­
ческие особенности речевого сигнала, обнаруживаемые слу­
хом, со смыслом речевых сообщений — это и есть фоноло­
гическое воспитание Оно формируется вместе с при­
обретением всех языковых знаний, включая звуковую систе­
му языка. Рассмотрим теперь гипотезы о том, в чем выража­
ются результаты фонологического воспитания слуха у взрос­
лых носителей языка. Гипотеза перцептивного эталона предполагает, что в памяти носителя языка каждой фонеме соответствует свой перцептивный эталон (слуховой образ), который понимает­
ся как определенная конфигурация полезных акустических признаков [Венцов, Касевич 1994]. Для каждого акустиче­
ского признака в составе эталона задаются допустимые пре­
делы варьирования, обусловленные фонетическим контек­
стом, а также такими общими параметрами произнесения, как громкость, высота голоса и темп. В процессе восприятия акустические признаки, выделяемые слуховой системой, сравниваются с набором перцептивных фонемных этало­
нов, при этом определяется мера близости наблюдаемой конфигурации признаков к каждому из них. Предполагается возможной ситуация, когда для наблюдаемой конфигурации признаков устанавливается равнозначная отнесенность к любому из перцептивных эталонов, отвечающих фонемам В последнее время заметно активизировались исследования в области дет­
ской речи: ученые интересуются тем, как происходит процесс приобретения фонологических умений, влияют ли на него развивающиеся артикуляцион­
ные навыки, утрачивается ли при этом способность воспринимать звуковые различия, которые не являются смыслоразличительными в родном языке ребенка. В литературе даются противоречивые ответы на эти вопросы. В 1988] приводятся экспериментальные данные о детях, которые воспитывались в англоязычной среде и наблюдались в возрасте от 7 месяцев до 5 лет. В раннем возрасте они хорошо различали ретрофлекс­
ные и зубные взрывные согласные (их нет в английском языке) и утратили эту способность к 5 годам. Вместе с тем есть и другое мнение, согласно ко­
торому усвоение родного языка, которое поддерживает смысловую значи­
мость только некоторых звуковых контрастов, не приводит к тому, что че­
ловек перестает различать на слух и другие звуковые различия [Венцов, Ка­
севич 1994]. 260 5. Лингвистическая интерпретация речевого сообщения данного языка. Это случай полной неопределенности фоно­
логического решения — фиксируется только присутствие фонемы в сигнале без идентификации ее индивидуального качества. В рамках эталонного подхода существуют модели, в ко­
торых допускается существование для фонемы не одного, а нескольких перцептивных эталонов. В качестве самостоя­
тельных эталонов в этом случае выступают контекстные ре­
ализации фонем, которым соответствуют разные комплексы акустических признаков, хотя и признается, что в таком слу­
чае набор эталонов может быть весьма большим
[Wickelgren 1969]. Вместо понятия перцептивного эталона может исполь­
зоваться понятие перцептивного прототипа фонемы с близ­
ким содержанием. Считается, что в качестве перцептивной модели фонемы человек может использовать прототипиче-
ские образы двух типов: усредненный перцептивный образ (или обобщенный звуковой тип), который формируется в памяти в результате усреднения разных реализаций одной и той же фонемы, и статистически представительный перцеп­
тивный образ, когда в памяти в качестве прототипа фикси­
руется наиболее часто встречающаяся конфигурация слухо­
вых признаков фонемы. Сторонники признаковой гипотезы считают, что фоне­
ма существует в памяти носителя языка в виде набора зна­
чений фонологических различительных признаков и не име­
ет прямого перцептивного коррелята. Фонема опознается через распознавание ее фонологических признаков. Значе­
ния фонологических признаков устанавливаются по различ­
ным акустическим ключам, выделяемым слуховой системой, в том числе и таким, которые определяют слуховое членение речевого сигнала
[Stevens
1995; 1999]. Фонологическая интерпретация акустических ключей зависит от звукового окружения, которое может быть пред­
ставлено как акустическими признаками, так и уже распоз­
нанными фонологическими. Каждому фонологическому признаку могут соответствовать разные наборы акустических ключей в зависимости от фонологического контекста — в составе разных фонем и в разных фонемных цепочках. В рамках этой гипотезы предполагается, что наиболее надеж­
ные и важные акустические ключи для фонологических при­
знаков согласных и гласных характеризуются разным рас-
261 Глава 4. Восприятие речи пределением в речевом сигнале. Для согласных акустические ключи обнаруживаются в окрестности резких спектральных изменений, т. е. на границах слухового членения. Известный сторонник признаковой гипотезы К. считает, что ключи для фонологических признаков согласных, которые привязаны к перцептивным границам, обладают незначи­
тельной физической вариативностью. Для отрезков гласных важными фонологическими зонами являются области экс­
тремальных значений акустических параметров: максимумы в динамическом контуре интенсивности и контуре первой форманты, а также экстремальные и граничные значения в контуре второй форманты. Если акустической информации недостаточно для определения значения фонологического признака, то он не идентифицируется. Это означает, что в данной области речевого сигнала возможны все фонемы, ко­
торые различаются по неопознанному фонологическому признаку, — в этом случае определяется лишь класс допус­
тимых фонем. Ни одна из изложенных выше теорий не достигла той степени проработки и детализации, которая допускала бы сравнение с реальным поведением человека. Человеческий мозг устроен так сложно и способности его так велики, что реальное поведение человека может базироваться на элемен­
тах всех трех гипотез и, вероятно, на каких-то других воз­
можностях, которые пока не учтены. В то же время призна­
ковая гипотеза представляется наиболее реалистичной. Она находится в соответствии с большим количеством экспери­
ментальных данных, которые показывают, что фонологиче­
ские признаки являются самостоятельными объектами рас­
познавания при восприятии речи. Как видно из изложенного, в слуховых теориях воспри­
ятия речи признается возможность и даже типичность ситу­
ации, когда фонемный состав сообщения или его фрагмен­
та не может быть однозначно опознан на основе акустиче­
ской информации. В каком же фонемном виде запоминают­
ся тогда новые слова и неизвестные фамилии? Производит ли слушающий "доопределение" фонемного состава такого не полностью опознанного слова при помещении его в свой словарь (в ситуациях, когда нет возможности уточнить это с помощью говорящего)? Например, в русских словах в есте­
ственной речи слабый редуцированный [ъ] часто произно­
сится на месте фонем /а/ и /ы/, и, услышав фамилию 262 Лингвистическая интерпретация речевого сообщения слушающий либо должен выбрать какую-
то из этих фонем вместо либо запомнить фамилию с фо-
немно неопознанным гласным. Возможно, в данном случае слушающий выберет фонему /а/, так как это самая частот­
ная фонема в русском языке, но вопрос о возможности су­
ществования словарных единиц с не полностью определен­
ными звуковыми сегментами остается в силе. 4.5.3. Фонемная идентификация в обычных условиях восприятия речи Выше уже говорилось, что в обычных условиях слуша­
ющий, воспринимая речь, стремится прежде всего распоз­
нать слова, образующие речевое сообщение. При этом ис­
пользуются все доступные источники информации, в том числе и уже распознанные слова и их последовательности. Слушающий начинает узнавать слова сразу же, как только его слуховая система фиксирует появление речевого сигна­
ла. Иными словами, восприятие речи имеет текущий, при­
вязанный к моменту поступления акустической информа­
ции характер, и главной процедурой обработки речевого сигнала становится "анализ через синтез". Эта процедура дает возможность слушающему использовать внутренние знания, контекстные догадки и уже распознанную языковую информацию. Механизмы фонологической интерпретации могут ис­
пользоваться при этом двояким образом: как для выдвиже­
ния гипотез о классах слов, возможных в данном фрагменте речевого сигнала, так и для проверки (верификации) словес­
ных гипотез, согласованных со всеми доступными источни­
ками информации. Например, если в начале речевого сооб­
щения слушающий с достаточной степенью вероятности ус­
тановил фонемный состав первого слога, то эта информа­
ция, наряду с другими языковыми ограничениями, может использоваться для выделения в общем словаре слушающе­
го активного класса слов, которые начинаются с этого сло­
га. Слова из выделенного класса могут затем проверяться на соответствие наблюдаемым акустическим данным с помо­
щью синтеза акустических ключей, которые задаются фо­
немным составом этих слов. Конечно, реальная картина происходящих процессов намного сложнее и многообразнее, но изложение имеющихся на этот счет гипотез увело бы нас \ 263 5. Лингвистическая интерпретация речевого сообщения далеко за пределы перцептивной В заключение приведем общую схему процессов восприятия и производст­
ва в которой отражены наиболее важные этапы и воз­
можные связи между ними (рис. 4.18 по
[Fant
Литература к главе 4 Бекеши Г., Розенблит В.А. Механика улитки Экспериментальная пси­
хология. 1963. Т. 2. Л.В., Вербицкая Л.А., Л.Р. Акустические характеристи­
ки безударности Структурная типология языков. 1966. Бондарко Фонетическое описание языка и фонологическое описание речи. 1981. Вартанян И.А. Звук-слух-мозг. 1981. Венцов A.B., Касевич В.Б. Проблемы восприятия речи. СПб., 1994. Деркач М.Ф., Р.Я., Б.М., Чабан Динамические спек­
тры речевых сигналов. Львов, 1983. Златоустова В. Фонетическая структура слова в потоке речи. Казань, 1962. Зиндер Л.Р. Общая фонетика. 1979. Зиновьева Система акустических ключей к распознаванию фонети­
ческих единиц русского языка Экспериментальная фонетика. 1989. Касевич Шабельникова Рыбин В.В. Ударение и тон в языке и речевой деятельности. 1990. Кожевников В.А., Слепокурова H.A., Столярова Э.И., Чуйкина Л.И. "Слуховые" спектрограммы речевых сигналов Исследование моде­
лей речеобразования и речевосприятия. 1981. Линдсей П., Норман Д. Переработка информации у человека. 1974. Родионов П., Кожевников В.А. Объединение информации о кратковременных изменениях сигналов в различных частотных кана­
лах слуховой системы Физиология человека. 1976. Т. 2. С. 1027. Румянцев М.К. Тон и интонация в современном китайском языке. 1972. Светозарова Н.Д. Интонационная система русского языка. 1982. Фланаган Д. Анализ, синтез и восприятие речи. 1968. Цвикер Фельдкеллер Р. Ухо как приемник информации. 1971. Чистович Л.А., Венцов A.B., Гранстрем М.П. и др. Физиология речи. Вос­
приятие речи человеком. 1976. Чистович Венцов A.B., Люблинская В.В. и др. Слуховые уровни вос­
приятия речи. Функциональное моделирование Акустика речи и слуха. 1986. Чистович Люблинская
Chistovich Lublinskaya V.V. The "center of gravity" effect in vowel spectra and critical distance between the formants
Hearing Research.
1979,
V.
1.
P.
185-195. Ряд таких гипотез обсуждается в [Венцов, Касевич \ 265 Глава 4. Восприятие речи L. The Physiology of Speech and Hearing. An Introduction. N. 1980. Delattre P., Liberman A.M., Cooper F.S., Gerstman L.J. An experimental study of the acoustic determinants of vowel color; observations on one- and two-
vowels synthesized from patterns Word. 1952, V. 8. P. 195-210. B. Auditory Neural Processing of Speech The Handbook of Phonetic Sciences. Oxford, 1999. Fant G. Auditory Patterns of Speech Models the Perception of Speech and Visual Form. Cambridge, 1967. Fletcher H. Auditory Patterns Reviews of Modern Physics. 1940, 12. P. 47-65. Johnson K. Acoustic and Auditory Phonetics. Cambridge, 1997. Liberman A.M., Delattre Cooper F.S. The role of Selected Stimulus-
Variables in the Perception of the Unvoiced Stop Consonants Am. J. Psychol. 1952, P. 497-516. Liberman A.M., Delattre P.C, Cooper F.S., Gerstman L.J. The Role of Consonant-Vowel Transitions of the Stop and the Nasal Consonants Psychol. Monagr. 1954, 68. P. 1-13. Liberman A.M., Harris K.S., Hoffman H.S., Griffith B.C. The Discrimination of Speech Sounds within and across Phoneme Boundaries Exp. Psychol. 54. P. 358-368. Liberman A, I. The motor theory of speech perception revised Cognition. 1985, V. 21. № 1. Liberman Mattingly I. A specialization for speech perception Science. 1989, V. 243. P. 489-494. S.E. Speech physiology, speech perception and acoustic phonetics. Cambridge, 1988. Moore Aspects of Auditory Processing Related to Speech Processing The of Phonetic Sciences. Oxford, 1999. S.G. The time course of speech perception "Time" in the pro­
duction and the perception of speech. 12, Institut fur Phonetik. Kiel, 1979. Stevens K.N. Evidence for the role of acoustic boundaries in the perception of speech sounds Phonetic Linguistics. N. 1985. Stevens K.N. On the quantal nature of speech Journal of Phonetics. 1989, V. 17. P. 3-46. Stevens K.N. Models of Speech Production and Perception European Studies in Phonetics and Speech Communication. Utrecht, 1995. Stevens K.N. Relationships The Handbook of Phonetic Sciences. Oxford, 1999. Wickelgren W.A. Context-sensitive coding, associative memory, and serial order in speech behaviour Psychological Review. 1969, V. 4. Глава 5 УНИВЕРСАЛЬНЫЕ ФОНЕТИЧЕСКИЕ КЛАССИФИКАЦИИ Базовые понятия классификационного описания Понятие классификации Классификация — это описание некоторой совокупно­
сти объектов с точки зрения имеющихся между ними сходств и различий в свойствах, функциях или поведении. Совокупность классифицируемых объектов образует область классификации. В фонетических клас­
сификациях предметная область — это звуковые единицы, которые используются с различными функциями в челове­
ческой речи вообще или в каком-то конкретном языке. Для выделения и описания сходств и различий между классифи­
цируемыми объектами в классификациях используются спе­
циальные средства, называемые классификационными при­
знаками (или основаниями Набор таких признаков образует признаковую базу классификации. Понятие классификационного признака Чтобы сравнивать между собой объекты в целях класси­
фикации, надо сначала выделить некоторое свойство, кон­
кретные проявления которого у классифицируемых объектов могут различаться. Такое общее свойство образует основание для сравнения и фиксируется в названии классификационно­
го признака, а разные проявления этого свойства, существен­
ные для классификации, образуют значения этого признака. Можно, например, сравнивать объекты по цвету (основание для сравнения и название признака), выделяя среди них бе­
лые, черные, зеленые, красные и прочие объекты (значения признака "цвет"). Сравнивая между собой согласные русско­
го языка, можно выделить такую характеристику, как место образования преграды (основание для сравнения и название признака), и разделить их далее на губно-губные, губно-зуб­
ные, переднеязычные, среднеязычные и заднеязычные (раз­
ные значения признака "место образования преграды"). Количество значений у классификационного признака должно быть не меньше двух. Признаки, имеющие только 267 Глава 5. Универсальные фонетические классификации два значения, называются бинарными. Такие признаки име­
ют особую функцию, фиксируя наличие или отсутствие то­
го или иного свойства у классифицируемых объектов. Условимся записывать классификационный признак в следующем виде: ИМЯ; применимости [Значе­
Например, описанный выше признак, использу­
емый в классификации русских согласных, может быть записан так: <МЕСТО ОБРАЗОВАНИЯ ПРЕГРАДЫ; [губно-губной, губно-зубной, переднеязычный, средне­
язычный, 5.1.3. Классификационный класс (категория) Каждый признак-классификатор разбивает множество классифицируемых объектов на классы: в один класс попа­
дают те и только те объекты, которые имеют одно и то же значение данного признака. Каждый класс такого разбиения называют элементарной категорией, выделяемой по данно­
му признаку. Например, губно-губные согласные русского языка [б, п, м, образуют одну из элементарных фо­
нетических категорий, выделяемых по признаку "МЕСТО ОБРАЗОВАНИЯ ПРЕГРАДЫ". При разбиении объектов на классы может использо­
ваться не один, а несколько признаков. В таком случае по­
лучаются не элементарные, а сложные категории. Например, для выделения категории (или класса) твердых губно-губных согласных [б, п, м], кроме признака "МЕСТО ОБРАЗОВА­
НИЯ", в русских фонетических классификациях использу­
ется признак 5.1.4. Описание звуков через классификационные признаки Каждый классифицируемый объект, к которому при­
меняется признак-классификатор, может быть охарактери­
зован по этому признаку лишь одним способом. Иначе го­
воря, классифицируемый объект может иметь одно и только одно значение из возможных значений классифицирующего признака. Так, русский согласный [б] имеет значение "губ­
но-губной" и никакого другого значения по признаку "МЕ-
268 Базовые понятия классификационного описания СТО ОБРАЗОВАНИЯ" иметь не может. Однако он может быть охарактеризован также и по каким-то другим призна­
кам ("СПОСОБ ОБРАЗОВАНИЯ ПРЕГРАДЫ", "ТВЕР­
ДОСТЬ/МЯГКОСТЬ" и т. д.). Совокупность значений при­
знаков, по которым в данной классификации характеризует­
ся и описывается классифицируемый объект, образует при­
знаковую характеристику этого объекта в данной классифи­
кации. Признаковая характеристика одного и того же объе­
кта в разных классификациях зависит от используемой при­
знаковой базы. Окончательная задача классификации обычно состоит в том, чтобы обеспечить различение всех классифицируе­
мых объектов между собой. В этом случае говорят о поэле­
ментной классификации с признаковой базой, образованной различительными В поэлементной классифика­
ции все классифицируемые объекты должны иметь разные признаковые характеристики, т. е. отличаться значением по крайней мере одного из различительных фикаторов. Устройство признаковой матрицы и классификационной таблицы Результаты классификации могут быть представлены двумя способами: в виде признаковой матрицы или в виде классификационной таблицы. В фонетике, в зависимости от конкретных задач, используются оба способа. Рассмотрим их на примере классификации сегментных единиц (звуков, фонем). В этом случае признаковая матрица представляет собой таблицу, столбцы которой соответствуют звукам а строки — признакам-классификаторам. В клетке матрицы записывается значение признака, которым характеризуется каждый из звуков, входящих в область применимости дан­
ного признака. В табл. 1 приведен фрагмент признаковой матрицы звуков русского языка, относящийся к признаку <МЕСТО ОБРАЗОВАНИЯ ПРЕГРАДЫХ Классификационная таблица является более традици­
онным способом представления фонетической классифика­
ции. Такие таблицы строятся отдельно для гласных и соглас­
ных, что отражает существенные различия в наборе класси­
фикационных признаков. Внутри каждого из наборов выби-
269 Глава 5. Универсальные фонетические классификации Таблица 1 матрицы звуков русского языка Признак Звук Признак [б] [в] [д] [з] [г] [а] Место губно-
губно-
передне­
передне­
средне­
задне­
образования зубной язычный язычный язычный язычный — преграды раются главные (или осевые) признаки, по которым органи­
зуются основные столбцы и строки классификационной таб­
лицы. Для согласных главными признаками являются спо­
соб и место образования преграды, для гласных — подъем и ряд. Остальные признаки, которые используются в класси­
фикации, образуют подрубрики или подстро­
ки) главных признаков. Ячейка классификационной табли­
цы соответствует отдельному звуку. Пример, поясняющий устройство классификационной таблицы, приведен ниже в табл. 2. Кроме главных различий в способе и месте образо­
вания, в таблице отражены также противопоставления сог­
ласных по глухости/звонкости и твердости/мягкости. Таблица 2 Фрагмент классификационной таблицы русских согласных Способ образования преграды Место образования преграды Способ образования преграды губно-
губно-
зубные передне­
язычные средне­
язычные задне­
язычные Способ образования преграды м. м. м. м. м. п -
— т — — к Смычные зв. б д г 270 Ф
онетические возможности человека и их отражение... 5.2. Фонетические возможности человека и их отражение в универсальных фонетических классификациях Задачи универсальных фонетических классификаций Универсальные фонетические классификации (УФК) ставят своей целью описать, как люди, говорящие на разных языках, используют в речевой коммуникации способность производить разные звуки и воспринимать физические раз­
личия между ними. Эта задача может решаться двумя спо­
собами. Можно попытаться описать все возможные звуки, ко­
торые могут быть произведены органами речи и восприняты органами слуха как разные звучания, независимо от того, за­
фиксированы ли эти звуки в описаниях каких-либо конкрет­
ных языков. В этом случае предметная область классифика­
ции включает все потенциально возможные звуки человече­
ской речи, а сама классификация напоминает периодиче­
скую систему химических элементов Менделеева. Так устроена, например, фонетическая классификация Щербы, подробно излагаемая в учебнике по общей фо­
нетике Зиндера [Зиндер 1979]. И наоборот, можно, отталкиваясь от описаний кон­
кретных языков, включить в предметную область классифи­
кации все звуки, которые в этих описаниях зафиксированы как разные и фонологически существенные, т. е. участвую­
щие в различении слов. Предметную область, которая орга­
низована в соответствии с описанным принципом, иногда называют звуковым Так строится классифика­
ция, которая лежит в основе фонетического транскрипцион­
ного алфавита, принятого Международной фонетической ассоциацией Далее мы будем рассматривать именно эту классификацию. Важным классификации МФА является то, что лежащие в ее основе признаковая база и транскрип­
ционные символы приняты в качестве фонетического стан­
Это создает единую базу фонетических описаний: сравнивать описания языков, сделанные разными ис­
следователями, не опасаясь того, что они построены на раз­
личных принципах, используют нетождественные классифи-
271 Глава 5. Универсальные фонетические классификации признаки (с разным фонетическим толковани­
специфические и нуждающиеся в дополнительном объ­
яснении транскрипционные символы и т. д. В то же время эта классификация имеет те же недос­
татки (или, может быть, лучше сказать, ограничения), что и любая другая. Использование фиксированного набора фоне­
тических признаков-классификаторов, без которого класси­
фикация не может построена, заставляет сводить все артикуляционное и акустическое разнообразие звуков раз­
ных языков к конечному набору различий. При этом опус­
каются детали артикуляции и звучания, которые и придают речи на данном языке неповторимое своеобразие и с трудом усваиваются при обучении иностранному языку. Кроме то­
го, будучи статическим описанием, УФК не отражает дина­
мических особенностей звуков человеческой речи, которые обусловлены коартикуляцией и тоже по-разному проявляют­
ся разных языках. 5.2.2. Артикуляционная и акустическая ориентация УФК Возможность классификации звуков человеческой речи обеспечивается тем, что по своей природе они являются сложными образованиями. С одной стороны, звуки предста­
вляют собой сложные артикуляционные жесты, в создании которых участвуют разные речевые органы. С другой, они являются сложными образами, восприятие кото­
рых определяется комплексом свойств. Признаковая база УФК может быть ориентирована на разные стороны звуков. Если основе классификационных признаков лежат целевые артикуляции, классификация на­
зывается Если же признаки учитывают прежде всего свойства звуков, то класси­
фикация называется акустической. В то же время нужно по­
мнить, что между артикуляционными и слуховыми образами (слышимыми звуками) человеческой речи существует нераз­
рывная связь: целевая артикуляция — это средство создания нужного звучания, а слышимый звук — это результат реали­
зации соответствующей артикуляции. Поэтому при построе­
нии артикуляционных классификаций в том или ином виде всегда учитываются и акустические, и перцептивные харак­
теристики звуковых единиц. И наоборот, при акустической 272 5.3. Универсальная фонетическая классификация МФА... классификации звуков принимаются во внимание их арти­
куляционные характеристики. Возможны и смешанные классификации: в них одни признаки могут быть ориенти­
рованы на артикуляцию, а другие - на акустику. Универсальная фонетическая классификация МФА яв­
ляется в основном артикуляционно ориентированной. При­
мером универсальной акустической классификации может служить классификация, предложенная Р. Якобсоном, Г. Фантом и М. Халле [Якобсон и др. 1962]. 5.3. Универсальная фонетическая классификация МФА (сегментные звуковые единицы) Как уже было сказано, универсальная фонетическая классификация МФА имеет артикуляционную ориентацию. В основу принятого в настоящее время варианта положена классификация, разработанная известным американским фонетистом П. Ладефогедом
[Ladefoged
1982]. Ниже дается краткое описание фонетических признаков, которые лежат в ее основе. Часть используемых иллюстраций взята из [Ladefoged
1982;
Laver
Все признаки, используемые в классификации, делятся на группы (или семейства), в соответствии с тем, какой ар­
тикуляционный и/или аэродинамический процесс в образо­
вании звука они описывают. Выделяются следующие группы признаков: главных классов звуков; инициации (формирование воздушного потока); фонации (способы участия голосовых связок в образо-
вании звука); артикуляции у согласных и гласных. Традиционно классификации согласных и гласных описываются отдельно, исходя из того, что эти классы зву­
ков имеют существенные различия в целевых артикуляциях и слоговой организации речи. Мы также будем следовать этой традиции. Признаки-классификаторы будут описывать-
стандартной форме: <ИМЯ: [значения]>. Для звуков ре­
чи, в силу естественных анатомических или акустических ог­
раничений, возможны не все сочетания признаков и их зна-
273 Глава 5. Универсальные фонетические классификации чений. Эти важные сведения, которые отражаются в облас­
ти применимости того или иного признака, мы вынуждены опустить. При характеристике признака мы будем ориентиро­
ваться на англоязычные термины и названия речевых орга­
нов, принятые в МФА (они разъясняются в главе 2, посвя­
щенной артикуляции). Классификация согласных Признаки главных классов Целевая артикуляция согласных связана с созданием того или иного препятствия для воздушного потока, прохо­
дящего через речевой тракт. В зависимости от того, являет­
ся ли это препятствие шумообразующим, согласные делятся на два главных класса, которые задаются признаком <сонор-
ность
Признаки инициации (способы формирования воздушного потока) При производстве большинства согласных использует­
ся легочный (выдыхательный) механизм создания воздушно­
го потока. Однако именно в области согласных встречаются и более экзотические способы нагнетания или разрежения воздуха в речевом тракте, в которых роль поршня выполня­
ют гортань или подвижная велярная смычка (более подроб­
но см. главу 2). Эти возможности учитываются двумя при­
знаками: [поршневое движе­
ние гортани отсутствует/гортань движется вверх/гортань движется Согласные, в которых гортань в качестве поршня, создающего поток воздуха, движется вверх, называ­
ются (или вниз — имплозив­
ными. всасывание
(velaric [отсутству­
ет/имеется всасывающее движение, обусловленное смеще­
нием велярной Согласные, которые образуются с участием велярного всасывания, называются щелкающими, или щелчками. 274 5.3
. фонетическая Признаки фонации Фонационные возможности в области согласных также проявляются очень полно и разнообразно. Согласные могут различаться по типам голосообразования и по условиям, в которых колебания голосовых связок на выдержке согласно­
го невозможны. Для учета этих различий вводятся два при­
знака: фонации
(phonation):
[придыхательный/нейтраль­
ный/скрипучий отсутствие/наличие голоса
[разве­
денные связки связки Кроме того, во многих языках существуют согласные, которые различаются координацией состояния голосовой щели и артикуляторов, создающих преграду в ро­
товой полости. Эти различия проявляются ярче всего в фа­
зе рекурсии взрывных согласных перед гласными. В этом случае для звучания согласного важно, в какой момент от­
носительно размыкания смычки голосовые связки приходят в нейтральное колебательное состояние, необходимое для производства последующего гласного. Если голосовые связ­
ки сводятся и начинают колебаться существенно позже мо­
мента рекурсии согласного, то на его отступе возникает ас-
пиративный шум, воспринимаемый на слух как легкий крат­
кий выдох. Он вызван увеличением скорости воздушного потока через голосовую щель, которая начинает функциони­
ровать как шумовой источник звука. Согласные с таким от­
ступом называются Если же голосовые связки сводятся и начинают коле­
баться синхронно с моментом размыкания смычки соглас­
ного или с небольшой задержкой, аспиративный шум не об­
разуется. Его нет и в том случае, когда колебания голосовых связок опережают момент рекурсии или осуществляются на всем интервале произнесения согласного. Различия во вре­
менной координации работы голосовых связок и ротовых артикуляторов при произнесении взрывных согласных ил­
люстрирует рис. Описанные особенности артикуляции согласных отра­
жаются признаком <аспирация
(aspiration):
[аспирирован-
275 Рис. 5.1. Временная координация со­
стояния голосовой щели и артикуляци­
онной преграды при произнесении ас-
пирированных и неаспирированных взрывных согласных: а — наличие/от­
сутствие колебаний голосовых связок; б — ширина голосовой щели 276 5.3. фонетическая классификация Признаки основной артикуляции у согласных Главные контрасты между согласными связаны с при­
знаками места и способа образования преграды в гортанно-
ротовой полости - эти признаки учитывают важнейшие чер­
ты основных консонантных артикуляций. места образования Образование согласного связано с созданием преграды в определенном месте речевого тракта, начиная от губ и кончая голосовой щелью. Преграда обычно образуется дви­
жением "активного" речевого органа по отношению к неко­
торому "пассивному" органу, который и фиксирует ту об­
ласть тракта, в которой находится преграда. В качестве ак­
тивных артикуляторов выступают органы, располагающиеся на нижней внутренней поверхности гортанно-ротовой поло­
сти, а в качестве пассивных — органы верхней поверхности. В УФК место образования преграды у согласных описывает­
ся с опорой на пассивные органы (верхние артикуляторы) с помощью признака образования
(place of articula­
tion):
[билабиальный/лабиодентальный/дентальный/альвео-
лярный/постальвеолярный/палатальный/велярный/увуляр-
У язычных согласных в образовании преграды в каче­
стве активного артикулятора обычно участвует та часть язы­
ка, которая в состоянии покоя лежит соответству­
ющего пассивного артикулятора. Однако для такого мобиль­
ного органа, как передняя часть языка, существуют допол­
нительные возможности создания звуковых противопостав­
лений. В этом случае преграда может формироваться тремя способами, с помощью: • кончика языка, который как бы распластывается от­
носительно своего пассивного артикулятора — верхних зу­
бов, альвеол или постальвеолярной части твердого нёба. Со­
гласные, которые образуются с участием кончика языка, на­
зываются апикальными; • верхней поверхности языка в его передней части, ко­
торая контактирует с теми же пассивными артикуляторами, Согласные с местом образования называют также ларингаль-
277 Глава 5. Универсальные фонетические классификации 5.2. Разновидности переднеязыч­
ных артикуляций которые принимают участие в образовании апикальных сог­
ласных (кончик языка может быть при этом Сог­
ласные с такой преградой называются Они характеризуются большей площадью контакта с пассивными что находит отражение в названии соответ­
ствующих согласных. Так, зубные ламинальные согласные называют также альвеолярные — а постальвеолярные — палатоальвеоляр-
Если возникает необходимость учесть положение кончика языка при обра­
зовании ламинальных согласных, используются термины "дорсальный" (кончик языка опущен) и "какуминальный" (кончик языка поднят, артику­
лирует вся передняя часть языка). 278 5.3. Универсальная фонетическая классификация 1 — билабиальные; 2 — лабиодентальные; 3 — 4 5 — субламино-постальвеолярные 6 — постальвеолярные; 7 — палатальные; 8 — велярные; 9 — увулярные; 10 - — глоттальные (ларингальные) Рис. 5.3. Место образования преграды у согласных • нижней поверхности языка в его передней части. При этом язык несколько заворачивается внутрь, так что верхняя поверхность передней части языка оказывается от­
деленной от пассивного верхнего артикулятора, которым может быть только постальвеолярная часть твердого нёба. Согласные с такой специфической артикуляцией называют­
ся ретрофлексными или субламинальными. Описанные воз­
можности представлены на рис. 5.2. Разное участие передней части языка в создании пре­
грады учитывается признаком <апикальность [апикальный/ламинальный/субламинальный (ретрофлекс­
Артикуляционные возможности, для описания которых необходимы описанные фонетические признаки, показаны на рис. 5.3. Признаки способа образования Признаки этой группы отражают, во-первых, степень препятствия, которая создается преградой для прохождения воздуха через гортанно-ротовую полость, и, во-вторых, спо­
собы прохождения воздуха через речевой тракт при создании преграды определенного типа. 279 Глава 5. Универсальные фонетические классификации Типы преград и их акустические следствия учитывают­
ся признаком <тип преграды
(articulation
stricture):
[смыч-
ный/фрикативный/аппроксимант]>, он является главным в группе признаков способа образования. Смычные соглас­
ные характеризуются полным замыканием воздушного про­
хода в гортанно-ротовой части речевого тракта. Фрикатив­
ные образуются при создании в тракте значительного суже­
ния, приводящего к возникновению турбулентного шума. имеют сужение, которое меньше, чем у гласных, но в обычных условиях его степень недостаточна для образования турбулентного шума. Особые способы прохождения воздуха через полости речевого тракта фиксируются с помощью нескольких при­
знаков. При образовании смычных согласных воздушный по­
ток может свободно выходить из речевого тракта через но­
совую полость, придавая им особое "носовое" звучание. При открытом носовом проходе образуются носовые соглас­
ные, при закрытом — ротовые. Для учета этих различий вво­
дится признак <назальность
(nasality):
[наличие/отсутствие прохода в носовую Ротовые смычные согласные называют также взрывными, так как размыкание смычки при их образовании сопровождается взрывом. Для фрикативных согласных важны: <форма сужения
[желобча­
Сужение в виде желоба или очень узкого продольного канала характерно для переднеязычных свистя­
ще-шипящих фрикативных (или сибилянтов), в отличие от фрикативных с другим местом образования; <место воздушной струи
(central
lateral): [центральный/латеральный У центральных соглас­
ных воздух проходит через сужение по центральной части ротовой полости. У латеральных проход по центру перекрыт частичной преградой, и воздух обходит ее по боковым кори­
дорам, которые образуются благодаря особой активности внутренних мышц языка; или вибрантность
(trill):
[наличие/отсутст­
вие чередований более закрытого и менее закрытого воздуш­
ного Чередования в степени воздушного прохо­
да, характерные для дрожащих (или вибрантов), связаны с колебаниями какого-либо гибкого речевого органа (перед-
280 5.3. фонетическая классификация МФА... а — кончик языка загнут назад; б — кончик языка движется вперед, скользя по альвеолам; в — язык возвращается в нейтральное положение Рис. 5.4. Динамика образования рет­
рофлексного флэпового согласного ней части языка, увулы) в воздушном потоке, проходящем по центру речевого тракта. Два последних признака гораздо важнее для аппрокси-
мантов, чем для фрикативных согласных. Основанные на них звуковые противопоставления очень распространены. Так, типичным примером латерального аппроксиманта яв­
ляется русский согласный [л], центрального — русский сог­
ласный дрожащего — русский согласный В русской фонетике термин "аппроксимант" не употребляется. В классифи­
кации МФА он подчеркивает, что при артикуляции соответствующих сог­
ласных сближение речевых органов более значительно, чем у гласных, хотя и не образует шума. 281 Глава 5. Универсальные фонетические классификации Последний признак в этой группе учитывает скорость движения активного артикулятора, перекрывающего воз­
душный проход через ротовую полость. Наряду с обычными в этом отношении согласными существуют и такие, при произнесении которых проход перекрывается на очень ко­
роткое время с помощью толчкообразного (англ.
tap)
или ка­
сательного движения (англ.
flap)
кончика или передней час­
ти языка. В первом приближении можно рассматривать это движение как очень короткую смычку, цель которой сводит­
ся просто к мгновенному перекрытию воздушного прохода. Отсюда и название признака (instantaneous): [очень быстрое замыкающее движение активного артикуля-
тора/нормальное замыкающее Согласные, преграда которых образуется быстрым дви­
жением кончика языка, очень распространены в американ­
ском варианте английского языка. Они произносятся в та­
ких словах, как
latter, tanner,
т. е. на месте смычных согласных в слабых заударных слогах (рис. 5.4). Иногда та­
кие согласные называют хлопками. Все описанные выше признаки характеризуют так на­
зываемые основные артикуляции согласных. Некоторые из них встречаются относительно редко и могут быть отнесены скорее к экзотическим, сильно отклоняющимся от наиболее естественных возможностей речевых органов. Однако арти­
куляция согласных может быть и более сложной. Сложные консонантные артикуляции У согласных бывают сложные артикуляции двух типов: последовательные и одновременные. В первом случае в од­
ном звуке совмещаются и реализуются последовательно эле­
менты простых консонантных артикуляций, во втором — на основную артикуляцию согласного накладывается некоторое дополнительное движение. Сложные последовательные артикуляции (первый тип) Имеющиеся здесь возможности наблюдаются главным образом у смычных согласных и учитываются следующими признаками: <преназальность
[наличие/отсутствие на­
зализации в фазе экскурсии ротового 282 5.3. фонетическая классификация [наличие/от­
сутствие назализации в фазе рекурсии ротового соглас­
<аффрицированность отступа [нали­
чие/отсутствие постепенно­
го перехода смычки в шумо-
образующее сужение в фазе рекурсии Смычные согласные, у ко­
торых смычка переходит в шумообразующее фрика­
тивное сужение, называют­
ся аффрикатами. 5.5. Двойная смычка в выдержке лабиовелярного взрывного согласного Сложные одновременные артикуляции (второй тип) В этом классе есть свои подтипы: согласные с двойной преградой и согласные с дополнительной вокалической ар­
тикуляцией. Согласные с двойной преградой характеризуются сбли­
жением губ и образованием дополнительной преграды по центру губного отверстия. Двойными они называются пото­
му, что губная преграда совпадает по типу с основной пре­
градой в более задней части ротовой полости. Для учета та­
кой двойной артикуляции в УФК используется специальный признак <лабиальность
(labial):
[наличие сближения губ/от­
сутствие такого Известным примером лабиове­
лярного аппроксиманта является английский согласный
Рис. 5.5 иллюстрирует образование лабиовелярного взрыв­
ного согласного. Согласные с дополнительной вокалической артикуля­
цией характеризуются дополнительным движением, кото­
рое, накладываясь на основную преграду, меняет резонанс­
ные свойства речевого тракта. Здесь различаются следующие возможности: (palatalization):
[наложение дополни­
тельной язычной артикуляции типа/отсутст­
вие такой Типичный пример — мягкие сог­
ласные в русском языке; 283 Глава Универсальные фонетические классификации 5.6. Профили переднеязычных со­
гласных с дополнительными вокаличе­
скими артикуляциями [наложение дополнитель­
ной язычной артикуляции глубокого типа/от­
сутствие такой В русском языке характер­
ный пример — твердые шипящие [ш, которые иногда на­
зывают двухфокусными; [наложение до­
полнительной язычной артикуляции глубокого го типа/отсутствие такой <лабиализация или (labialization):
[наложе­
ние губной артикуляции та­
кой Артикуляционные профили согласных с дополнитель­
ными вокалическими артикуляциями приводятся на рис. 5.6. 284 S3. Универсальная фонетическая Согласные с количественно-динамическими контрастами Дополнительные возможности звуковых контрастов в области согласных связаны с длительностью и степенью об­
щего произносительного усилия (энергичностью и точно­
стью целевых которые затрачиваются на произ­
водство согласных, близких по другим артикуляционным признакам. Для учета этих различий используются признаки <долгота
(length):
и ар­
тикуляции
(tension):
Для последнего противопоставления в англоязычной фонетической литерату­
ре используются термины
"сильный" и
"слабый". К этой же группе условно может быть отнесен признак <слоговость
(syllabic):
качество соглас­
который учитывает возможность приобретения сог­
ласным свойств слоговости в определенных контекстах. Фо­
нетически в этих ситуациях повышается звучность согласно­
го, что выражается в "обострении" резонансных свойств ре­
чевого тракта, увеличении интенсивности и длительности (относительно обычного неслогового употребления). 5.3.2. Классификация гласных В. отличие от согласных, артикуляция которых направ­
лена на создание преграды, целевая артикуляция гласных связана с приданием речевому тракту определенной геомет­
рической конфигурации со свободным проходом для воз­
душного потока. Только в этих условиях могут быть отчет­
ливо реализованы резонансные свойства, нужные для полу­
чения определенного вокального тембра. В связи с этим классификация гласных на основе артикуляционных при­
знаков представляет значительные трудности. Положение речевых органов при артикуляции гласных трудно зафикси­
ровать с помощью непосредственного наблюдения и осяза­
тельных ощущений. Кроме того, в потоке речи артикуляция гласных подвергается сильным коартикуляционным измене­
ниям под воздействием соседних согласных. В то же время сама установка на артикуляцию со сво­
проходом воздуха ограничивает использование ряда произносительных возможностей. Так, воздушный поток для производства гласных может создаваться только обыч-
285 Глава 5. Универсальные фонетические классификации ным легочным механизмом, и признаки инициации для классификации гласных не нужны. Возможности фонацион­
ного механизма для создания звуковых противопоставлений в области гласных также ограниченны. Использование носо­
вой полости в качестве резонатора явно дополнительно по отношению к соответствующей ротовой артикуляции и должно описываться как элемент сложной вокальной арти­
куляции, т. е. иначе, чем у согласных. Таким образом, для классификации гласных нужны признаки только двух основных групп: фонации и собствен­
но артикуляции. Признаки фонации Для гласных важен один фонационный признак, а именно <тип фонации: [придыхательный/нейтраль­
ный/скрипучий Признаки основной язычной артикуляции у гласных Традиционно главные признаки гласных учитывают положение тела языка в фарингально-ротовой полости в пе­
редне-заднем (горизонтальном) и в верхне-нижнем (верти­
кальном) измерениях. Эти характеристики мес­
то и степень главного артикуляционного сужения, что име­
ет непосредственное отношение к резонансным свойствам речевого тракта. Поэтому при классификации гласных обычно указываются акустические корреляты артикуляци­
онных различий. Главные признаки гласных таковы: [закрытый/средне-закрытый/средне-
Признак учитывает положение тела языка относительно твердого нёба. Акустически наиболее тесно соотносится с частотой первой форманты
F1:
чем больше закрытость гласного (выше подъем), тем ниже час­
тота этой форманты; <ряд
[передний/средний (или Признак учитывает положение тела языка относи­
тельно границ ротовой полости (в качестве точки отсчета могут выбираться либо губы, либо гортань). Акустически наиболее тесно соотносится с частотой второй форманты
F2: чем более передней является артикуляция гласного, тем больше частота второй форманты. 286 5.3. Универсальная фонетическая классификация МФА... Сложные вокальные артикуляции Сложные артикуляции у гласных разделяются на те же два подтипа, которые были выделены для согласных. В од­
новременных сложных артикуляциях на язычную артикуля­
цию гласного накладывается дополнительное движение, ко­
торое существенно меняет тембр гласного. В последователь­
ных сложных артикуляциях в одном звуке совмещаются и реализуются последовательно элементы двух (или более) во­
калических артикуляций. Дополнительная тембровая окраска гласного (сложные одновременные артикуляции) Дополнительные движения модифицируют резонанс­
ные свойства речевого тракта, обусловленные основной язычной артикуляцией гласного. Для их учета в УФК вво­
дятся следующие признаки: <огубление
(rounding):
[сближение углов губ, приводя­
щее к образованию "губной трубочки" на выходе из речево­
го такого Огубленные глас­
ные называют также лабиализованными. Образование "губ­
ной трубочки" приводит к увеличению длины речевого тра­
кта, что вызывает понижение частоты как первой, так и вто­
рой форманты; <ширина глотки
(wide):
[нейтральная/расширенная/су­
Расширение глотки достигается сдвигом корня языка вперед и сопровождается более напряженным и ком-
кообразным состоянием языка. Дополнительно может пони­
жаться гортань. Противоположное движение корня языка приводит к сужению глотки и более распластанному состо­
янию языка. В англоязычной литературе эти движения на­
зываются соответственно
Advanced Tongue Root (ATR)
— продвинутый корень языка и
Retracted Tongue Root — отодвинутый корень языка. Акустические следствия разли­
чий по данному признаку изучены недостаточно, хотя отме­
чается, что гласные, которые произносятся с расширенной глоткой, в целом более интенсивны, имеют выраженные вы­
сокие форманты
(F3, F4),
а также больший уровень усиле­
ния главных формант -
F1
и
F2.
На слух они более "яркие" и отчетливые. Гласные, которые артикулируются с суженной глоткой, имеют приглушенный тембр; 287 Глава 5. Универсальные фонетические классификации или эризованность
(rhoticity): [приподнятость кончика и краев передней части языка к альвеолярной или посталь­
веолярной области/отсутст­
вие такого движения В УФК отмечается сложная и трудно описыва­
емая артикуляция ретроф­
лексных гласных (рис. 5.7). В то же время они имеют отчетливый акустический коррелят — низкую частоту F3
в области, которую обычно занимает вторая форманта (1 500-2 ООО Гц). Наличие ретрофлексных гласных является яркой особенно­
стью американского варианта английского языка (произно­
сятся в словах
heard
и многих других). [наличие дополнительного прохода в носовую полость/отсутствие такого назализация приводит к модификации обычной формантной картины гласного из-за появления в ней допол­
нительных носовых формант и частичного ослабления рото­
вых. Гласные, в образовании которых участвует носовая по­
лость, называются назализованными. При производстве на­
зализованных гласных, в отличие от носовых согласных, воз­
душный поток проходит свободно и через ротовую полость. 5.7. Профиль ретрофлексного (эризованного) гласного Сложные вокальные артикуляции последовательного типа К сложным гласным этого типа относятся прежде все­
го дифтонги. Дифтонг (англ.
diphthong)
— это сложный глас­
ный, целевая артикуляция которого включает два разных во­
калических уклада речевых органов и постепенный переход от одного уклада к другому, называемый скольжением. Так же, как монофтонг (англ.
monophthong),
или, иначе, чистый гласный, дифтонг принадлежит одному слогу. Однако для монофтонгов характерна ориентация на достижение относи­
тельно устойчивого положения речевых органов в фазе вы­
держки, а для дифтонгов центральная часть гласного 288 У
ниверсальная фонетическая классификация МФА... дится обычно на переход, который следует считать самосто­
ятельным элементом целевой артикуляции. Обычно при классификации дифтонгов используются несколько признаков, которые учитывают фонетическую выраженность краевых элементов дифтонга и характер изме­
нения вокальной артикуляции при произнесении дифтонга. По фонетической выраженности краевых элементов дифтонги делятся на нисходящие (больше выражен началь­
ный элемент дифтонга), восходящие (больше выражен ко­
нечный элемент) и равновесные (оба компонента выражены примерно одинаково). Соответствующий признак формули­
руется так: фонетическая выраженность компонентов ди­
фтонга: По общему направлению артикуляционного перехода дифтонги делятся на центрирующие (или центростремитель­
ные) и (центробежные). При произнесении центрирующих дифтонгов типа
артикуляция ме­
няется от уклада с выраженными тембровыми характеристи­
ками к укладу нейтрального гласного, близкому к общей ре­
чевой позе. Для учета этих различий вводится признак <на-
личие движения к нейтральному [центрирую-
Нецентрирующие дифтонги делятся на два подтипа в зависимости от того, как изменяется степень звучности (рас­
твор и подъем) сложного гласного от начала к концу звуча­
ния. При увеличении степени звучности гласные относятся к классу расширяющихся дифтонгов (ср. дифтонги типа
[ie, при уменьшении — к сужающихся (дифтонги ти­
па
В УФК эти различия учитываются признаком <изменение степени [расширяющийся/сужаю­
щийся] Помимо дифтонгов в некоторых языках (например, ан­
глийском) существуют и трифтонги (англ.
triphthong),
т. е. сложные гласные, при произнесении которых реализуются три относительно самостоятельных вокалических уклада с двумя внутренними переходами. Три вокальных компонента выявляются, однако, только при очень тщательной артику­
ляции — в обычной речи трифтонг, как правило, стягивает­
ся в дифтонг. На рис. 5.8 приведены схемы артикуляционных перехо­
дов, типичных для дифтонгов и трифтонгов английского языка (британский вариант). — 289 Глава 5. Универсальные фонетические классификации Дифтонги а б в а - передний ряд; б — центральный ряд; в — задний ряд; Трифтонги а б в 1 — верхний подъем; 2 — верхне-средний подъем; 3 — средне-нижний подъем; 4 — нижний подъем Рис. 5.8. Артикуляционные траектории дифтонгов и трифтонгов английского языка Гласные с количественно-динамическими контрастами При производстве гласных так же, как и у согласных, используются дополнительные возможности создания звуко­
вых контрастов, в основе которых лежат различия в длитель­
ности и степени общего произносительного усилия (энер­
гичности и точности целевых артикуляционных движений). Для учета этих различий в УФК применяются те же призна­
ки, что у согласных: (length):
и артикуляции
(tension):
[напряженный/не­
Ненапряженные гласные характеризуются меньшей длительностью и интенсивностью, а также некоторым сдви­
гом артикуляции в область укладов, более близких к нейт­
ральному гласному (или позиции речевой позы). Типичным примером этого противопоставления являются гласные типа английских
[i]
~
или
[u]
~ В англоязычной фонетиче­
ской литературе для гласных по напря­
женности используются термины
tense
"напряженный" и
lax "ненапряженный". 290 фонетическая классификация МФА... Система кардинальных гласных Как уже отмечалось, артикуляционная классификация гласных связана с определенными трудностями, поскольку такие основные для образования гласного параметры, как степень и место язычного артикуляционного сужения, слож­
но установить путем непосредственного наблюдения и ося­
зательного контроля. Опора на слуховую оценку здесь более существенна, но в то же время и более субъективна. Чтобы уменьшить степень субъективности слуховых оценок и стан­
дартизовать описание гласных в конкретных языках, фоне­
тисты часто используют так называемую систему кардиналь­
ных гласных, разработанную известным британским фоне­
тистом Д. Джоунзом Кардинальные гласные представляют собой набор идеализированных вокальных артикуляций, с помощью ко­
торых может быть описано потенциальное пространство гласных (англ.
vowel space).
С точки зрения возможных по­
ложений языка внутри ротовой полости это пространство ограничено небольшой зоной, показанной на рис. 5.9 б; ус­
ловно эти положения фиксируются по области максималь­
ного подъема спинки языка. На рис. 5.9 а для сравнения показаны профили гласных, которые характеризуются пре­
дельными (крайними) положениями языка в этом про­
странстве. Самая верхняя и передняя точка потенциального про­
странства гласных соответствует гласному
самая нижняя и задняя точка — гласному [а]. Дальнейшее продвижение языка в указанных направлениях приводит к образованию аппроксимантных или фрикативных согласных. Самая верх­
няя задняя точка пространства занята гласным [и], который соотносится с предельно высоким положением языка в зад­
ней части ротовой полости и максимальным огублением. Предельно низкое положение языка в передней части рото­
вой полости соответствует гласному [а]. Указанные артику­
ляции являются базовыми в наборе восьми первичных кар­
динальных гласных. Остальные типы гласных устанавлива­
ются следующим образом. Гласные [е], [е], определяют пе­
реднюю границу вокального пространства и выделяются на слух как разные звуковые типы, возникающие при переходе от гласного
[i]
к [а] с приблизительно одинаковым слуховым расстоянием друг от друга. Движение от [а] к [и] с теми же 291 Глава 5. Универсальные фонетические классификации в) Д) а — предельные положения языка при г - первичные кардинальные глас-
производстве гласных; ные; б - потенциальное пространство во- д - полный трапецоид кардинальных кальных артикуляций; гласных. Трапецоид разделен на в — граничные точки этого простран- условные зоны, в пределах ства; рых могут располагаться реальные гласные Рис. 5.9. Параметры вокального про­
странства 292 фонетическая классификация МФА... а — испанский, б — японский, в — датский Гласные разных языков в во­
калическом трапецоиде критериями дает гласные [о], которые определяют зад­
нюю границу вокального пространства. Потенциальное пространство вокальных артикуляций с ограничивающими его первичными кардинальными гласны­
ми принято изображать в виде схемы, которая называется трапецоидом. Кроме первичных, в набор кардинальных гласных вхо­
дят вторичные гласные. Они отличаются от описанных вы­
ше первичных гласных признаком огубленности. Для глас­
ных передней зоны образуются пары [е]~[0], где второй член — огубленный гласный. Для гласных задней зоны образуются пары где второй член пары — огубленный, и [э]~[л], где второй член — неогубленный гласный. Кроме того, к вторичным карди­
нальным гласным относятся гласные центральной зоны: за­
крытые и гласные средней степени открытости каждой паре второй гласный — огубленный. Система кардинальных гласных задумывалась и ис­
пользовалась прежде всего в целях практической фонети­
ки — для обучения иностранному языку и полевой фонети­
ческой работы. Полная система включает 20 идеализирован­
ных единиц, образующих своего рода сетку координат, отно­
сительно которой могут быть оценены и расположены в во­
калическом пространстве гласные конкретных языков. Это дает основу для их сравнения и классификации. На рис. представлены некоторые гласные испанского, японского и датского языков, которые при одинаковом транскрипцион­
ном обозначении отличаются своим расположением в услов­
ном кардинальном трапецоиде. 293 Глава 5. Универсальные фонетические классификации Кардинальные гласные Д. Джоунза и их транскрипци­
онные обозначения с небольшими уточнениями и дополне­
ниями положены в основу Международного фонетического алфавита. Нельзя не отметить, что схема кардинальных глас­
ных, разработанная Джоунзом на основе общих артикуляци­
онных и слуховых критериев в период, когда формантный анализ гласных был еще недоступен, оказалась впоследствии очень близкой к схеме расположения гласных в пространст­
ве частот первой и второй формант. Это еще раз свидетель­
ствует о том, что целевая установка артикуляции гласных связана с резонансными свойствами речевого тракта. 5.3.3. Об универсальности фонетической классификации МФА Система признаков, используемых в фонетической классификации МФА, позволяет достаточно детально опи­
сывать фонетические характеристики звуков, принадлежа­
щих разным языкам. Так как сама классификация ориенти­
рована на отражение общей способности человека произво­
дить и воспринимать контрасты между звуками, ее призна­
ковая база часто рассматривается не только как набор при­
знаков-классификаторов, но одновременно как совокуп­
ность фонетических параметров, которые человек в принци­
пе способен контролировать при артикуляции и восприятии речи. Из этого делается вывод, что этот набор параметров универсален, т. е. не зависит от языка. Практика описания и изучения звукового строя раз­
личных языков мира показывает, что такое представление является излишне упрощенным. С одной стороны, фонети­
ческий признак, описывающий некоторое артикуляционное свойство, может базироваться на нескольких параметрах, ко­
торые в совокупности порождают близкие, но нетождествен­
ные артикуляции. Например, признак "огубление", выделя­
ющий категорию лабиализованных гласных, основан на сложном управлении мышцами губ, которое включает их на­
пряженность, степень сокращения и растяжения. Сложная артикуляционная природа огубления выражается не только в различной степени лабиализации гласных, но и в использо­
вании весьма разнообразных губных конфигураций (не толь­
ко по языкам, но и в пределах одного языка у разных глас­
ных или у одного и того же гласного в разных контекстах). 294 фонетическая классификация С другой стороны, "огубление" может по-разному взаимо­
действовать с другими признаками при образовании смыс-
лоразличительных звуковых контрастов. Так, в русском язы­
ке /у/ противопоставлено /и/ (аналогично /о/ ~ не толь­
ко по признаку "огубление", но и по признаку ряда, обра­
зуя сложный тембровый контраст, для описания которого в универсальном инвентаре отдельного признака нет. Это приводит к постоянным дискуссиям о том, какой из призна­
ков "огубление" или "ряд" - является фонологически су­
щественным для русских гласных. В то же время во фран­
цузском языке различие по огубленности используется неза­
висимо от ряда (для передних гласных). Учесть подобные различия между языками путем про­
стого расширения набора универсальных признаков невоз­
можно, да и не имеет смысла. Скорее, следует признать, что универсального и исчерпывающего набора признаков про­
сто не существует. Каждый язык живет своей жизнью, ис­
пользуя для звукового общения универсальные инструмен­
ты — речевой аппарат, органы слуха и человеческий мозг. Универсальные фонетические классификации и признако­
вые инвентари, суммируя фонетические описания разных языков, позволяют получить предварительную и весьма ог­
рубленную характеристику звукового инвентаря конкретно­
го языка, которая требует уточнения, а часто и переосмыс­
ления при более детальном фонетическом и ском описании. 5.4. Универсальная акустическая классификация звуков Универсальная акустическая классификация, известная также как теория различительных признаков [Якобсон и др. 1962; Якобсон, Халле 1962], является, по существу, единст­
венной попыткой описания звуковых контрастов на основе акустических характеристик. Ее предложили в 1952 г. Р. Якобсон, Г. Фант и Халле, далее она дополнялась и уточнялась теми же авторами. Однако даже после дополне­
ний акустическая классификация не достигла той полноты и Необходимой детализации, которая имеется в артикуляцион­
ной классификации МФА. Тем не менее основные акусти­
ческие признаки, на основе которых формируются важней-
295 Глава 5. Универсальные фонетические классификации шие звуковые противопоставления, в этой классификации выделены. Дальнейшее изложение посвящено знакомству с ее признаковой базой. Спектрограммы, иллюстрирующие большинство звуковых контрастов, о которых будет идти речь, можно найти в главе 3. Общая характеристика признаковой базы Признаковая база акустической классификации вклю­
чает двенадцать бинарных различительных признаков, набор которых считается достаточным для описания смыслоразли-
чительных звуковых контрастов, возможных в конкретных языках. Каждый признак представляет собой противопоста­
вление между двумя относительными проявлениями одного и того же акустического свойства, т. е своего рода шкалу вы­
раженности определенного акустического (перцептивного) качества. Звуки, у которых степень проявления акустическо­
го свойства больше некоторого порога, имеют положитель­
ное значение соответствующего признака-классификатора, в противном случае — отрицательное. Предполагается, что граница (порог) внутри акустической шкалы признака уста­
навливается не объективными физическими характеристи­
ками противопоставляемых звуков, а системой звуковых контрастов, которые используются в данном языке для раз­
личения смыслов (слов). Это означает, что авторы теории различительных признаков изначально учитывали возмож­
ность различного акустического воплощения одинаковых значений одного и того же признака в фонетически близких звуках разных языков мира. Предложенный ими набор аку­
стических признаков-классификаторов следует рассматри­
вать прежде всего как систему потенциальных фонетических координат, которая используется и настраивается в каждом языке специфическим образом. Отличительная особенность этой системы координат состоит в том, что для описания согласных и гласных пред­
лагается один и тот же набор признаков. Они делятся на группы (или семейства) в соответствии с тем, что учитыва­
ется: свойства источников звука, резонансные свойства ре­
чевого тракта (передаточная функция) или то и другое одно­
временно. Описание акустических различий, лежащих в ос­
нове каждого признака, сопровождается указанием на их ар­
тикуляционные 296 4 Универсальная акустическая классификация звуков Соответственно выделяются: признаки главных классов звуков (учитываются и точники звука, и общие особенности передаточной ции); признаки источников звука; резонансные признаки, связанные с характеристиками основного (фарингально-ротового) резонатора; признак назализации, учитывающий наличие дополни­
тельного резонатора. 5.4.2. Признаки главных классов звуков В эту группу входит два признака: Вокальные в отличие от невокальных, акустиче­
ски характеризуются четко выраженной формантной струк­
турой, которая обусловлена наличием свободного прохода для воздушного потока через фарингально-ротовую полость и участием периодического источника в образовании звука. Под четко выраженной формантной структурой понимается такая реализация в которой присутствуют три первые ротовые форманты, энергетически преобладающие над другими формантными областями спектра. К вокальным относятся гласные и ротовые сонорные согласные. Консонантные звуки, в отличие от неконсонантных, имеют более низкий общий уровень интенсивности, что обусловлено двумя причинами: наличием значительного су­
жения (преграды) в речевом тракте и появлением антирезо-
нансов в его передаточной функции, которые ослабляют или полностью подавляют энергию в определенных частотных областях. К консонантным относятся практически все зву­
ки, традиционно причисляемые к согласным. Применение описанных признаков для классификации некоторых звуков, обычно относимых к согласным, дает не­
ожиданный и спорный результат. Например, глоттальный звук типа английского характеризуется сильным ослабле­
нием первой форманты и отсутствием периодического источ­
ника, поэтому он считается невокальным. В то же время при его образовании в речевом тракте выше гортани нет никаких преград: воздух свободно проходит через фарингально-рото-
297 Глава 5. Универсальные фонетические вую полость, создавая
с отчетливой второй и бо­
лее высокими формантами, частоты которых определяются конфигурацией этой полости. С учетом этих особенностей глоттальный
[h]
классифицируется как невокальный и некон­
сонантный звук. В эту же категорию попадают так называе­
мые полугласные звуки типа английских глайдов
[w]
и
ко­
торые имеют несколько ослабленную вторую и более высокие форманты по сравнению с гласными, однако отличаются от большинства согласных значительной интенсивностью. 5.4.3. Признаки, обусловленные источниками звука В этой группе три первых признака учитывают особен­
ности работы основного источника звука при производстве звуков разных главных классов: 1. nuant)>. К прерванным относятся согласные, у которых акусти­
чески выражен интервал отсутствия или сильного ослабле­
ния звуковой энергии в полосе частот выше основного тона, после которого следуют взрыв или резкое изменение фор­
мантой картины. На осциллограммах прерванных звуков, в отличие от можно обнаружить моменты рез­
кого нарастания общей интенсивности звучания либо на ин­
тервале образования самого звука, либо при переходе к сле­
дующему гласному. Прерванными являются шумные взрыв­
ные согласные и аффрикаты, а среди сонорных — носовые, вибранты и различные типы согласных с мгновенным затво­
ром (толчкообразные и флэповые согласные). 2. <Глоттализованный/неглоттализованный
Глоттализованные согласные (или, в традиционных терминах, эйективные) характеризуются резким включением интенсивного источника шума, расположенного выше гор­
тани, после чего следует акустическая пауза, вызванная со­
хранением (задержкой) сомкнутого и сжатого состояния лосовой щели. К глоттализованным звукам и сам гортанный взрыв, который является результатом сжа­
тия или смыкания голосовой щели. 3. В основе признака лежат относительные различия в интенсивности, длительности и степени упорядоченности 298 акустическая классификация звуков фрикативного шума, образуемого при производстве речевых звуков, т. е. своего рода шкала шумности. Резкие согласные, в отличие от нерезких звуков, имеют интенсивный и дли­
тельный шум, в котором звуковое давление изменяется без каких-либо признаков регулярности (чисто случайно). На спектрограммах шума резких согласных отсутствуют следы упорядоченности как в частотной области (в виде энергети­
чески выделенных узких формантных областей), так и во временной (в виде вертикальной периодической штрихов­
ки). Осциллограммы резкого шума демонстрируют случай­
ную, нерегулярную форму звуковой волны. У нерезких сог­
ласных в спектре шума могут выделяться отчетливые фор­
матные области; шумовые колебания на осциллограммах имеют более регулярный характер; общая интенсивность меньше, чем у соответствующих резких. Артикуляция резких согласных характеризуется обра­
зованием сложного препятствия, которое создает более бла­
гоприятные условия для турбулентного шумообразования, чем при произнесении нерезких согласных. К резким сог­
ласным относятся аффрикаты (сравнительно с обычными взрывными того же места образования) и свистяще-шипя­
щие фрикативные (сравнительно с прочими фрикативны­
ми). Акустически свистящие являются более резкими, чем шипящие. Авторы теории различительных признаков под­
черкивают, что граница на шкале шумности, которая разде­
ляет согласные на классы резких и нерезких звуков, опреде­
ляется не только акустическими свойствами шума, но и си­
стемой звуковых контрастов в конкретном языке. Так, во французском языке, где нет аффрикат, все фрикативные со­
гласные могут рассматриваться как резкие в отличие от ос­
тальных звуков, в том числе взрывных, которые являются нерезкими. В английском языке к резким могут быть отне­
сены аффрикаты и все фрикативные, кроме наиболее сла­
бых шумных [9] и которые, будучи нерезкими, противо­
поставлены резким фрикативным и только по этому признаку. В то же время по акустическим свойствам шума нерезкие [9] и [5] почти не отличаются от и [V], которые считаются резкими. Кроме описанных признаков, с источниками звука связаны различия в глухости/звонкости согласных. Для уче­
та этих различий вводится признак Звонкие звуки, в отличие от глухих (не-
299 Глава 5. Универсальные фонетические классификации звонких), произносятся с участием голосового источника. На спектрограммах звонких звуков в самой нижней части частотного диапазона (в области основного тона) видна от­
четливая голосовая полоса, а осциллограммы показывают периодический характер сигнала. Признаки, обусловленные разной работой источников звука, нужны для описания лингвистически существенных звуковых контрастов в области согласных. Все гласные хара­
ктеризуются по этим признакам как непрерванные, неглот­
тализованные, нерезкие и звонкие. 5.4.4. Резонансные признаки, обусловленные основным резонатором В данную группу включены пять признаков, с помо­
щью которых фиксируются лингвистически существенные спектральные различия, обусловленные формой фарингаль­
но­ротового резонатора: 1. Для звуковых противопоставлений, различаемых по этому признаку, важно отношение энергетического вклада центральной части звукового спектра к краевым частотным областям. Компактные звуки характеризуются большей кон­
центрацией энергии в относительно узкой серединной час­
частотного диапазона спектра, большей интенсивностью и длительностью. У диффузных (некомпактных) звуков энергетический вклад краевых, нецентральных областей спектра больше, чем серединной зоны, а интенсивность и длительность обычно меньше. У гласных компактность связана прежде всего со сте­
пенью открытости язычного прохода и, следовательно, с ча­
стотой Спектральная компактность гласного увеличива­
ется при опускании языка, которое сопровождается увеличе­
нием раствора ротовой полости и смещением язычного су­
жения назад, что приводит к возрастанию и понижению Чем ближе к вышележащим формантам, тем больше их амплитудный уровень и интенсивность гласного в Максимально компактными являются открытые ные гласные заднего ряда, минимально компактными (мак­
Центральной зоной спектра у гласных считается область около 1 ООО — 1 500 Гц, у согласных несколько выше — около 1 500 Гц. 300 5.4. акустическая классификация звуков симально диффузными) ­ закрытые гласные переднего ряда. У согласных компактность связана с местом образова­
ния преграды: чем дальше от губ находится преграда, чем длиннее полость перед артикуляционным сужением, тем бо­
лее компактным становится шумовой спектр согласного. Поэтому нёбные согласные (палатальные и велярные) более компактны, чем согласные, которые образуются в передней части ротовой полости. По конфигурации речевого тракта компактные звуки описываются как имеющие форму рупора, расширяющегося вперед от места максимального сужения, а диффузные — расширяющегося назад. Три следующих признака образуют группу так называ­
емых признаков тона, который определяет специфические тембровые качества звука. 2. Данный признак характеризует общую вы­
соту звука. Он учитывает соотношение энергетического вкла­
да низкочастотной и высокочастотной области спектра в об­
щую звуковую энергию. К низким (низкотональным) отно­
сятся звуки, у которых энергия сосредоточена в более низких частотах, чем у высоких (высокотональных или ненизких). Для гласных указанные различия определяются частот­
ным положением ¥2 относительно соседних формант: чем ближе ¥2 и ниже, тем более низким является гласный. И наоборот, чем ближе ¥2 к ¥3 и более высоким форман­
там, тем гласный выше. Эти различия связаны с параметра­
ми язычного сужения: чем ближе язычный проход к пала­
тальной, серединной зоне ротовой полости и чем он уже, тем более высоким будет гласный. Поэтому самыми высоки­
ми являются гласные. Для согласных действует та же тенденция, задаваемая расстоянием преграды от палатальной зоны полос­
ти: чем дальше от этой зоны, тем ниже звук. Наиболее низ­
кими являются согласные, которые образуются в перифери­
ческих участках речевого тракта: в области губ и мягкого нё­
ба (или еще глубже). Для переднеязычных шумных соглас­
ных связь между близостью преграды к серединной зоне и тембрального тона осложняется тем, что оптималь­
ным местом артикуляции для образования высокочастотно­
го шума являются более передние — зубная или альвеоляр­
301 Глава 5. Универсальные фонетические классификации области. Сдвиг места артикуляции назад, т. е. ближе к палатальной зоне, приводит к увеличению длины переднего резонатора, находящегося перед преградой, что вызывает понижение частотных характеристик фрикативного шума (ср. шум И Поэтому по спектру шума постальвеоляр­
ные согласные ниже зубных и альвеолярных. 3. Этот признак относится к вторичным тональным при­
знакам. Он отражает акустические следствия таких дополни­
тельных артикуляций, как огубление (лабиализация), рет-
рофлексность и фарингализация. Их наложение на простую язычную конфигурацию приводит к увеличению длины ро­
тового резонатора и сужению его граничных областей — губ­
ной или фарингальной. В результате у звуков с указанными артикуляциями и спектр модифици­
руются: частоты всех формант понижаются и энергия высо-
частотной части спектра ослабляется. В шумовых интервалах бемольных согласных понижается нижняя граница шума. 4. Этот признак также относится к вторичным тональным признакам. Он отражает акустические следствия дополни­
тельной артикуляции палатализации у согласных и расшире­
ния глотки у гласных. В обоих случаях происходит смеще­
ние языка вперед, сопровождаемое расширением фарин-
гального прохода и уменьшением объема ротовой полости. У диезных вокальных звуков это приводит к увеличению час­
тоты нижних формант и некоторому возрастанию интенсив­
ности по сравнению с простыми (недиезными) звуками. Ди­
езные шумные согласные характеризуются усилением высо­
кочастотных составляющих и некоторым повышением ниж­
ней границы шумового участка. 5. <Напряженный/ненапряженный Контрасты, которые учитываются данным признаком, занимают особое положение в рассматриваемой группе. На­
пряженные звуки, в отличие от ненапряженных, характери­
зуются большей длительностью, большей интенсивностью, более отчетливым и богатым спектром. Эти различия связа­
ны со степенью мышечного напряжения, которое затрагива­
ет язык, стенки речевого тракта и голосовые связки. Одна­
ко, как отмечают авторы рассматриваемой классификации, данный артикуляционный параметр требует дополнительно­
го изучения. 302 Универсальная акустическая классификация звуков Напряженность гласных проявляется в большей тща­
артикуляции, которая приближается к перифери­
ческим позициям кардинальных гласных, ограничивающих вокалический трапецоид. Они произносятся с большей де­
формацией основного резонатора относительно нейтрально­
го гласного, при артикуляции которого речевой тракт не имеет выраженных локальных сужений. У напряженных взрывных согласных, по сравнению с ненапряженными, увеличиваются длительность и интен­
сивность взрыва, за которым часто следует участок выра­
женного аспиративного шума. У напряженных фрикатив­
ных, кроме увеличения общей длительности и интенсивно­
сти шума, спектр "заполняется" высокочастотными соста­
5.4.5. Признак назализации * <Носовой/ртовый У носовых звуков, образуемых с участием носового ре­
зонатора, в спектре появляются устойчивые, мало изменяю­
щиеся форманты назализации (наиболее сильная в области 200-300 Гц). Ротовые форманты при этом ослабляются, вплоть до возможного полного подавления (у носовых сог­
ласных). Ослабление на интервале носовых зву­
ков приводит к уменьшению общей интенсивности и резким перепадам в выраженности ротовых формант на границах с соседними ротовыми гласными. * * * классификация звуков на основе разли­
чительных признаков была очень популярна в 60-70-е годы, хотя во многих случаях исследователи, описывая звуковые контрасты в конкретных языках, исходили не столько из акустического анализа звуковых противопоставлений, сколько переводили артикуляционные признаки контрасти­
рующих звуков в их акустические корреляты. Попытки применения предложенного набора призна­
ков привели к ряду критических замечаний, которые каса­
лись почти всех сторон теории. Отмечалась недостаточ­
ность признаков для описания звуковых контрастов в не­
которых малоизвестных языках, критиковались их строго 303 Глава 5. Универсальные фонетические классификации бинарная структура, расплывчатость акустических форму­
лировок, отсутствие специальных разъяснений по поводу соотношения между признаком и его наблюдаемым артику-
ляционно-акустическим воплощением в противо­
поставлениях разных языков и в одном и том же языке в разных контекстных условиях. Один из авторов теории раз­
личительных признаков известный американский фонолог М. Халле вместе с другим знаменитым лингвистом Н. Хом-
ским представили новый вариант универсальной системы различительных признаков, подробно описанный в их сов­
местной работе "Звуковая модель английского языка" [Chomsky, Halle
1968]. имея возможности обсуждать предложенные нововведения, мы отсылаем интересующе­
гося читателя к указанной книге (см. также Отметим лишь, что в новой системе раз­
личительные признаки в основном имеют артикуляцион­
ную интерпретацию. 5.5. Классификация звуковых средств звуковые Прежде чем перейти к описанию признаков, характе­
ризующих супрасегментные единицы, рассмотрим иерархи­
ческую и компонентную структуры последних несколько подробнее, чем это было сделано в главе 1. Там уже шла речь о том, что предложение разлагается на фонетические синтагмы, которые, в свою очередь, состоят из фонетиче­
ских слов. Слова же разлагаются на слоги, а последние — на звуки. В некоторых языках приходится выделять и другие промежуточные фонетические составляющие. Разумеется, не всякое предложение делится на компо­
ненты всех иерархических уровней. Вполне нормальны од-
нослоговые предложения, например: Стой! В таких выска­
зываниях слог со всеми единицами более высоких уровней: он является и словом, и синтагмой, и предложени­
ем. С другой стороны, в предложении: Подожди, Аня ведь не готова! представлено разложение на единицы всех уров­
ней. Дерево для этого предложения будут выглядеть так: 304 5.5. Классификация звуковых средств Фонетическое предложение Фонетические синтагмы Фонетические слова Слоги Сегменты II ъ II Рис. Дерево фонетических состав­
ляющих для предложения Подожди, Аня готова! Рассмотрим структуру супрасегментных составляющих, поднимаясь вверх от уровня слога. Слог в общем случае со­
стоит из вокалической вершины и консонантных консонантные "края" слога могут отсутствовать. Если слог имеет начальный согласный, то он является прикрытым, ес­
ли согласного в начале нет, то слог — неприкрытый. Если имеется конечный согласный, то слог закрытый, а если его нет, то слог открытый. Так, слог является неприкрытым и открытым, слог — прикрытым и открытым, а — прикрытым и закрытым. Вершиной слога может быть и сонорный согласный Такие со­
норные называют слоговыми, или вокализованными. Кроме сегментных составляющих, слог может иметь и собственные признаки, которые характеризуют его как цель­
ную единицу. могут быть тональные признаки и тембровые признаки. Мы рассмотрим их ниже. Цепочки слогов, составляющих слово, во многих язы­
ках четко организованы ритмически: один из слогов являет­
ся более сильным, чем другие. Такой слог называется удар­
ным, а прочие безударными, они, в свою очередь, делятся на и заударные. 305 Глава 5. Универсальные фонетические классификации Фонетическое слово не всегда совпадает с грамматиче­
ским. Оно может включать в себя примыкающие к полно-
значному слову безударные служебные и полуслужебные слова (предлоги, частицы, местоимения, союзы). Эти слова называются Клитики, предшествующие полно-
значному слову (например, не называются прокли-
тиками, а следующие за ним (например, Аня ведь
) — энкли-
тиками. Поскольку фонетическое слово объединяется как ритмическое целое, его иначе называют речевым тактом. Иногда граница между клитиками и ритмически само­
стоятельными словами не вполне ясна (такова, например, ситуация с русскими местоимениями и союзами). В то же время языки могут различать клитические и неклитические формы служебных слов, например, французский язык раз­
личает
me
—
moi, te
—
toi
и др. Возможны случаи, когда в качестве клитики выступает полнозначное слово. Так, в древнерусском языке часть пол-
нозначных словоформ была лишена нормального ударения, но получала слабое усиление начального слога. При наличии предшествующих служебных единиц такие слова были со­
вершенно безударны, так как усиление приходилось на пер­
вый слог Эти словоформы называются "энклиноме-
ны". Позднее произошло выравнивание ритмических вер­
шин по силе, и ударение закрепилось на первом слоге: берег, было и т. п. В сложных словах может быть более одного ударения: Более слабое ударение (в русском языке это обычно первое из двух) называется ростепенным, или побочным. Следующей по рангу супрасегментной составляющей является фонетическая синтагма (или Фо­
нетическое единство этой единице придает в первую оче­
редь ритмическое объединение вокруг фразового акцента. Например, в цитированном выше предложении Подожди, Аня ведь не готова! вторая синтагма имеет фразовый акцент на слове готова. Кроме акцента, синтагма объединяется так­
же некоторой просодической схемой, в состав которой вхо­
дят такие средства фразовой просодии, как уровень тона, темп и громкость. Внутри предложения синтагмы могут раз­
деляться паузами, но это не обязательно. Предложение оформляется теми же средствами фразовой просодии, что и синтагма. 306 5.5. звуковых средств 5.5.2. звуковые средства Слоговые тоны Существует базовое различие двух типов тонов: ров­
ных, или уровневых (англ.
level)
и скользящих, или контур­
ных (англ.
Ровные не имеют фонологически значи­
мого изменения тона внутри слога, а скользящие, напротив, его имеют. Ровные тоны отличаются между собой высотой, а скользящие — направлением. Чтобы представить себе эти различия, рассмотрим четыре огласовки частицы так в раз­
ных контекстах: (1) А. — Ой, мамочка! Я ключи забыла! В. - Та-ак!.. (осуждающе) (2) А. — Можешь себе представить — она его бросила! в. — Та-ак!.. (удивленно) (3) А. — Ты ведь его предупреждал. Так? в. — Так. На рисунке 5.12 приведены интонограммы, отражаю­
щие эти варианты произнесения слова так. Мы видим, что в первом и втором случаях тон на глас­
ном движется почти ровно (с легким незначимым пониже­
нием к концу). Между собой эти произнесения различаются общим уровнем тона. В третьем и четвертом случаях наблю­
дается сильное изменение уровня тона на гласном: в вопро­
се тон поднимается, а в ответе сначала падает, а потом под­
нимается. В русском языке различие тональных конфигураций служит интонационным средством — они выражают разные цели высказываний и разные эмоциональные установки го­
ворящего. В языках же Юго-Восточной Азии различия в уровне и направлении тона используются для лексических противопоставлений, т. е. функционально подобны контра­
стам фонем. Например, в китайском языке слог та с ров­
ным высоким тоном означает "мама", а с падающим то­
ном — "ругать". Какими же признаками описываются тональные разли­
чия? Для ровных тонов это противопоставление уровней. Этот признак максимально может принимать пять значений: сверхвысокий
(Extra High,
сокращенно —
EH); высокий
(High
- Н); 307 Глава 5. Универсальные фонетические классификации к" 260 80Hz/Lg ТакЗ
/Fsmooth [l/10secs] t a: к 260 J Интонограммы четырех про­
изнесений однословного предложения (слово так) с разной интонацией 308 5.5. Классификация звуковых средств средний
(Mid
- М); низкий
(Low
—
сверхнизкий
(Extra Low
—
Однако большинство тональных языков имеет бинар­
ное противопоставление по уровню тона, т. е. высокий тон противопоставляется низкому. Для контурных тонов смыслоразличительным призна­
ком является направление. Здесь имеются два основных зна­
чения: восходящий
(Rising
-
R)
и нисходящий
-
F) и их комбинации: восходяще-нисходящий
и Этим возможности тональных противопоставлений не исчерпываются — одно и то же скользящее движение тона может осуществляться в разных тональных диапазонах. Так, восхождение и падение тона могут происходить в более низ­
ком и более высоком регистрах, что дает соответственно низкий восходящий
(Low Rising),
(High Rising),
низкий нисходящий
(Low Falling)
и высокий нисходящий
(High Аналогичные регистровые разли­
чия и В языках мира обнаруживаются два типа слоговых то­
нальных систем, их различие тесно связано с грамматиче­
ским устройством языка. В одних языках в основе системы лежат уровневые различия ровных тонов (таковы, в частно­
сти, многие языки Африки). В этих языках слово обычно ог-
ласовано как цепочка ровных тонов. Приведем три слова, различающихся тонами, из языка йоруба:
oba/MH
"(он) встретил",
oba/MM
"(он) спрятал",
oba/ML
"(птица) села". Длинные цепочки ровных тонов имеют некоторые до­
полнительные свойства, которые обычно учитываются в описании тональной системы, хотя и не создают смысловых оппозиций. Дело в том, что общий уровень тона, на котором произносится отрезок речи, понижается по мере расхода воздуха. Это дает деклинацию (англ.
declination)
тона. Ана­
логичное явление есть и во фразовой интонации. Другой тип тональных систем представляют языки Юго-Восточной Азии, в которых слог и морфема совпадают. Здесь в основе системы лежат различия скользящих тонов. Приведем четыре слогоморфемы, различающиеся скользя-
из языка таи:
nha:/HR
"тетя",
nha:/LR
"тол­
стый",
nha:/LF
"имя",
nha:/HF
"поле". Однако для этих 309 Глава 5. Универсальные фонетические классификации языков характерно совмещение тональных и фо­
национных компонентов (скрипучий или придыхательный голос, вертикальные смещения гортани) в пределах просоде­
мы. При этом фонационные компоненты не выступают как отдельные смыслоразличительные признаки, а лишь сопро­
вождают те или иные тональные конфигурации. Это одно из проявлений общей ситуации фонетической комплексности различительных признаков, которая до сих пор не находит эксплицитного отражения в признаковых классификациях. Та же проблема возникает при фонетическом анализе сло­
весного ударения. Словесное ударение На материале русского языка легко продемонстриро­
вать смыслоразличительную функцию ударения. Достаточно привести различающиеся местом ударения пары типа ­ ­ — и т. п. Сходным образом, в английском языке мы имеем пары типа
subject "предмет" —
"подчинять",
"пустыня" —
"дезертировать" и т. п. Однако имеются языки, в которых слова не различаются местом ударения. Таков, например, французский, все тюркские, финно­угорские и многие дру­
гие языки. Какова же функция ударения в этих языках? Прежде всего, оно объединяет слоги слова вокруг некоторо­
го центра (кульминативная, или вершинообразующая, функ­
ция). Такое объединение слова одновременно позволяет раз­
бивать поток речи на ритмические кванты, задает членение фразы на ритмические группы. Иначе говоря, кульминатив­
ная функция соотнесена с делимитативной (разделительной) функцией. Одновременно ударения задают ритмическую схему предложения, на которой строится ритмическая стру­
ктура следующего иерархического уровня: здесь в соответст­
вии с законами фразовой ритмики словесные ударения ран­
жируются по силе. В языках типа русского и английского ударение совмещает все указанные функции. Что же пред­
ставляет собой ударение с фонетической точки зрения? В общем случае, это некоторая схема, определяющая градации "силы", слогов слова. Один из слогов принимает максимальную степень выделенности, прочие меньшую. Языки имеют неодинаковые схемы рас­
пределения силы на безударных слогах. Так, в русском 310 5.5. Классификация звуковых средств предударный слог в общем случае сильнее прочих безудар­
ных, в других языках следующий по силе слог может зани­
мать другую Условно ритмическая схема описывается по положе­
нию вершины (ударению), но реально ударение является как бы референциальной точкой, относительно которой разво­
рачивается ритмическая схема слова. В русской фонетике внимание на то, что ударение символизирует ритмическую схему, которая разворачивается в слове, впервые обратил внимание известный русский лингвист XIX в. A.A. Какими же фонетическими средствами реализуется ритмическая схема слова? Прежде фонетисты пытались най­
ти некоторый главный фонетический признак, который ле­
жит в основе стратификации слогов слова по выделенности. Однако исследования ударения последних десятилетий за­
ставляют изменить эту установку. Выяснилось, что ритмиче­
ская схема слова представляет собой многослойную структу­
ру, и роль разных компонентов в организации иерархии вы­
деленности может быть различной. На примере ударения особенно ясно видно, что сущность, которая выступает как цельный символический объект в лингвистической системе, может иметь весьма сложное и непостоянное фонетическое строение. Идеи и результаты разных исследований, посвя­
щенных фонетической природе ударения, можно вать следующим образом.
Параметр, определяющий восприятие ударения в ском и английском языках как "экспираторное", — это им­
пульсное увеличение дыхательной активности, которое мо­
жет сопровождаться изменением глоттальной напряженно­
сти. Однако оно необязательно проводит к возрастанию аку­
стической интенсивности. Следующий фактор выделенности — это "тяжесть" сло­
га, которая может выражаться в двух параметрах: длительно­
сти гласного и полноте его артикуляции (в русском эти па­
раметры ясно выражены, тогда как в английском они связа­
ны с сегментными противопоставлениями гласных и играют меньшую роль). Далее, в реализации маркера ударения большую роль может играть взаимодействие с фразовой акцентуацией. акцент обычно размещается на ударном слоге. Поэтому все компоненты фразового выделения (в первую очередь тональный перелом) приходятся на ударный 311 Глава 5. Универсальные фонетические Суммарный эффект в таком случае особенно велик, и удар­
ный слог сильно отличается от безударных. Напротив, в по­
зиции фразового ослабления собственно словесные ритми­
ческие показатели выделения могут быть выражены слабо. Фразовая интонация Универсальным средством фонетического оформления предложения является интонация. Всякое предложение лю­
бого языка имеет просодическую структуру: оно произно­
сится с каким-то меняющимся тональным рисунком, обла­
дает некоторой темповой и громкостной организацией. Три означенные характеристики (тон, темп и громкость) внут­
ренне встроены в речь, мы неизбежно контролируем их ди­
намику во всех произнесениях. Их временная структура оп­
ределяется комбинацией двух факторов: некоторым собст­
венно фонетическим "гештальтом" предложения как мини­
мального коммуникативного кванта и конкретной семанти­
кой данного высказывания. Эти характеристики традицион­
но являются предметом внимания фонетистов. Однако имеется еще одна характеристика, которая присутствует в числе оформителей любого предложения, — это качество голоса (фонация). Правда, в отличие от преды­
дущих трех, она обычно имеет одно и то же нейтральное значение на всем предложении, а ее маркированные значе­
(придыхательный/скрипучий/расслабленный/напря­
женный голос) несут специфическую семантическую инфор­
мацию. Как мы видели выше, предложение может распадаться на более мелкие части — фонетические синтагмы, которые обычно соответствуют его семантико-синтаксическим ком­
понентам. Фонетические синтагмы имеют те же просодиче­
ские характеристики, что и предложение — тональную, тем­
повую, громкостную и фонационную. Значения этих при­
знаков и способы их использования будут рассмотрены в главе 8, посвященной описанию интонации. Интегральные фонетические установки Имеется еще одна группа средств, влияющих на фоне­
тическое оформление речи. В каждом языке обнаруживают­
ся некоторые общие установки произношения, которые 5.6. Универсальная фонетическая транскрипция придают ему специфическую окраску. Фонетисты говорят в таком случае об артикуляционной базе языка. Так, для французского языка, в отличие от испанского, характерна очень четкая артикуляция звуков; во многих диалектах аме­
риканского английского обращает на себя внимание гор­
танная напряженность, сопровождаемая легкой назализа­
цией; некоторым севернорусским диалектам присущ чрез­
вычайно быстрый темп речи. Иногда такие интегральные особенности речи можно объяснить обилием в данном язы­
ке специфических звуков. Так, для агульского языка Даге­
стана характерна особая сиплость голоса, которая обнару­
живается даже у детей. Здесь она объяснима чрезвычайной насыщенностью речи напряженными гортанными соглас­
ными. В большинстве же случаев связь произносительной установки со спецификой фонемного состава языка вы­
явить не удается. К сожалению, фонетика до сих пор не описывает ин­
тегральные особенности артикуляционной базы языков сис­
тематическим образом — все остается на уровне импрессио­
нистических замечаний. Отсутствуют даже перечни призна­
ков для таких исследований. В принципе, к их числу долж­
ны относиться характеристики, описывающие позу языка как целого (более передняя или более типичное по­
ложение губ, вертикальное положение гортани, общую чет­
кость или "смазанность" артикуляции и т. д. 5.6. Универсальная фонетическая транскрипция Транскрипция Международной фонетической ассоциации Изложенная выше классификация звуков и просодиче­
ских средств, встречающихся в языках мира, предопределя­
ет ту систему фонетической записи которая считается стандартом в современной западной лингвистике. Распространением и развитием этого стандарта занимается Международная фонетическая ассоциация (МФА). Она воз-
в прошлом веке и с самого начала ставила своей целью унифицировать запись звучащей речи на основе не­
которой универсальной системы обозначений. Эта система 313 Глава 5. Универсальные фонетические классификации называется Международным фонетическим алфавитом Как видим, аббревиатуры для того и другого совпа­
дают (также и по-английски -
(International Phonetic В 1999 г. МФА опубликовала учеб­
ник для пользователей этой системы транскрипции [Handbook
1999]. Транскрипционная система МФА представляет собой несколько таблиц, содержащих буквы для согласных и глас­
ных, дополнительные знаки (диакритики) для некоторых признаков звуков и знаки для супрасегментных единиц. В таком порядке они и будут рассмотрены ниже. Предполага­
ется, что эта транскрипционная система способна отразить все лингвистически существенные звуковые элементы, встречающиеся в изученных языках мира. К таковым отно­
сятся не только смыслоразличительные характеристики, но также специфические особенности произношения артикуля-
ционно и функционально близких звуков в разных языках. Буквы для согласных Самая большая таблица МФА содержит буквенные знаки для согласных, образующихся путем модуляций выды­
хаемой воздушной струи. Как видим, ее структура икониче-
ски отражает устройство речевого тракта в сагиттальном (продольном) разрезе с левым разворотом головы (табл. 3). По горизонтали помещены места образования (на таблице не удается иконически отразить лишь низкое положение ла-
рингалов), а по вертикали — степени сужения голосового тракта (от смычки до глайда). Такой способ табличного представления инвентаря согласных является стандартом и при описании конкретных языков (см. примеры описаний в гл. 7). Незаполненные клетки таблицы иногда бывают за­
штрихованными, а иногда пустыми. Считается, что в первом случае соответствующие звуки (например, назальный смыч­
ный глоттального ряда) по природе невозможны, тогда как во втором случае они возможны, но отсутствуют в зафикси­
рованных языках, например, латеральные фрикативные па­
латального ряда. Примечательно, что последнее верно, — та­
кие фонемы, как будет показано ниже, имеются в арчин­
ском языке. 314 5.6. Универсальная фонетическая транскрипция Таблица 3 Буквы для основных согласных Базой МФА является латиница, причем иногда исполь­
зуются заглавные буквы. Однако ее знаков далеко не доста­
точно, чтобы отобразить все разнообразие звуков языках мира. Поэтому дополнительно вводится ряд греческих букв и довольно большое количество символов, представляющих собой некоторую модификацию романских литер (см., на­
пример, модификации букв Но существуют еще два способа пополнить запас знаков: первый из них — это ис­
пользование диакритик, помещаемых сверху, снизу или справа от основной буквы, а второй — использование знаков препинания и особых символов. Эти особые способы обо­
значения представлены в таблице согласных, образуемых не на выдохе (табл. 4). Здесь буквы с хвостиком служат для за­
писи имплозивных смычных, запятая справа от буквы сим­
эйективные, а для щелчков использованы небук­
венные 315 Глава 5. Универсальные фонетические классификации Таблица 4 Знаки для согласных, образуемых на выдохе Щелчки Имплозивные Эйективные Билабиальный Дентальный (Пост)альвеолярный Палатоальвеолярный Альвеолярн. латерал Билабиальный Дентальный Палатальный Велярный Увулярный как, например: Билабиальный Альвеолярный Велярный Альвеолярный фрикативный Таблица 5 Другие символы для согласных Глухой билабиальный фрикативный Звонкий лабиовелярный аппроксимант Звонкий лабиопалатальный аппроксимант Н Глухой эпиглоттальный фрикативный Звонкий эпиглоттальный фрикативный Эпиглоттальный взрывной Альвеопалатальные фрикативные 1 Альвеолярный латеральный хлопок Одновременно Аффрикаты и двойные артикуляции могут быть представлены двумя дужкой: Таблица 6 Буквы для гласных Передний Центральный Задний Закрытый Средне-
закрытый Средне-
открытый Открытый \У 316 5.6. Универсальная фонетическая транскрипция Наконец, для некоторых согласных имеется еще табли­
ца под названием "Другие символы". Логика объединения в этой группе очень употребительной фонемы крайне ред­
ких эпиглоттальных смычных и дужки для обозначения аф­
фрикат непонятна. По существу, это неструктурированное собрание совершенно разных по функциям средств записи. Буквы для гласных Транскрипционные знаки для гласных вводятся с по­
мощью весьма специфической таблицы, геометрия которой иконически отражает вокалическое пространство (табл. 6) Имеется также дополнительный способ детализировать пространственное положение гласного — использовать диак­
ритические знаки для указания на то или иное отклонение от кардинального гласного. В частности, продвижение глас­
ного вперед обозначается подстрочным плюсом (и), а сме­
щение назад — минусом Таким способом можно обозна­
чить, например, смещение русского у рядом с мягкими сог­
ласными [и] и русское ы которое не попадает на ось цен­
трального ряда. Диакритики Часть диакритик для согласных и гласных вынесена в особую табл. 7. Их функции очень разнообразны: они могут обозначать смещение артикуляции по горизонтали и верти­
кали, мену фонационного качества, тембровые признаки, слоговость и проч. К сожалению, эта таблица не структури­
рована. единицы Под этой рубрикой объединены знаки для весьма раз­
ных фонетических объектов: ударения, вокалических дол-
гот/краткостей, интонационных границ и тонов (табл. 8). Читателю следует иметь в виду, что эта часть МФА наиболее дискуссионна. Во-первых, долготы гласных чаще являются сегментными, а не просодическими. Во-вторых, из описания интонации здесь представлены лишь то­
ны: они могут противопоставлять как лексические и грамма­
тические значения, будучи характеристикой слога, так и вы-
317 Глава 5. Универсальные фонетические классификации Таблица 8 Знаки для признаков СУПРАСЕГМЕНТНЫЕ ТОНЫ ЕДИНИЦЫ УРОВНЕВЫЕ КОНТУРНЫЕ Главное ударение Побочное ударение Долгий • Полудолгий Сверхкраткий Слоговой разрыв Малая (рит