Гласные твердые и мягкие звонкие и глухие таблица: Таблица гласных и согласных звуков русского языка. Звонкие и глухие согласные звуки
Гласные и согласные звуки и буквы — Гипермаркет знаний. Парные и непарные, звонкие и глухие, мягкие и твердые согласные звуки в русском языке
В русском языке гласных букв – 10, гласных звуков – 6. Гласные буквы: а, и, е, ё, о, у, ы, э, ю, я. Гласные звуки: [а] , [о] , [у] , [э] , [и] , [ы] . В школьной программе гласные звуки обозначаются на схемах красным цветом. В начальных классах объясняют: гласные буквы называются так, потому что они «голосят», произносятся «голосисто», согласные же буквы получили такое название, потому что они «согласуются» с гласными.
Схема 1. Гласные буквы и гласные звуки русского языка.
Ударные и безударные гласные звуки
Гласные звуки бывают:
- ударными: сок [о] – лёд [’о], лес [’э] – мэр [э], бур [у] – люк [’у],
- безударными: во да́ [а], су да́к [у], ле со́к [и].
Примечание. Правильно говорить «ударный слог» и «безударный слог». Вместо «ударение падает на гласную» говорить «ударение падает на слог с гласной». Однако в литературе встречаются формулировки «ударная гласная» и «безударная гласная».
Ударные гласные находятся в сильной позиции, они произносятся с большей силой и интонацией. Безударные гласные находятся в слабой позиции, они произносятся с меньшей силой и могут подвергаться изменению.
Примечание. Обозначение буквы е в слабой позиции отличается в различных школьных программах. Выше мы показали звук [и], в других школьных программах встречается обозначение [э], в институтской программе – [э и ] (э с призвуком и).
Схема 2. Деление гласных на ударные и безударные.
В русском языке есть сложносоставные слова с основным и второстепенным ударением. В них сильной интонацией мы выделяем основное ударение, слабой интонацией – второстепенное. Например, в слове пе́нобло́ки основное ударение падает на слог с буквой о, второстепенное – на слог с буквой е. При фонетическом разборе гласная с основным ударением является ударной, гласная с второстепенным ударением является безударной.
Например: трёхство́рчатый, трёхле́тний.Йотированные гласные звуки
Буквы я, ю, е, ё носят название йотированных и означают два звука в следующих позициях слова:
- в начале слова: ёлка [й”олка], Яна [й”ана], енот [й”инот];
- после гласного: заяц [зай”иц], баян [бай”ан];
- после ь или ъ: ручьи [руч”й”и], подъём [падй”ом].
Для ё и ударных гласных я, ю, е делается замена: я → [й’а], ю → [й’у], е → [й’э], ё → [й’о]. Для безударных гласных используется замена: я → [й”и], е → [й”и]. В некоторых школьных программах при составлении транскрипции слова и при фонетическом разборе вместо й пишут латинскую j.
Да, гласных звуков в русском языке всего шесть: [а], [о], [у], [э], [ы], [и]. На письме эти звуки обозначаются соответствующими буквами, сообразно орфографии.
К сожалению, иногда называют звуками буквы – йотированные гласные. Это ошибка. Гласные буквы «я», «е», «ё», «ю» в словах обозначают либо мягкость предыдущего согласного («мед»), либо сразу два звука («юла» [йула], маяк [майак].
Конечно, если посмотреть шире, то можно заметить, что, например, звук [а] не одинаков в разных частях слова. Под ударением он максимально четко, но чем дальше его позиция от ударной, тем он менее четкий. В это называется редукцией или редуцированием.
При звуковом анализе слов, при записи транскрипции для ударных и безударных звуков употребляются разные значки. Но в рамках школьного курса достаточно знать, что гласных звуков в русском языке всего шесть.
Согласные звуки и согласные буквы
С звуками и буквами несколько проще. Хотя тоже есть свои особенности.
Букв, как было уже сказано, 21. А согласных звуков – 37. В русском языке различаются по твердости-мягкости и по звонкости-глухости.
Большинство согласных звуков являются парными по твердости-мягкости. Это [[б] – [б”]; [в] – [в”]; [г] – [г”]; [д] – [д”]; [з] – [з”]; [к] – [к”]; [л] – [л”]; [м] – [м”]; [н] – [н”]; [п] – [п”]; [р] – [р”]; [с] – [с”]; [т] – [т”]; [ф] – [ф”]; [х] – [х”]. Всего 15 пар.
Остальные согласные имеют либо всегда твердое ([ж], [ш], [ц]), либо мягкое ([й”], [ч”], [щ”]). Итого, получается 36 согласных звуков. На особицу стоит 37-й согласный звук [ж’:].Согласный звук [ж’:] – мягкий, долгий. Он используется значительно реже других согласных звуков. Встречается он в таких словах, как «вожжи», «дрожжи», а также при произношении слова «дождь»: [дож’:]
По звонкости-глухости большинство согласных звуков также являются парными. Таких пар 11. Всегда звонкие, соответственно, непарные: [й’], [л], [л’], [м], [м’], [н], [н’], [р], [р’], [ж’:]. Всегда : [х], [х’], [ц], [ч’], [щ’].
Итого, в русском языке 37 согласных звуков, 6 гласных. А всего – 43 звука.
15. звуковье
16. звуковия
17. звуковья
18. аналуза
19. аналуз
Ударение представляет собой выделение интонацией отдельного слова в слове. При этом в русском языке ударение может падать на любой слог. А существуют ли гласные, которые обязательно являются ударными?
Ударение – это особый способ выделения слога в слове, осуществляемый при помощи интонации. Фактически ударение служит дополнительным средством смысловой идентификации слова: ведь некоторые слова в русском языке совершенно идентичны при написании, и только ударение отличает их друг от друга. Например, если в слове «мука» на первый слог, оно будет означать продукт, используемый для выпечки, а если на второй – страдания, которые испытывает живое существо.
Варианты постановки ударения
В некоторых языках мира вопрос постановки ударения решается достаточно просто: существует определенный стандарт, под который подпадают все или большинство слов в этом языке. Такая ситуация наблюдается, например, во французском языке, где во всех словах ударение ставится на последний слог. В русском языке подобное стандартное правило отсутствует: ударение может падать на любой слог в слове, при этом в зависимости от формы конкретного постановки ударения может меняться. Так, например, ударение в слове «взять» при его будет зависеть от рода: в мужском роде форма «взял» будет иметь ударение на букву «я», а в женском форма « » требует постановки ударения на букву «а». Поэтому в русском языке прежде, чем прочитать незнакомое слово, следует уточнить в авторитетных источниках, например, специальных словарях, на какой слог в этом слове ставится ударение.
Ударные гласные
Несмотря на все разнообразие правил в русских словах, существует гласная буква, которая всегда находится под ударением. Речь идет «ё». Поэтому если вы видите незнакомое слово, в котором присутствует эта буква, можете смело читать его, ставя ударение на «ё» – скорее всего, вы не ошибетесь. Кроме того, это факт является причиной того, что знак ударения над буквой «ё» чаще всего не ставится. Тем не менее, это правило, как и большинство грамматических правил в русском языке, имеет несколько важных исключений. Первое из них связано с использованием иностранных слов, которые в свое время были заимствованы и внедрены в русский язык. Примером такого слова может быть «амёбиаз» – здесь ударной является вторая буква «а», как и в большинстве подобных конструкций в русском языке, обозначающих заболевания.
Второе исключение из этого правила составляют сложные слова, имеющие два и более корней, например, «трёхъярусный»: в этом слове ударной будет буква «я».Связанная статья
Источники:
- Ударение
Количество слов в русском и любом другом языке подсчитать довольно сложно, поскольку эта величина не является постоянной. Какие-то слова устаревают и забываются, одновременно с этим возникают и занимают свое место в языке новые слова.
Инструкция
Из-за сложностей с определением методики подсчета вопрос о точном количестве слов в остается открытым. Эта тема постоянно обсуждается не только в рамках академической науки, но и вне ее на страницах массовых периодических изданий, в телепередачах и в интернет-пространстве. Называя количество слов в том или ином языке, традиционно ссылаются на какой-либо достаточно авторитетный . Для русского языка таким изданием является «Большой академический
В русском языке 21 согласная буква и 36 согласных звуков.
Согласные буквы и соответствующие им согласные звуки:б – [б], в – [в], г – [г], д – [д], ж – [ж], й – [й], з – [з], к – [к], л – [л], м – [м], н – [н], п – [п], р – [р], с – [с], т – [т], ф – [ф], х – [х], ц – [ц], ч – [ч], ш – [ш], щ – [щ].
Согласные звуки делятся на звонкие и глухие, твёрдые и мягкие. Они бывают парные и непарные. Всего 36 различных комбинаций согласных по парности-непарности твёрдых и мягких, глухих и звонких: глухих – 16 (8 мягких и 8 твёрдых), звонких – 20 (10 мягких и 10 твёрдых).
Схема 1. Согласные буквы и согласные звуки русского языка.
Твёрдые и мягкие согласные звуки
Согласные бывают твёрдыми и мягкими. Они делятся на парные и непарные. Парные твёрдые и парные мягкие согласные помогают нам различать слова. Сравните: конь [кон’] – кон [кон], лук [лук] – люк [л’ук].
Для понимания объясним «на пальцах». Если согласная буква в разных словах означает либо мягкий, либо твёрдый звук, то звук относится к парным. Например, в слове кот буква к обозначает твёрдый звук [к], в слове кит буква к обозначает мягкий звук [к’]. Получаем: [к]-[к’] образуют пару по твёрдости-мягкости. Нельзя относить к паре звуки для разных согласных, например [в] и [к’] не составляют пару по твёрдости-мягкости, но составляет пара [в]-[в’]. Если согласный звук всегда твёрдый либо всегда мягкий, то он относится к непарным согласным. Например, звук [ж] всегда твёрдый. В русском языке нет слов, где бы он был мягким [ж’]. Так как не бывает пары [ж]-[ж’], то он относится к непарным.
Звонкие и глухие согласные звуки
Согласные звуки бывают звонкие и глухие. Благодаря звонким и глухим согласным мы различаем слова. Сравните: шар – жар, кол – гол, дом – том. Глухие согласные произносятся почти с прикрытым ртом, при их произнесении голосовые связки не работают. Для звонких согласных нужно больше воздуха, работают голосовые связки.
Некоторые согласные звуки имеют схожее звучание по способу произношения, но произносятся с разной тональностью – глухо или звонко. Такие звуки объединяются в пары и образуют группу парных согласных.
- парные согласные: б-п, в-ф, г-к, д-т, з-с, ж-ш.
- непарные согласные: л, м, н, р, й, ц, х, ч, щ.
Сонорные, шумные и шипящие согласные
Сонорные — звонкие непарные согласные звуки. Сонорных звуков 9: [й’], [л], [л’], [м], [м’], [н], [н’], [р], [р’].
Шумные согласные звуки бывают звонкие и глухие:
- Шумные глухие согласные звуки (16): [к], [к”], [п], [п”], [с], [с”], [т], [т”], [ф], [ф”], [х], [х’], [ц], [ч’], [ш], [щ’];
- Шумные звонкие согласные звуки (11): [б], [б’], [в], [в’], [г], [г’], [д], [д’], [ж], [з], [з’].
Шипящие согласные звуки (4): [ж], [ч’], [ш], [щ’].
Парные и непарные согласные звуки
Согласные звуки (мягкие и твёрдые, глухие и звонкие) делятся на парные и непарные. Выше в таблицах показано деление. Обобщим всё схемой:
Схема 2. Парные и непарные согласные звуки.
Чтобы уметь делать фонетический разбор, помимо согласных звуков нужно знать
Звуком называется мельчайшая единица языка, произносимая с помощью органов речевого аппарата. Ученые обнаружили, что при рождении человеческий слух воспринимает все звуки, которые слышит. Все это время его мозг отсортировывает ненужную информацию, и уже к 8-10 месяцам человек способен различать звуки, присущие исключительно родному языку, и все нюансы произношения.
33 буквы составляют русский алфавит, 21 из них являются согласными, однако следует отличать буквы от звуков. Буквой является знак, символ, который можно увидеть или написать. Звук можно только услышать и произнести, а на письме – обозначить с помощью транскрипции – [б], [в], [г]. Они несут в себе определенную смысловую нагрузку, соединяясь между собой, образуют слова.
36 согласных звуков: [б], [з], [в], [д], [г], [ж], [м], [н], [к], [л], [т], [п], [т], [с], [щ], [ф], [ц], [ш], [х], [ч], [б”], [з”], [в”], [д”], [й”], [н”], [к”], [м”], [л”], [т”], [с”], [п”], [р”], [ф”], [г”], [х”].
Согласные звуки делятся на:
- мягкие и твердые;
звонкие и глухие;
парные и непарные.
Мягкие и твердые согласные звуки
Фонетика русского языка имеет существенное отличие от многих других языков. Она содержит твердые и мягкие согласные.
В момент произношения мягкого звука язык сильнее прижимается к небу, чем при произнесении твердого согласного звука, препятствуя высвобождению воздуха. Этим и отличается друг от друга твердый и мягкий согласный звук. Для того чтобы на письме определить, относится ли согласный звук к мягким или твердым, следует посмотреть на букву, стоящую сразу после конкретной согласной.
Согласные звуки относят к твердым в таких случаях:
- если буквы а, о, у, э, ы следуют после них – [мак], [ром], [гул], [сок], [бык];
- после них стоит другой согласный звук – [ворс], [град], [брак];
- если звук стоит в конце слова – [мрак], [друг], [стол].
Мягкость звука записывается в виде апострофа: моль – [мол’], мел – [м’эл], калитка – [кал’итка], пир – [п’ир].
Следует отметить, что звуки [щ’], [й’], [ч’] всегда мягкие, и твердые согласные – только [ш], [ц], [ж].
Согласный звук станем мягким, если после него стоит “ь” и гласные: я, ё, ю, и, е. Например: ген – [г”эн], лён – [л”он], диск – [д”ыск], люк – [л”ук], вяз – [в”яз], трель – [тр”эл”].
Звонкие и глухие, парные и непарные звуки
По звонкости согласные разделяют на звонкие и глухие. Звонкими согласными могут быть звуки, создаваемые с участием голоса: [в], [з], [ж], [б], [г], [й], [м], [д], [л], [р], [н].
Примеры: [бор], [вол], [душ], [зов], [жар], [гол], [лов], [мор], [нос], [род], [рой].
Примеры: [кол], [пол], [том], [сон], [шум], [щ”ука], [хор], [цар”], [ч”ан].
К парным звонким и глухим согласным относятся: [б] – [п], [ж] – [ш] , [г] – [х], [з] – [с]. [д] – [т], [в] – [ф]. Примеры: быль – пыль, дом – том, год – код, ваза – фаза, зуд – суд, жить – шить.
Звуки, не образующие пары: [ч], [н], [ц], [х], [р], [м], [л].
Мягкие и твердые согласные тоже могут иметь пару: [р] – [р”], [п] – [п”], [м] – [м”], [в] – [в”], [д] – [д”], [ф] – [ф”], [к] – [к”], [з] – [з”], [б] – [б”], [г] – [г”], [н] – [н”], [с] – [с”], [л] – [л”], [т] – [т”], [х] – [х”]. Примеры: быль – бель, высь – ветвь, город – гепард, дача – дело, зонт – зебра, кожа – кедр, луна – лето, монстр – место, палец – перо, руда – река, сода – сера, столб – степь, фонарь – ферма, хоромы – хижина.
Таблица для запоминания согласных звуков
Чтобы наглядно увидеть и сравнить мягкие и твердые согласные, таблица, приведенная ниже, их показывает попарно.
Твердые – перед буквами А, О, У, Ы, Э Мягкие – перед буквами И, Е, Ё, Ю, Я | Твердые и мягкие согласные | |||
б | бал | б” | битва | |
в | вой | в” | веко | |
г | гараж | г” | герой | |
д | дыра | д” | дёготь | |
з | зола | з” | зевок | |
к | кум | к” | кеды | |
л | лоза | л” | листва | |
м | март | м” | месяц | |
н | нога | н” | нежность | |
п | паук | п” | песня | |
р | рост | р” | ревень | |
с | соль | с” | сено | |
т | туча | т” | терпение | |
ф | фосфор | ф” | фирма | |
х | худоба | х” | химия | |
Непарные | ж | жираф | ч | чудо |
ш | ширма | щ | лещина | |
ц | цель | й | войлок |
Запомнить согласные звуки поможет и другая таблица.
Парные | Звонкие | Глухие |
Б | П | |
В | Ф | |
Г | К | |
Д | Т | |
Ж | Ш | |
З | С | |
Непарные | Л, М, Н, Р, Й | Х, Ц, Ч, Щ |
Детские стихи для лучшего освоения материала
Буквы ровно 33 в русском алфавите,
Чтоб узнать, сколько согласных –
Десять гласных отнимите,
Знаки – твердый, мягкий –
Сразу станет ясно:
Получается число ровно двадцать одно.
Мягкие и твердые согласные бывают очень разные,
Но вовсе не опасные.
Если произносим с шумом, то они глухие.
Звуки согласные гордо говорят:
Они по-разному звучат.
Твердые и мягкие
На деле очень легкие.
Одно простое правило запомни навсегда:
Ш, Ц, Ж – тверды всегда,
А вот Ч, Щ, Й – только мягки,
Как кошачьи лапки.
А другие смягчим так:
Если добавим мягкий знак,
Тогда получим ель, моль, соль,
Какой же хитрый знак такой!
А если мы добавим гласные И, Я, Ё, Е, Ю,
Получим мягкую согласную.
Знаки-братья, мягкий, твердый,
Мы не произносим,
Но чтоб слово изменить,
Их помощи попросим.
Всадник скачет на коне,
Кон – используем в игре.
Что такое звук? Это минимальная составляющая человеческой речи. Изображается буквами. В письменной форме звуки от букв отличаются наличием у первых квадратных скобок , использующихся в фонетической транскрипции. Буква – о, звук – [о]. Транскрипция показывает различия написания и произношения. Апостроф [ ‘ ] свидетельствует о мягкости произношения.
Вконтакте
Звуки разделены на:
- Гласные. Их можно легко тянуть. При их создании язык не принимает активного участия, фиксируясь в одном положении. Звучание создается благодаря изменениям положения языка, губ, различным вибрациям голосовых связок и силе подачи воздуха. Протяжность гласных – основа вокального искусства (распевания, «пения гладью»).
- Согласные звуки а выговариваются с участием языка, который, занимая определенное положение и форму, создает препятствие движению воздуха из легких. Это приводит к появлению шумов в полости рта. На выходе они преобразуется в звучание. Также свободному прохождению воздуха препятствуют губы, которые смыкаются-размыкаются во время речи.
Согласные разделяют на:
- глухие и звонкие. Глухость и звонкость звучания зависит от работы речевого аппарата;
- твердые и мягкие. Звучание определяется положением буквы в слове.
Буквы, обозначающие согласные звуки
Глухие
Глухие в русском: [к], [п], [с], [т], [ф], [х], [ц], [ш]. Проще всего запомнить фразу, а не набор букв, «Стёпка, хочешь щец? Фи!», содержащую их все.
Пример, в котором все согласные звуки глухие: петух, соты, штифт.
Звонкие
При их образовании форма языка близка к форме, производящей глухие, но добавляются вибрации. Звонкие согласные звуки создают активные вибрации связок. Вибрации деформируют звуковую волну , и в полость рта попадает не чистый поток воздуха, а звучание. В дальнейшем он дополнительно преобразовывается языком и губами.
К звонким согласным принадлежат: б, в, г, д, ж, з, й, л, м, н, р.
При их произношении в области гортани явно чувствуется напряжение. Кроме того, проговорить их четко шепотом практически невозможно.
Слово, в котором все согласные звуки звонкие: Рим, гордыня, зола, лиман.
Сводная таблица согласных (глухие и звонкие).
Именно за счет смены звучания русская речь обогащена различными словами, близкими по написанию и произношению, но абсолютно разными по значению . К примеру: дом – том, суд – зуд, код – год.
Парные согласные
Что означает парность ? Две буквы, близкие по звучанию, при произношении которых язык занимает схожие положения, называют парные согласные звуки. Произношение согласных можно условно разделить на одноэтапные (в их создании участвуют губы и языки) и двуэтапные – первыми подключаются связки, затем рот. Те случаи, когда при произношении движения рта совпадают, и создают пары.
Сводная таблица парных согласных с учетом твердости и мягкости
В речи свойственно не выговаривать каждую букву, а «съедать» ее. Это не является исключением только русской речи. Подобное встречается практически во всех языках мира и особо контрастно заметно в английском. В русском этот эффект подвластен правилу: парные согласные звуки подменяют (на слух) друг друга во время речи. К примеру: любовь – [л’ у б о ф’].
Но не все имеют свою пару. Есть не похожие по произношению ни на какие другие – это непарные согласные . Техника воспроизведения отличается от произношения прочих звуков и объединяет их в группы.
Парные согласные
Непарные согласные
Первая группа может произноситься с мягкостью. Вторая не имеет аналогов в произношении.
Непарные согласные разделяются на:
- соноры – [й’], [л], [л’], [м], [м’], [н], [н’], [р], [р’]. При их произношении поток воздуха ударяется о верхнее небо, как о купол;
- шипящие – [х], [х’], [ц], [ч’], [щ’].
Русского языка содержит буквы, которые в контексте сложны для восприятия. Звуки [ч], [й], [ц], [н] звонкие или глухие? Выучите эти 4 буквы!
Важно! [ч] – глухой! [й] – звонкий! [ц] – это глухой! [н] – звонкий!
Непарные согласные
Твердые и мягкие
Они одинаковы по написанию, но различны по звучанию. Глухие и звонкие согласные, за исключением шипящих, могут произноситься твердо или мягко. Например: [ б ] был – [ б` ] бил; [ т ] ток – [ т` ] тёк.
При произношении твердых к небу прижимается кончик языка. Мягкие образуются благодаря прижатию к верхнему небу средней части языка .
В речи звучание определяет последующая за согласным буква.
Гласные образуют пары: а-я, у-ю, э-е, ы-и, о-ё.
Двузвучные гласные (я, ё, ю, е) произносятся по одной из двух комбинаций: звук [й] и парная гласная из Э, О, У, А либо мягкий знак и парная гласная. К примеру, слово юнга. Оно произносится как [й] [у] [н] [г] [а]. Или слово мята. Оно произносится как: [м’] [а] [т] [а]. Гласные А, О, У, Э, Ы не имеют двойного звучания, поэтому не влияют на произношение впереди стоящей согласной .
Пример различия:
Ложка – люк, мед – море, дом – дятел.
Фонетическая транскрипция:
[Л о ж к а] – [Л’ у к], [м’ о д ] – [м о р’ э], [д о м] – [д’ а т е л].
Правила произношения:
- твердые произносятся перед А, О, У, Э, Ы. Нарыв, бок, бук, бэнтли, былое;
- мягкие произносятся перед Я, Ё, Ю, Е, И. Месть, мёд, кит, пюре, мята;
- твердые произносятся, если после них стоит другая согласная: смерть. После согласного [с] стоит согласная [м]. Не зависимо от того, мягкая М, звонкая или твердая, С произносится твердо;
- твердые произносятся, если буква стоит последней в слове : класс, дом;
- согласные перед гласной [е] в заимствованных словах произносятся твердо, как перед [э]. Например: кашне – [к] [а] [ш] [н] [э];
- всегда мягкие перед Ь: лось, мякоть.
- исключения из правил:
- всегда твердые Ж, Ш, Ц: жизнь, шипы, цианид;
- всегда мягкие Й, Ч, Щ: белый, черный, щука.
Фонетика и теория речеобразования
Фонетика и теория речеобразованияПредыдущий / Следующий / Индекс
3. Фонетика и теория речеобразования
Обработка речи и языковые технологии содержат множество специальных понятий и терминов. Чтобы понять, как работают различные методы синтеза и анализа речи, мы должны иметь некоторые знания о речеобразовании, артикуляционной фонетике и некоторой другой связанной терминологии. Основная теория этих тем будет кратко рассмотрена в этой главе. Для получения более подробной информации см., например, Fant (1970), Фланаган (1972), Виттен (1982), О’Сонесси (1987) или Клейн и др. (1998).
3.1 Представление и анализ речевых сигналов
Непрерывная речь представляет собой набор сложных звуковых сигналов, создание которых искусственно затруднительно. Речевые сигналы обычно считаются вокализованными или невокализованными, но в некоторых случаях они представляют собой нечто среднее между этими двумя. Звонкие звуки состоят из основной частоты (F0) и ее гармонических составляющих, производимых голосовыми связками (голосовыми связками). Речевой тракт модифицирует этот сигнал возбуждения, вызывая формантные (полюсные) и иногда антиформантные (нулевые) частоты (Witten 19).82). Каждая формантная частота также имеет амплитуду и ширину полосы, и иногда бывает сложно правильно определить некоторые из этих параметров. Основная частота и формантные частоты, вероятно, являются наиболее важными понятиями в синтезе речи, а также в обработке речи в целом.
При чисто глухих звуках в сигнале возбуждения нет основной частоты и, следовательно, гармонической структуры, и возбуждение можно рассматривать как белый шум. Воздушный поток проходит через сужение голосового тракта, которое может возникать в нескольких местах между голосовой щелью и ртом. Некоторые звуки воспроизводятся при полной остановке воздушного потока с последующим внезапным выпуском, что приводит к импульсивному турбулентному возбуждению, за которым часто следует более продолжительное турбулентное возбуждение (Kleijn et al. 19).98). Невокализованные звуки также обычно более тихие и менее устойчивые, чем звонкие. Различия между ними легко увидеть на рис. 3.2, где второй и последний звуки звонкие, а остальные глухие. Шепот – это частный случай речи. При шепоте звонких звуков в возбуждении отсутствует основная частота и воспринимаются первые формантные частоты, вырабатываемые речевым трактом.
Речевые сигналы трех гласных (/a/, /i/, /u/) представлены во временной и частотной областях на рис. 3.1. Основная частота во всех случаях составляет около 100 Гц, а формантные частоты F1, F2 и F3 с гласной /a/ составляют примерно 600 Гц, 1000 Гц и 2500 Гц соответственно. С гласной /i/ первые три форманты составляют 200 Гц, 2300 Гц и 3000 Гц, а с /u/ 300 Гц, 600 Гц и 2300 Гц. Гармоническая структура возбуждения также легко воспринимается из представления в частотной области.
Рис. 3.1. Представление гласных /a/, /i/ и /u/ во временной и частотной областях.
Видно, что первые три форманты находятся внутри обычного телефонного канала (от 300 Гц до 3400 Гц), поэтому необходимая полоса пропускания для разборчивой речи не очень широка. Для более высокого качества может использоваться полоса пропускания до 10 кГц, что приводит к частоте дискретизации 20 кГц. Если основная частота не находится за пределами телефонного канала, слуховой аппарат человека способен реконструировать ее по гармоническим составляющим.
Другим широко используемым методом описания речевого сигнала является спектрограмма , представляющая собой частотно-амплитудное представление сигнала. Спектрограмма и форма сигнала во временной области финского слова какси (два) представлены на рис. 3.2. Более высокие амплитуды представлены более темными уровнями серого, поэтому формантные частоты и траектории легко воспринимаются. Также легко понять спектральные различия между гласными и согласными. Поэтому спектрограмма является, пожалуй, самым полезным представлением для исследования речи. Из рисунка 3.2 легко увидеть, что гласные обладают большей энергией и она сосредоточена на более низких частотах. Глухие согласные обладают значительно меньшей энергией и обычно сосредоточены на более высоких частотах. Со звонкими согласными ситуация нечто среднее между этими двумя. На рис. 3.2 ось частот указана в килогерцах, но также довольно часто используется слуховая спектрограмма, где ось частот заменена шкалой Барка или Мела, нормализованной для слуховых свойств.
Рис. 3.2. Спектрограмма и представление во временной области финского слова какси (два).
Для определения основной частоты или высоты тона речи может использоваться, например, метод, называемый кепстральным анализом (Cawley 1996, Kleijn et al. 1998). Кепстр получается путем сначала обработки окна и выполнения дискретного преобразования Фурье (DFT) для сигнала, а затем логарифмирования спектра мощности и, наконец, преобразования его обратно во временную область с помощью обратного дискретного преобразования Фурье (IDFT). Процедура показана на рисунке 3.3.
Рис. 3.3. Кепстральный анализ.
Кепстральный анализ позволяет отделить информацию голосового тракта от возбуждения. Таким образом, может быть выполнено обратное преобразование для обеспечения более гладкого спектра мощности, известного как гомоморфная фильтрация.
Основная частота или интонационный контур предложения важны для правильной просодии и естественного звучания речи. Различные контуры обычно анализируются из естественной речи в определенных ситуациях и с конкретными характеристиками говорящего, а затем применяются к правилам для создания синтетической речи. Контур основной частоты можно рассматривать как составной набор иерархических шаблонов, показанных на рисунке 3.4. Общий контур создается наложением этих узоров (Сагисага 19).90). Методы управления контурами основной частоты описаны далее в главе 5.
Рис. 3.4. Иерархические уровни основной частоты (Сагисага, 1990).
3.2 Производство речи
Человеческая речь производится голосовыми органами, представленными на рис. 3.5. Основным источником энергии являются легкие с диафрагмой. При разговоре поток воздуха нагнетается через голосовую щель между голосовыми связками и гортанью к трем основным полостям голосового тракта, глотке, ротовой и носовой полостям. Из ротовой и носовой полостей поток воздуха выходит через нос и рот соответственно. V-образное отверстие между голосовыми связками, называемое голосовой щелью, является наиболее важным источником звука в голосовой системе. Во время речи голосовые связки могут действовать по-разному. Наиболее важной функцией является модулирование воздушного потока путем быстрого открытия и закрытия, вызывая жужжание, из которого образуются гласные и звонкие согласные. Основная частота вибрации зависит от массы и напряжения и составляет около 110 Гц, 200 Гц и 300 Гц у мужчин, женщин и детей соответственно. Со смычными согласными голосовые связки могут резко переходить из полностью закрытого положения, в котором они полностью перекрывают поток воздуха, в полностью открытое положение, вызывающее легкий кашель или гортанную остановку. С другой стороны, с глухими согласными, такими как /s/ или /f/, они могут быть полностью открытыми. Промежуточное положение также может встречаться, например, в таких фонемах, как /h/.
Рис. 3.5. Голосовые органы человека. (1) Полость носа, (2) Твердое небо, (3) Альвеоральный гребень, (4) Мягкое небо (Velum), (5) Кончик языка (Apex), (6) Спинка, (7) Язычок, (8) ) Корень, (9) Глотка, (10) Надгортанник, (11) Ложные голосовые связки, (12) Голосовые связки, (13) Гортань, (14) Пищевод, (15) Трахея.
Глотка соединяет гортань с полостью рта. Он имеет почти фиксированные размеры, но его длину можно немного изменить, поднимая или опуская гортань на одном конце и мягкое небо на другом конце. Мягкое небо также изолирует или соединяет путь из полости носа в глотку. На дне глотки находятся надгортанник и ложные голосовые связки, препятствующие попаданию пищи в гортань и акустически изолирующие пищевод от голосового тракта. Надгортанник, ложные голосовые связки и голосовые связки смыкаются при глотании и размыкаются при нормальном дыхании.
Полость рта является одним из важнейших отделов голосового тракта. Его размер, форма и акустика могут варьироваться движениями неба, языка, губ, щек и зубов. В частности, язык очень гибкий, его кончик и края могут двигаться независимо друг от друга, а весь язык может двигаться вперед, назад, вверх и вниз. Губы определяют размер и форму ротового отверстия, через которое излучается звук речи. В отличие от полости рта носовая полость имеет фиксированные размеры и форму. Его длина составляет около 12 см, а объем 60 см 9 .0067 3 . Поток воздуха в носовую полость контролируется мягким небом.
С технической точки зрения голосовую систему можно рассматривать как единую слуховую трубку между голосовой щелью и ртом. Голосовой тракт, возбужденный голосовой щелью, можно представить в виде прямой трубы, закрытой на уровне голосовых связок, где акустический импеданс Z g = и открытой во рту (Z m = 0). В этом случае передаточная функция громкости-скорости голосового тракта (Flanagan 1972, O’Saughnessy 19).87)
,
(3.1), где l — длина трубы, w — частота в радианах, а c — скорость звука. Знаменатель равен нулю на частотах F i = w i /2p (i=1,2,3,…), где
,
и , (3.2)Если l = 17 см, V(w ) бесконечно на частотах F i = 500, 1500, 2500,… Гц, что означает резонансы через каждые 1 кГц, начиная с 500 Гц. Если длина l отличается от 17 см, частоты F i будут масштабироваться с коэффициентом 17/l , поэтому голосовой тракт можно аппроксимировать двумя или тремя секциями трубки, где площади соседних секций сильно различаются. и резонансы могут быть связаны внутри отдельных полостей. Гласные можно аппроксимировать моделью с двумя трубками, представленной слева на рис. 3.6. Например, с гласной /а/ более узкая трубка представляет собой глотку, открывающуюся в более широкую трубку, представляющую ротовую полость. Если предположить, что обе трубки имеют одинаковую длину 8,5 см, форманты встречаются с вдвое большей частотой, чем отмеченная ранее для одной трубки. Из-за акустической связи форманты не приближаются друг к другу менее чем на 200 Гц, поэтому форманты F1 и F2 для /a/ не обе имеют частоту 1000 Гц, а скорее 900 Гц и 1100 Гц соответственно (О’Сонесси, 1987).
Рис. 3.6. Примеры двух- и трехтрубных моделей голосового тракта.
Согласные можно аппроксимировать аналогичным образом с помощью модели с тремя трубками, показанной справа на рис. 3.5., где узкая средняя трубка моделирует сужение голосового тракта. Задняя и средняя лампы представляют собой полуволновые резонаторы, а передняя труба представляет собой четвертьволновой резонатор с резонансами
.,
для i = 1, 2, 3,… (3.3), где l b , l c и l f — длина задней, центральной и передней трубы соответственно. При типичной длине сужения 3 см резонансы возникают на частотах, кратных 5333 Гц, и ими можно пренебречь в приложениях, использующих полосу пропускания менее 5 кГц (O’Saughnessy 1987).
Сигнал возбуждения можно смоделировать с помощью двухмассовой модели голосовых связок, состоящей из двух масс, соединенных пружиной и соединенных с гортанью струнами и демпферами (Fant 1970, Veldhuis et al. 1995).
Несколько других методов и систем были разработаны для моделирования системы производства человеческой речи для создания синтетической речи. Эти методы связаны с артикуляционным синтезом, описанным в главе 5. Система производства речи, модели и теория более подробно описаны у Фанта (1970), Фланагана (1972), Виттена (1982) и О’Сонесси (1987).
3.3 Фонетика
В большинстве языков письменный текст не соответствует своему произношению, поэтому для описания правильного произношения необходимо какое-то символическое представление. Каждый язык имеет свой фонетический алфавит и различный набор возможных фонем и их комбинаций. Количество фонетических символов в каждом языке составляет от 20 до 60 (О’Сонесси 19).87). Набор фонем можно определить как минимальное количество символов, необходимых для описания каждого возможного слова в языке. В английском языке насчитывается около 40 фонем (Брин и др., 1996; Донован, 1996). Из-за сложности и различного рода определений количество фонем в английском и большинстве других языков не может быть точно определено.
Фонемы являются абстрактными единицами, и их произношение зависит от контекстуальных эффектов, характеристик говорящего и эмоций. При продолжительной речи артикуляционные движения зависят от предшествующей и последующей фонем. Артикуляторы находятся в разном положении в зависимости от предыдущей и заранее готовятся к следующей фонеме. Это вызывает некоторые различия в том, как произносится отдельная фонема. Эти вариации называются аллофонами, которые являются подмножеством фонем, а эффект известен как коартикуляция. Например, слово вши содержит светлый /l/ и маленький содержит темный /l/. Эти l — одна и та же фонема, но разные аллофоны и разные конфигурации голосового тракта. Другая причина, по которой фонетическое представление не является совершенным, заключается в том, что речевой сигнал всегда непрерывен, а фонетическая запись всегда дискретна (Witten 1982). Различные эмоции и характеристики говорящего также невозможно описать с помощью фонем, поэтому единицу, называемую телефоном, обычно определяют как акустическую реализацию фонемы (Донован 19).96).
Фонетический алфавит обычно делится на две основные категории: гласные и согласные. Гласные всегда являются звонкими звуками и воспроизводятся голосовыми связками при вибрации, в то время как согласные могут быть как звонкими, так и глухими. Гласные имеют значительно большую амплитуду, чем согласные, они также более стабильны и их легче анализировать и акустически описывать. Поскольку согласные изменяются очень быстро, их труднее правильно синтезировать. Артикуляционная фонетика в английском и финском языках более подробно описана в конце этой главы.
Некоторые попытки построить фонематические алфавиты, независимые от языка, были предприняты в последние десятилетия. Одним из самых известных является, пожалуй, IPA (Международный фонетический алфавит), который состоит из огромного набора символов для фонем, надсегментов, контуров тонов/словных акцентов и диакритических знаков. Например, существует более двадцати символов только для фрикативных согласных (IPA 1998). Сложность и использование греческих символов делает алфавит IPA совершенно непригодным для компьютеров, которые обычно требуют ввода стандартного ASCII. Другим таким фонетическим набором является SAMPA (методы оценки речи – фонетический алфавит), который предназначен для преобразования символов IPA в 7-битные печатные символы ASCII. В системе SAMPA алфавиты для каждого языка разрабатываются индивидуально. Первоначально он охватывал языки Европейского сообщества, но цель состоит в том, чтобы сделать возможным создание машиночитаемой фонетической транскрипции для каждого известного человеческого языка. Алфавит, известный как Worldbet, представляет собой еще одно представление ASCII для символов IPA, очень похожее на SAMPA (Altosaar et al. 19).96). Американские лингвисты разработали алфавит фонем Арпабета для представления фонем американского английского с использованием обычных символов ASCII. Например, фонетическое представление в системе DECtalk основано на IPA и Arpabet с некоторыми модификациями и дополнительными символами (Hallahan 1996). Несколько примеров различных фонетических обозначений приведены в таблице 3.1.
Таблица 3. 1. Примеры различных фонетических обозначений.
В существующих системах используются несколько других фонетических представлений и алфавитов. Например, MITalk использует набор почти из 60 двухсимвольных символов для описания фонетических сегментов в нем (Аллен и др. 19).87), и довольно часто системы синтеза используют собственный алфавит. Единого общепринятого фонетического алфавита до сих пор нет.
3.3.1 Артикуляционная фонетика английского языка
В отличие от финской артикуляционной фонетики, обсуждаемой в следующей главе, количество фонетических символов, используемых в английском языке, варьируется в зависимости от различных определений. Обычно имеется от десяти до пятнадцати гласных и от двадцати до двадцати пяти согласных.
Английские гласные можно классифицировать по способу или месту артикуляции (спереди-назад) и по форме рта (открыто-закрыто). Основные гласные в английском языке и их классификация описаны на рисунке 3. 7 ниже. Иногда также некоторые дифтонги, такие как /ou/ в тон или /ei/ в дубль описываются отдельно. Другие версии определений английских гласных можно найти, например, у Россинга (1990) и О’Сонесси (1987).
Рис. 3.7. Классификация основных гласных в английском языке (Cawley 1996).
Английские согласные по способу артикуляции можно разделить на взрывные, фрикативные, носовые, плавные и полугласные (Cawley 1990, O’Saughnessy 1987). Взрывные согласные известны также как смычные согласные. Жидкости и полугласные также определяются в некоторых публикациях как аппроксиманты и латерали. Дальнейшая классификация может быть сделана по месту сочленения на губные (губы), дентальные (зубы), альвеолярные (десны), небные (небо), велярные (мягкое небо), голосовые (голотта) и губно-зубные (губы и зубы). Классификация английских согласных представлена на рис. 3.8.
Рис. 3.8. Классификация английских согласных (Cawley 1996).
Наконец, согласные можно разделить на звонкие и глухие. Звонкие согласные:
других не озвучены.
3.2.2 Артикуляционная фонетика финского языка
В финском языке восемь гласных. Эти гласные можно разделить на разные категории в зависимости от того, как они сформулированы: переднее/заднее положение языка, ширина/округлость положения сужения, положение языка (высокое или низкое) и насколько рот открыт или закрыт во время артикуляции. Финские гласные и их классификация представлены на рис. 3.9..
Рис. 3.9. Классификация финских гласных.
Финские согласные можно разделить на следующие категории в зависимости от места и способа артикуляции:
- Взрывные или смычные согласные: /k, p, t, g, b, d/. Голосовой тракт закрыт, что приводит к остановке или ослаблению звука. Когда тракт снова открывается, он вызывает шумоподобный, импульсоподобный или взрывной звук.
- Фрикативы: /f, h, s/. Речевой тракт в каком-то месте сужен, поэтому турбулентный поток воздуха вызывает шум, который модифицируется резонансами голосового тракта. Финские фрикативы глухие.
- Назальные: /н, м, нг/. Голосовой тракт закрыт, но небная занавеска открывает путь в полость носа. Генерируемый звонкий звук воздействует как на голосовой, так и на носовой тракт.
- Тремулянты: /r/. Верхушка языка быстро (20-25 Гц) вибрирует относительно альвео- рального гребня, вызывая звонкий звук с эффектом амплитудной модуляции.
- Боковые стороны: /l/. Верхушка языка закрывает голосовой тракт, оставляя обходной путь для воздушного потока.
- Полугласные: /j, v/. Полугласные почти как гласные, но они более нестабильны и не так контекстно-зависимы, как обычные гласные.
Категории согласных приведены на рис. 3.10. Например, для фонемы /p/ категоризация будет глухая двугубно-взрывная.
Рис. 3.10. Классификация финских согласных.
При синтезе согласных лучших результатов можно добиться, синтезируя эти шесть групп согласных отдельными методами из-за разных акустических характеристик. Особого внимания требует тремулянт /r/.
Предыдущий/Следующий/Индекс