Номер части:
Журнал
ISSN: 2411-6467 (Print)
ISSN: 2413-9335 (Online)
Статьи, опубликованные в журнале, представляется читателям на условиях свободной лицензии CC BY-ND

Аппроксимация речевого сигнала локальными косинусными базисами



Науки и перечень статей вошедших в журнал:
DOI:
Дата публикации статьи в журнале:
Название журнала: Евразийский Союз Ученых — публикация научных статей в ежемесячном научном журнале, Выпуск: , Том: , Страницы в выпуске: -
Данные для цитирования: . Аппроксимация речевого сигнала локальными косинусными базисами // Евразийский Союз Ученых — публикация научных статей в ежемесячном научном журнале. Физико-математические науки. ; ():-.

Тестовые испытания: классификация фонем на основании аппроксимации речевого сигнала локальным косинусным базисом.

В качестве тестовых испытаний был проведен ряд аппроксимаций записей речевых сигналов, взятых из специально созданной базы, адаптивным локальным косинусным базисом (реализация в программном комплексе Matlab, в составе базы присутствовали записи всех основных бифонных складов русской речи дикторов в возрасте от 18 до 23 лет обоих полов, частота дискретизации записей 22050 Гц). Испытания показывают, что участки записей с речью могут быть сегментированы на определенные классы фонем, как-то: вокализованные фонемы – гласные и сонорные согласные, взрывные фонемы, как вокализованные, так и невокализованные, а также аффрикаты и шипящие. Детализация различий между классами фонем представлена в таблице 1. Модули частот отнормированы по максимуму.

Класс фонем Распределение частот Модуль частот
Гласные Нижняя треть частот:

0.8-1.2

0.7 – 0.9

 

Сонорные согласные Нижняя и средняя треть частот: 0.3 – 1 0.4-0.6

 

Аффрикаты Почти весь спектр частот ≈0.4
Шипящие 1.5-3.5 0.5-1
Взрывные вокализованные Частоты на взрыве: ≈ 2 На взрыве ≈0.1, далее 0.3-0.4
Взрывные невокализованные Частоты на взрыве: ≈1, частоты далее: ≈0.5 На взрыве ≈0.05, далее 0.9

Таблица 1. Распределение ненулевых коэффициентов аппроксимации речевого сигнала локальным косинусным базисом в разных классах фонем.

Заключение

Было проведено исследование возможностей аппроксимации отрезков речевого сигнала локальным косинусным базисом в задаче сегментирования и распознавания фонем. Требуется дополнительно установить зависимость результата аппроксимации от сдвига и дикторозависимость.

Список литературы:

  1. Малла С. Вейвлеты в обработке сигналов: Пер. с англ. — М.: Мир, 2005. — 671 с.[schema type=»book» name=»Аппроксимация речевого сигнала локальными косинусными базисами» author=»Алешина Наталия Дмитриевна» publisher=»БАСАРАНОВИЧ ЕКАТЕРИНА» pubdate=»2017-03-24″ edition=»ЕВРАЗИЙСКИЙ СОЮЗ УЧЕНЫХ_30.04.2015_4(13)» ebook=»yes» ]
Список литературы:


Записи созданы 9819

Похожие записи

Начните вводить, то что вы ищите выше и нажмите кнопку Enter для поиска. Нажмите кнопку ESC для отмены.

Вернуться наверх
404: Not Found404: Not Found