Тестовые испытания: классификация фонем на основании аппроксимации речевого сигнала локальным косинусным базисом.
В качестве тестовых испытаний был проведен ряд аппроксимаций записей речевых сигналов, взятых из специально созданной базы, адаптивным локальным косинусным базисом (реализация в программном комплексе Matlab, в составе базы присутствовали записи всех основных бифонных складов русской речи дикторов в возрасте от 18 до 23 лет обоих полов, частота дискретизации записей 22050 Гц). Испытания показывают, что участки записей с речью могут быть сегментированы на определенные классы фонем, как-то: вокализованные фонемы – гласные и сонорные согласные, взрывные фонемы, как вокализованные, так и невокализованные, а также аффрикаты и шипящие. Детализация различий между классами фонем представлена в таблице 1. Модули частот отнормированы по максимуму.
Класс фонем | Распределение частот | Модуль частот |
Гласные | Нижняя треть частот:
0.8-1.2 |
0.7 – 0.9
|
Сонорные согласные | Нижняя и средняя треть частот: 0.3 – 1 | 0.4-0.6
|
Аффрикаты | Почти весь спектр частот | ≈0.4 |
Шипящие | 1.5-3.5 | 0.5-1 |
Взрывные вокализованные | Частоты на взрыве: ≈ 2 | На взрыве ≈0.1, далее 0.3-0.4 |
Взрывные невокализованные | Частоты на взрыве: ≈1, частоты далее: ≈0.5 | На взрыве ≈0.05, далее 0.9 |
Таблица 1. Распределение ненулевых коэффициентов аппроксимации речевого сигнала локальным косинусным базисом в разных классах фонем.
Заключение
Было проведено исследование возможностей аппроксимации отрезков речевого сигнала локальным косинусным базисом в задаче сегментирования и распознавания фонем. Требуется дополнительно установить зависимость результата аппроксимации от сдвига и дикторозависимость.
Список литературы:
- Малла С. Вейвлеты в обработке сигналов: Пер. с англ. — М.: Мир, 2005. — 671 с.[schema type=»book» name=»Аппроксимация речевого сигнала локальными косинусными базисами» author=»Алешина Наталия Дмитриевна» publisher=»БАСАРАНОВИЧ ЕКАТЕРИНА» pubdate=»2017-03-24″ edition=»ЕВРАЗИЙСКИЙ СОЮЗ УЧЕНЫХ_30.04.2015_4(13)» ebook=»yes» ]