В настоящее время разработаны различные методы оценивания важнейшего параметра речевого сигнала – частоты основного тона, определяющего высоту голоса. В данном курсе студентам сообщается метод, основанный на спектральной модели сигнала с последующей оптимизацией параметров. Предполагается практическая работа студентов, в том числе самостоятельная, по применению компьютерных средств, разработанных в рамках данного курса на языках Matlab и Scilab. Решение задачи распадается на две основные части, основанные на разных математических подходах:
Математические алгоритмы включают методы динамического программирования и метод наименьших квадратов.
В данном модуле завершается тема кодирования речевого сигнала при помощи спектральных моделей. Параметры математических моделей содержат частоту основного тона, характеристики формант и энергию фрагментов сигнала. Форманты речевого сигнала определяются формой спектральной огибающей аллофонов, которая аппроксимируется рациональной функцией при помощи уравнений Юла-Уокера. Теория этих уравнений включает как быстрые алгоритмы, применяемые в стандартах GSM, так и вопросы численной устойчивости вычислений. Сюда относятся критерии Джури, многочлены Сегё и Шура, а также линейные спектральные пары. В лекциях на эти темы собраны самые необходимые сведения из теории функций комплексной переменной и построенные на их основе алгоритмы стандарта GSM. Студенты изучают эффективную программу полного кодирования речевого сигнала и применяют её в исследовании свойств собственных записей.
Класс математических моделей стационарных голосовых сигналов.
Показатель качества модели. Оптимизация её параметров.
Аппроксимация амплитуд по методу наименьших квадратов.
Формула для вычисления функционала качества модели голосового сигнала.
Понятие о динамическом программировании. Реализация динамического программирования в оценивании периода основного тона.
Непрерывный и дискретный спектр суммы кратных гармоник.
Амплитуда и фаза простой гармоники, их роль в колокольчиках спектра.
Класс моделей цифрового голосового сигнала. Сравнение модели и реального спектра.
Программа оптимизации модели голосового сигнала с произвольным нецелым периодом основного тона.
Метод наименьших квадратов при оценивании амплитуды и фазы.
Автогрессионный процесс.
Уравнение Юла-Уокера, коэффициенты линейного предсказания.
Алгоритм Левинсона-Дурбина.
Устойчивость решений уравнения Юла-Уокера.
Линейные спектральные пары. Точность кодирования коэффициентов линейного предсказания.
Форманты и спектральные огибающие. Их расчёт.
Поиск оптимальной модели голосового сигнала «анализ через синтез».
Ошибки кратных частот в анализе речевого сигнала и их устранение.
Программа высокоточного расчёта частоты основного тона.
Определение фаз всех гармоник голосового сигнала.
Принятие решения о звонком или глухом голосе.
Полный спектральный код речевого сигнала.
Программа расчёта параметров речевого сигнала по фрагментам с перекрытием.
Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. М. Радио и связь. 1981.
Стандарты GSM.
Алдошина И.А., Приттс Р. Музыкальная акустика. Учебник для вузов. СПб. 2006.