СПбГУ

Санкт-Петербургский государственный университет
Математико-механический факультет
Кафедра теоретической кибернетики



Цифровая обработка речевого сигнала
Digital Processing of Speech Signals



Аннотация


Модуль 1. Оценивание частоты основного тона голосового сигнала с высокой точностью

В настоящее время разработаны различные методы оценивания важнейшего параметра речевого сигнала – частоты основного тона, определяющего высоту голоса. В данном курсе студентам сообщается метод, основанный на спектральной модели сигнала с последующей оптимизацией параметров. Предполагается практическая работа студентов, в том числе самостоятельная, по применению компьютерных средств, разработанных в рамках данного курса на языках Matlab и Scilab. Решение задачи распадается на две основные части, основанные на разных математических подходах:

  1. метод, формула, алгоритм и программа расчёта целого значения периода основного тона;
  2. оценивание дробной части периода основного тона с высокой точностью по методу максимума правдоподобия.

Математические алгоритмы включают методы динамического программирования и метод наименьших квадратов.

Модуль 2. Теория уравнений Юла-Уокера и кодирование спектральной огибающей

В данном модуле завершается тема кодирования речевого сигнала при помощи спектральных моделей. Параметры математических моделей содержат частоту основного тона, характеристики формант и энергию фрагментов сигнала. Форманты речевого сигнала определяются формой спектральной огибающей аллофонов, которая аппроксимируется рациональной функцией при помощи уравнений Юла-Уокера. Теория этих уравнений включает как быстрые алгоритмы, применяемые в стандартах GSM, так и вопросы численной устойчивости вычислений. Сюда относятся критерии Джури, многочлены Сегё и Шура, а также линейные спектральные пары. В лекциях на эти темы собраны самые необходимые сведения из теории функций комплексной переменной и построенные на их основе алгоритмы стандарта GSM. Студенты изучают эффективную программу полного кодирования речевого сигнала и применяют её в исследовании свойств собственных записей.



Примерный список вопросов на экзамене


Вопросы к модулю 1

  1. Класс математических моделей стационарных голосовых сигналов.

  2. Показатель качества модели. Оптимизация её параметров.

  3. Аппроксимация амплитуд по методу наименьших квадратов.

  4. Формула для вычисления функционала качества модели голосового сигнала.

  5. Понятие о динамическом программировании. Реализация динамического программирования в оценивании периода основного тона.

  6. Непрерывный и дискретный спектр суммы кратных гармоник.

  7. Амплитуда и фаза простой гармоники, их роль в колокольчиках спектра.

  8. Класс моделей цифрового голосового сигнала. Сравнение модели и реального спектра.

  9. Программа оптимизации модели голосового сигнала с произвольным нецелым периодом основного тона.

  10. Метод наименьших квадратов при оценивании амплитуды и фазы.

Вопросы к модулю 2

  1. Автогрессионный процесс.

  2. Уравнение Юла-Уокера, коэффициенты линейного предсказания.

  3. Алгоритм Левинсона-Дурбина.

  4. Устойчивость решений уравнения Юла-Уокера.

  5. Линейные спектральные пары. Точность кодирования коэффициентов линейного предсказания.

  6. Форманты и спектральные огибающие. Их расчёт.

  7. Поиск оптимальной модели голосового сигнала «анализ через синтез».

  8. Ошибки кратных частот в анализе речевого сигнала и их устранение.

  9. Программа высокоточного расчёта частоты основного тона.

  10. Определение фаз всех гармоник голосового сигнала.

  11. Принятие решения о звонком или глухом голосе.

  12. Полный спектральный код речевого сигнала.

  13. Программа расчёта параметров речевого сигнала по фрагментам с перекрытием.



Литература


Список обязательной литературы

  1. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. М. Радио и связь. 1981.


Список дополнительной литературы

  1. Стандарты GSM.

  2. Алдошина И.А., Приттс Р. Музыкальная акустика. Учебник для вузов. СПб. 2006.



Нормативные документы


РПУД

  1. 2012 год, формат: xls





Диссертации
докторов
кандидатов

Дипломные работы
магистров
специалистов
бакалавров

Курсовые работы
студентов

Кафедра теоретической кибернетики СПбГУ
Университетский пр-кт, дом 28, к.3343–3356
Санкт-Петербург, 198504, Россия
Телефон: +7 (812) 428-41-48
Факс: +7 (812) 428-69-98


© Коллектив кафедры теоретической кибернетики СПбГУ, 2012–2017