Распознавание звуковых сигналов и синтез вокодеров

Обработка звуковых сигналов входит во многие аудиосистемы, является неотъемлемой частью студий звукозаписи и существенно используется в мобильных телефонах. Достаточно сказать, что международный стандарт кодирования речевого сигнала GSM вошел в название фирм- производителей и эксплуатационщиков оборудования, математические алгоритмы работы которого удовлетворяют этому стандарту. Программа, кодирующая и декодирующая речевой сигнал при передаче по телефонному каналу или по радио, называется вокодером.

Группа сотрудников лаборатории теоретической кибернетики разработала новый вокодер половинной скорости (5.6 кбит/с). В отличие от стандарта GSM, работающего в 2 раза медленнее, это полный спектральный вокодер, соединяющий в себе эффективный метод коэффициентов линейного предсказания и новую спектральную параметризацию речевого сигнала.

Важнейшие параметры звукового сигнала, влияющие на восприятие ухом, описывают не столько амплитудные изменения давления воздуха, сколько форму его спектра. Это частота основного тона и спектральная оболочка, совпадающая с модулем преобразования Фурье. Фазовая составляющая спектра практически не влияет на разборчивость речи. Основная трудность в оценивании спектральных параметров состоит в противоречии между требованиями точности спектра для оценок стационарного сигнала и минимизации запаздывания в определении нестационарности.

Звуковой сигнал, записанный с частотой 8 кГц, как в телефоне, или 44.1 кГц, как на музыкальном диске, представляется отсчетами достаточно гладкой функции, которая локально близка к периодической. В настоящее время не существует полной модели речевого или музыкального сигналов, которая включала бы числовую оценку ее погрешности, соответствующую человеческому восприятию. Однако, ряд важных параметров удается оценить весьма точно методами теории фильтрации временных рядов. Особенностью разработанного вокодера является оригинальный метод одновременного вычисления частоты основного тона и фаз всех кратных гармоник. Работа в области моделирования музыкальных сигналов, расчет эха в крупных залах и компенсация эха в салоне автомобиля остаются важными направлениями текущих исследований.