Адаптивные системы

Синтез оптимального управления обычно требует знания математической модели объекта и входящих в эту модель параметров. На практике часто трудно обеспечить достаточно полное описание объекта управления и точное знание всех необходимых величин; более того, в процессе функционирования характеристики объекта могут изменяться. Теория адаптивных систем направлена на построение управляющей системы, которая должна автоматически отыскивать нужные законы управления посредством анализа поведения объекта при текущем управлении. Естественно, нужный закон управления находится (возможно, приближенно) после некоторого периода "адаптации" или "самообучения". Теория адаптивных систем – бурно развивающееся направление кибернетики; коллектив кафедры принял в этом процеесе активное участие. В частности, в сотрудничестве с другими организациями были проведены пять Ленинградских симпозиумов и одна общесоюзная конференция по адаптивным системам. В них приняли участие многие специалисты из СССР и других стран.

В 70-х годах В.А.Якубович разработал метод рекуррентных целевых неравенств для решения задач адаптивного управления (см. обзорную статью [43] и книгу [7]). Согласно этому методу цель управления преобразовывается в бесконечную систему неравенств относительно неизвестных параметров, они решаются с помощью одного из конечно-сходящихся алгоритмов [43]. Этот метод широко использовался в работах многих ленинградских авторов. В.А.Бондарко получил важный результат по сходимости процесса адаптации без принудительных "остановов" объекта.

В [9] приведены алгоритмы адаптивного управления линейными объектами, в которых обратная связь оптимизирована по отношению к квадратичному критерию качества управления. Алгоритмы адаптации в этом случае основаны на различных методах математической статистики (рекуррентные процедуры метода наименьших квадратов, методы стохастической аппроксимации и т.д.), позволяющие установить состоятельность оценок, получаемых в режиме функционирования объекта управления. Такая возможность обычно реализуется при дополнительных предположениях об априорных свойствах помехи, действующей на объект управления (стационарность помехи, стохастическая независимость возмущающих воздействий и т.п.). Предположение о подобных свойствах помехи можно опустить, если в канале управления использовать специальные тестовые (пробные) сигналы; соответствующий метод описан в [42] и продолжает совершенствоваться. Его использование позволяет решать разнообразные задачи оптимально-адаптивного управления при весьма слабых предположениях о свойствах помехи, аддитивно действующей на объект управления (например, решить минимаксную задачу управления).

Своеобразный подход к теории адаптивного управления (метод скоростного градиента [7]), с помощью которого получен ряд интересных результатов по адаптивной стабилизации [44], был развит А.Л.Фрадковым. В дальнейшем метод скоростного градиента оказался мощным средством решения разнообразных задач управления нелинейными системами. В последние годы с его помощью были решены многие задачи управления нелинейными колебательными, в том числе хаотическими процессами.

Большой цикл работ Б.М.Соколова и В.Н.Фомина посвящен адаптивному управлению технологическим процессом полимеризации в производстве синтетического каучука. Особенность этой задачи состоит в том, что математическая модель процесса нелинейна и вектор состояния наблюдается частично. Адаптивное управление синтезировалось как на основе метода рекуррентных целевых неравенств, так и метода самонастройки [9], [45], использующего построение специальной функции Ляпунова.