Обучаемые распознающие системы

В начале 60-х годов в связи с потребностями приборостроения (главным образом в военной области) во всем мире, в том числе на кафедре теоретической кибернетики, стала интенсивно развиваться теория обучаемых распознающих систем. Исследование проводилось по трем основным направлениям: 1) аппроксимационный (персептронный) подход к задаче распознавания, 2) методы математической логики в распознавании образов, 3) бионический подход к проблеме распознавания.

Первое направление характерно тем, что неизвестная дискриминантная функция аппроксимируется линейными комбинациями заданной системы функций ("признаков"). Коэффициенты линейной комбинации находятся с помощью обучающей последовательности – конечной последовательности точек, в которых известны значения аппроксимируемой дискриминантной функции, что позволяет получить систему линейных неравенств для этих коэффициентов. Всякий алгоритм решения системы неравенств называется алгоритмом обучения. В [6] предложено в качестве аппроксимирующих функций выбирать пороговые функции, там же была установлена возможность равномерной аппроксимации произвольной непрерывной функции на компакте пороговыми функциями и разработан метод рекуррентных конечно-сходящихся алгоритмов, которые удобно использовать в качестве алгоритмов обучения.

В рамках метода конечно-сходящихся алгоритмов были предложены разнообразные рекуррентные алгоритмы обучения распознающих систем (Б.Н.Козинец, В.Н.Фомин, В.А.Якубович). Эти алгоритмы приведены в [7,8]. Используя алгоритм построения плоскости, разделяющей выпуклые оболочки точечных множеств, Б.Н.Козинец и с.н.с. Криминалистической лаборатории г. Ленинграда Р.М.Ланцман впервые в нашей стране успешно провели эксперименты по криминалистической экспертизе почерка с помощью ЭВМ [8]. (Алгоритм основывался на гипотезе В.А.Якубовича о характере стереотипа письма.) В [9] подведены определенные итоги использования метода рекуррентных конечно-сходящихся алгоритмов, уточнена структура алгоритмов обучения с поощрением и получены их стохастические аналоги. Если дискриминантная функция "устроена" достаточно сложно либо "признаки" выбраны неудачно, то упомянутые выше линейные неравенства могут оказаться неразрешимыми. Тогда коэффициенты линейной аппроксимации естественно определять с помощью метода наименьших квадратов. Особенностью задач распознавания является плохая обусловленность получаемой при этом системы линейных алгебраических уравнений (вызванная "почти зависимостью" аппроксимирующих (или признаковых) функций на обучающей последовательности). Для преодоления этой трудности А.Х.Гелигом был предложен алгоритм, который вместо точного решения системы линейных уравнений доставляет "квазирешение", обеспечивающее равномерную малость невязок системы. Это "квазирешение" мало чувствительно к плохой обусловленности матрицы коэффициентов линейной системы уравнений; идея предложенного А.Х.Гелигом алгоритма состоит в последовательной "отбраковке" плохих признаков с последующей аппроксимацией дискриминантной функции с помощью отобранных "хороших" признаковых функций. Алгоритм является обобщением известного алгоритма Гаусса решения невырожденных линейных алгебраических систем, приведен в удобной для приложений форме. С его помощью было решено большое количество прикладных задач по заказам приборостроительных предприятий. Подробно алгоритм описан в [9].

Второе направление широко использует предикатное исчисление: дискриминантная функция аппроксимируется с помощью конъюкций и дизъюнкций, выстраиваемых по обучающейся последовательности. Основная проблема здесь состоит в возможности упрощения аппроксимирующей функции путем сокращения числа используемых при ее синтезе логических операций. В [10] описан метод такого сокращения, подстраивающийся под конкретную задачу распознавания.

В начале 70-х годов в лаборатории теоретической кибернетики была создана группа бионики под руководством Р.М.Грановской. Ее задачей было изучение механизмов памяти живых сушеств, исследование феноменов восприятия и узнавания. Группой был проведен большой объем экспериментальных и теоретических исследований [11-13]; полученные результаты широко внедрялись в заинтересованных организациях.

В конце 70-х – начале 80-х годов А.А.Шмидтом и В.В.Харичевым под руководством В.А.Якубовича исследовалась задача обучения системы нахождению (выделению) объектов заданного класса на сложном фоне, образованном объектами других классов и помехами (задача построения "смыслового фильтра"). Этим же коллективом решалась задача обучения распознающей системы понятиям типа "большой", "маленький", "вверху", "справа" и т.п., а также задача автоматического описания изображения. В основу алгоритмов обучения были положены инварианты различных групп преобразований (повороты, переносы и т.п.) плоскости в себя ([14] и др.).

В конце 60-х - начале 70-х годов Л.В.Бондарко совместно с кафедрой фонетики проводила теоретические и прикладные исследования по автоматизации распознавания речевых сигналов, было предложено лингвистическое и фонетическое обоснование работы антропоморфных систем распознавания и синтеза речи.

Особо следует упомянуть исследования, проведенные Э.И. Нечипоруком в конце 60-х годов по оценке сложности вентильных схем, реализующих логические функции. По этой тематике им была защищена докторская диссертация.