Вычислительные сети, теория и практика.

BC/NW 2007, №1, (10) :15.9

РАЗРАБОТКА МОДЕЛИ ВХОДНЫХ ПРИЗНАКОВ НА ОСНОВЕ ГЕОМЕТРИЧЕСКИХ ХАРАКТЕРИСТИК РУКОПИСНОГО ТЕКСТА ДЛЯ РЕШЕНИЯ ЗАДАЧИ ИДЕНТИФИКАЦИИ АВТОРА

А.В. Ермоленко, М.О.Корлякова

(Филиал МГТУ им. Н.Э. Баумана в г. Калуга)

В работе представлено исследование признаков для описания рукописного текста при решении задачи установления идентичности почерка. В рамках поставленной задачи рассматриваются общие геометрические характеристики рукописного текста, т.е. угол наклона букв, средняя высота букв, относительный межстрочный интервал, средняя ширина горизонтального пробела, минимальная ширина пробела, максимальная ширина пробела, средний угол наклона строк, максимальный угол наклона строк, минимальный угол наклона строк, максимальный угол разброса строк. В основу реализации процедур нахождения всех характеристик положен принцип пороговой кластеризации изображения. В результате разбиения столбцов рукописного текста на кластеры мы получаем число кластеров в столбце, которое после проведения процедуры фильтрации изображения и осреднения по всем столбцам равно среднему числу строк в тексте. На основании данных этого же разбиения мы получаем и среднее значение высоты буквы в тексте, которое также может быть использовано как уникальная характеристика почерка. Подобного рода кластеризация зачастую порождает лишние кластеры или объединяет несколько реальных строк в один кластер. Для устранения этого недостатка разработана процедура фильтрации изображения, основанная на анализе статистической информации о строках и кластерных столбцах. Построение корректной траектории строк порождает проблему корректного определения их начальных и конечных точек. Однако в связи с наличием в тексте отступов для абзацев, а также с неполной длиной строки (различная длина слов и правила переноса) на краевых столбцах можно получить неполное количество строк. Для исключения подобной ситуации реализована процедура построения виртуальных кластеров, которая дорисовывает на местах продолжения строк виртуальные кластеры аналогичные значениям предыдущего столбца. Проведение линейной аппроксимации позволяет построить усреднённую линию написания строки для определения угла наклона. Построение такой линии реализовано с использованием метода наименьших квадратов первого порядка, основанного на подборе параметров кривой при условии минимизации суммы квадратов невязок.

Для определения информативности признаков, содержащихся в нормированной выборке, использованы методы представления данных в нечетких множествах. Построены треугольные распределения величин признаков всех параметров для различных авторов текста. Анализ данных при подобном представлении показал принципиальную возможность определения авторства текста на основе существующей признаковой базы. Однако большая дисперсионность признаков и различная степень влияния на итоговый результат не позволяют использовать простые линейные методы разделения объектов.

Модель для разработки архитектуры решателя было решено искать в рамках нейросетевых систем. Выход нейросети показывает, являются ли два введенных образца экземплярами одного и того же автора или нет. В качестве входного образа использована разница между значениями признаков для примеров автографов одного автора и различных авторов.

Среди различных нейросетевых архитектур наибольший интерес для исследований при наших условиях представляют алгоритмы обратного распространения ошибки (Back Propagarion – BP). Выбор итоговой нейросетевой архитектуры проводился на основе экспериментального анализа наиболее распространённых методов оптимизации процедуры обучения многослойного персептрона. Наиболее устойчивый результат показал квазиньютоновский метод. Архитектура сети представляет собой двухслойную персептрон с пятью нейронами внутреннего слоя. Ошибка распознавания составила не более 0,1%. Данный результат позволяет с большой достоверностью решить задачу идентичности двух образцов почерка.