Вычислительные сети, теория и практика.

BC/NW 2007, №1, (10) :15.10

РАЗРАБОТКА МОДЕЛИ ВХОДНЫХ ПРИЗНАКОВ НА ОСНОВЕ ГЕОМЕТРИЧЕСКИХ ХАРАКТЕРИСТИК ОТДЕЛЬНО ВЗЯТОГО СИМВОЛА РУКОПИСНОГО ТЕКСТА ДЛЯ РЕШЕНИЯ ЗАДАЧИ ИДЕНТИФИКАЦИИ АВТОРА

А.А. Козличенков, М.О.Корлякова

(Филиал МГТУ им. Н.Э. Баумана в г. Калуга)

В работе поставлена задача разработки архитектуры прикладной системы установления идентичности почерка и определения набора признаков, которые позволят с высокой достоверностью принять решение. В рамках поставленной задачи рассматриваются геометрические характеристики отдельных элементов букв рукописного текста, т.е. различные виды межбуквенного соединения (например, 3-х лучевое, 4-х лучевое, петли т.п.).

В основу реализации процедур нахождения характеристик был положен метод детализации отдельных фрагментов рукописного теста совокупностью трапеций с различными значениями рёбер и оснований, определяемых на основе размера участков внутреннего и внешнего контура очертания фрагмента символа. В результате был получен набор различных трапеций с чётко определёнными для образца значениями высоты, рёбер и их ориентации относительно строки. Полученный набор трапеций был использован для описания соединений элементов.

Изначально предполагалось выделить соединения, построенные с использованием разного количества лучей (последовательность трапеций образующих прямую), но как показала практика соединения, состоящие более чем из 3-х лучей встречаются очень редко и поэтому не имеют большой информативность. Поэтому было решено остановить на соединения состоящих из 3-х лучей. Параметрами 3-х лучевых соединений были выбраны углы между лучами (с учетом угла наклона строки). Так как абсолютно двух одинаковых соединений быть не может, что связано с погрешностью вычислений (при выделении контура и построении трапеций), для выявления похожих соединений решено было для всех полученных соединений провести кластеризацию (в зависимости от параметров соединения). Отклонение параметров соединения принадлежащих одному кластеру не должно было превышать 2%.

Таким образом, мы получили все возможные типы 3-х лучевых соединений с долей их вероятности нахождения в исследуемом образце. Анализ полученных данных показал, что принципиально возможно определение автора написанного текста, так как по каждому признаку существует слабопересекающиеся области значений соответствующие каждому автору.

Модель для разработки архитектуры решателя было решено искать в рамках нейросетевых систем. Выход нейросети показывает, являются ли два введенных образца экземплярами одного и того же автора или нет. Согласно данной постановке задачи уместно рассматривать в качестве обучающей и тестирующей выборки нейросети не матрицу прямых входов параметров образцов, а матрицу разностей значений между образцами. Это также позволяет в N раз (где N – число образцов почерка в выборке) увеличить размер обучающей выборки. Так как при составлении выборки нам известны авторы образцов, то каждому полученному значению можно сопоставить атрибут «Автор».

Таким образом, становится возможным осуществить раздел выборки на две, большая из которых будет содержать множество F результатов для двух образцов различных авторов, а меньшая – (множество Т) для одного автора.

Среди различных нейросетевых архитектур наибольший интерес для исследований при наших условиях представляют алгоритмы обратного распространения ошибки (Back Propagarion – BP).

Выбор итоговой нейросетевой архитектуры проводился на основе экспериментального анализа наиболее распространённых методов оптимизации процедуры обучения многослойного персептрона. Наиболее устойчивый результат показал квазиньютоновский метод, идея которого состоит в учете информации о кривизне минимизируемой функции, содержащейся в матрице Гессе. Данный результат позволяет с большой достоверностью решить задачу идентичности двух образцов почерка.