УДК 004.932.2

ФУНКЦИОНАЛЬНЫЙ ПОДХОД К ПРОБЛЕМЕ ИДЕНТИФИКАЦИИ ДИНАМИЧЕСКОЙ ПОДПИСИ

Анисимова Эллина Сергеевна
Елабужский институт (филиал) федерального государственного автономного образовательного учреждения высшего профессионального образования "Казанский (Приволжский) федеральный университет"

Аннотация
Сегодня для получения подписи человека широко применяются графические планшеты. Информация о подписи записывается в файл, где записываются пространственные координаты о положении подписи, величина нажатия на планшет, наклон подписи. Существует два основных подхода к распознаванию рукописных подписей – параметрический и функциональный. Данная работа посвящена рассмотрению функционального подхода, основанного на применении при идентификации подписи локальных признаков (взятых из каждой точки подписи).

Ключевые слова: автоматическая система проверки подписи, графический планшет, идентификация динамической подписи, распознавание рукописной подписи, функциональный подход


THE FUNCTIONAL APPROACH TO THE DYNAMIC SIGNATURES IDENTIFICATION PROBLEM

Anisimova Ellina Sergeevna
Elabuga Institute (branch) of Kazan (Volga Region) Federal University

Abstract
Today, for the person signing is widely used graphics tablets Information about the signature is written to the file, which records the spatial coordinates of the position of the signature, the value of pressing the plate, tilt signature. There are two basic approaches to the recognition of handwritten signatures - parametric and functional. This work is devoted to the functional approach, based on the application in the identification of signatures of local features (taken from each point of the signature).

Библиографическая ссылка на статью:
Анисимова Э.С. Функциональный подход к проблеме идентификации динамической подписи // Современная техника и технологии. 2015. № 12 [Электронный ресурс]. URL: http://technology.snauka.ru/2015/12/8458 (дата обращения: 28.05.2017).

Отличить настоящую подпись от поддельной визуально достаточно сложно, ведь даже подписи одного и того же автора могут существенно различаться. В этой связи возникла задача создания автоматических систем проверки подписи. Они используют подпись в режиме off-line (статическую, написанную на бумаге) или on-line (динамическую, написанную на экране графического планшета). При использовании статической подписи используется только изображение подписи. При применении динамической подписи используется следующая информация о координатах подписи, величине нажима, азимута, наклона.

Методы, использующие динамическую подпись для подтверждения документов, более перспективны.

Существующие методы идентификации основаны на применении того или иного признака в идентификации.

  1. Параметрический подход производит вычисление и сравнение значений глобальных признаков, или параметров, подписи. Значения признаков шаблонных подписей сохраняются на карте. Множество знначений признаков иногда называются “сжатием” подписи.
  2. Второй подход, называемый функциональным, предполагает значимыми значения всех выбранных локальных признаков подписи и осуществляет поточечное сравнение шаблонной и тестовой подписей с использованием множества этих значений. Этот подход обычно требует больше информации о подписи. Например, если дана обычная подпись, семплированная со скоростью 200 Гц, возможно получить 1000 и более точек; если в каждой точке вычисляются значения 25 признаков, то для одной подписи имеем 25000 значений признаков, необходимых для сравнения с таким же количеством значений признаков других подписей.

Рассмотрим функциональный подход к проблеме идентификации динамической подписи.

Основные проблемы:

  • Какое количество локальных признаков должно быть использовано?
  • Как должно производиться сравнение, если подлинные подписи склонны к вариации?
  • Как будет происходить сегментация подписи?
  • Как вычислять расстояние между шаблонной и тестовой подписью?

Рассмотрим исследования, проведенные с использованием функционального подхода к распознаванию динамической подписи.

В работе [2] использовался метод, в котором для каждой подписи были извлечены особые, или критические точки, например, точки начала и конца штриха, точки изменения траектории. Количество штрихов было использовано как глобальный признак. Локальные признаки – пространственные и временные – были извлечены из координат x и у. Предложенный метод был протестирован на двух базах данных. Первая база данных содержала 520 подписей – 10 подписей для каждого из 52 авторов, собранных во время одного сеанса. Вторая база данных была расширением первой и содержала всего 1232 подписи 102 авторов, причем у 17 из авторов было собрано более десяти подписей в течение одного года во время многократных сессий. Двадцать человек произвели по 3 подделанных подписи каждый (а всего 60) после просмотра оригинальных подписей. Лучший коэффициент ошибок с использованием общего порога – FRR – 3,3%, FAR – 2,7%. Лучший коэффициент с использованием зависимого от автора порога – 2,8% FRR и 1,6%FAR.

Входом в систему идентификации при регистрации нового пользователя является набор обучающих подписей, введенных пользователем. Обучающие данные проходят предварительную обработку, после осуществляется извлечение признаков. Данные сохраняются в базе данных под уникальным номером (ID). Из обучающих данных определяется порог для оценки совпадений. При идентификации входом в систему является тестовая подпись вместе с предъявляемой информацией об ее авторе. Применяется предварительная обработка, происходит извлечение признаков. Затем подпись сравнивается с каждой обучающей подписью, взятой из базы данных на основании предъявленного идентификатора автора. Результирующие значения разностей объединяются в одно значение, и далее при использовании индивидуального порога для каждого автора, подпись принимается как подлинная или отвергается как поддельная. Входной сигнал графического планшета или пера может быть очень неровным. Пространство для записи подписи может зависеть от разных приложений, кроме того используемое перо может влиять на гладкость и размер подписи. Для сглаживания подписи обычно используется метод, основанный на фильтре Гаусса. Для сравнения пространственных признаков подписи из их представления должны быть устранены временные зависимости. Это достигается ресэмплингом подписи с одинаковым шагом. Определенные точки такие, как начальная и конечная точки строки, точки изменения траектории, несут в себе очень важную информацию. Эти точки, называемые критическими, извлекаются перед предварительной обработкой. Позиции точек сохраняются в течение процессов ресэмплинга и сглаживания.

Строкой называется последовательность точек, через которые проходит перо, прикасаясь к бумаге. как глобальный признак. Из координат х и у извлекается ряд локальных признаков, которые могут быть поделены на две категории – пространственные и временные. Пространственные – это статистические признаки, которые извлекаются из формы подписи.

Локальные пространственные признаки: (1) разности dх и dy между координатами х и у двух последовательных точек, (2) у – абсолютное значение у-координаты относительно центра подписи, (3) – синус и косинус угла с осью Охsina и cosa, (4) b – кривизна, (5) значение серого в окрестности  9х9.

Рис. 1. Вычисление признаков

Признаки вычисляются в точке pi, в двух предшествующих точках pi-1 и pi-2 и двух следующих точках pi+1 и pi+2. Изменения координат х и у есть изменения относительно последующей точки pi+1. Абсолютное значение у – это координата у для каждой повторно выбранной точки после предварительной обработки. Угол a  это угол между осью х и прямой, проходящей через точки pi и pi+1. Признак кривизны – это угол между линиями  и . Признак изображения вычисляет 9 серых значений в окрестности сэмплированной точки. Окрестность пикселей 9х9 делится на квадраты 3х3, значение серого вычисляется как сумма пикселей, попавших в данное окно.

Наряду с временным порядком точек важным признаком является скорость записи. Существует два разных варианта  для извлечения данного признака: (1) абсолютная (нормализована с помощью средней скорости записи) и относительная скорости в каждой ресэмплированной точке; (2) абсолютная и относительная средние скорости между двумя критическими точками.

 

Рис. 2. Вычисление скорости

Скорость V* между двумя последовательными критическими точками и скорость V· между двумя точками вычисляются как расстояния между этими точками, так как эти точки равноудалены во времени

После извлечения в каждой точке локальных признаков подписи выбираются для сравнения две подписи. Каждая подпись описывается набором признаков, извлеченных в каждой точке. Поэтому подпись может быть представлена как строка, т.е. последовательность векторов признаков, размер которых определяется количеством локальных признаков. Глобальные признаки в данное представление не включены. Метод совпадения строк (string matching), известный также как dynamic time warping – хорошо известный метод сравнения строк разной длины. Он находит совпадение между точками в двух строках так, что сумма разностей между каждой парой выровненных точек минимальна.

Чтобы найти минимальную разность должны быть найдены все возможные совпадения. Эффективное решение основано на динамическом программировании. Данный метод является расширением базового подхода, разрешая включение строк с ломаными штрихами, он также включает штраф, препятствуя совпадению строк с большими разницами в количестве обнаруженных штрихов. После выравнивания строк в общую меру несходства включается разница между количеством штрихов в двух подписях. Формула общего несходства между строкой входящей подписи (I) и строкой шаблона (T):

где Dist(T,I) – мера расстояния, полученная после выравнивания двух строк T и I, SP – штраф для совпадающих строк с разным количеством штрихов, |ST-St| – разность между количествами штрихов шаблона и входной подписи, Norm_Factor(NT, Nt) – максимально возможное расстояние между двумя строками длины NTи Nt, масшабируемое до постоянного множителя.

На этапе идентификации тестовая подпись подлежит сравнению со всеми подписями множества шаблонов. Исследованы три основных метода комбинации индивидуальных значений несходства (между входом и одним из шаблонов) в одно значение: (1) минимум всех значений несходства, (2) среднее, (3) максимум.

После вычисления значений несходства должно быть принято решение об аутентичности или поддельности подписи. Для этого результат совпадения должен быть сравнен с порогом. Если значение несходства больше порога, подпись отклоняется, иначе принимается. Порог может быть выбран одинаковым для всех или индивидуальным для каждого автора.

Преимущество общего порога состоит в том, что для нахождения оптимального порога можно использовать данные всех регистрируемых авторов. Вычисляются несходства между всеми зарегистрированными в системе авторами. Значение порога выбирается на основе минимума ошибки.

Для адаптации процесса идентификации к свойствам отдельных авторов используется порог, зависимый от автора. Этот порог может быть получен только из регистрируемых данных автора. Однако для оценки надежности зависимого от авторов порога требуется большее, чем обычно, число подписей. Обычно, чтобы избежать этого, начинают с общего порога и затем модифицируют его для каждого автора добавлением специального компонента автора.

В работе [3] для идентификации подписей используется пять временных последовательностей: координаты х и у, нажим, наклон и позиция, а также три производные последовательности: угол траектории касательной, скорость движения траектории и радиус кривизны. Авторы определили, что если вычислить первые и вторые производные каждой из последовательностей, то всего временных последовательностей будет 24.

Значения функций были нормализованы для получения нулевого среднего значения и модуля стандартного отклонения, равного единице. На основе этих последовательностей была построена модель подписи с использованием скрытых моделей Маркова. Эффективность идентификации была протестирована с использованием базы данных из 15 подлинных и 15 поддельных подписей для каждого из 50 человек. Тесты были проведены с использованием одинакового порога для всех – результат EER 4,83%, был снижен до 0,98% с использованием порогов конкретных пользователей.

Заключение

Сделать вывод о том, какая из описанных техник распознавания подписи лучше, достаточно сложно.

Однако в последнее время стало очевидным, что функциональный подход к распознаванию подписей превосходит чисто параметрический. Современные методы идентификации либо основаны на функциональном подходе, либо сочетают функциональный и параметрический подходы.

Исследования [1] показывают, что использование чисто параметрического подхода не может обеспечить величину EER менее 5%. Поэтому в новейших разработках используется функциональный подход и в проводимых исследованиях достигается высокая эффективность – EER менее 5%. Разработка систем распознавания on-line подписи – активно развивающаяся область и результаты исследований будут улучшаться.


Библиографический список
  1. Gupta G.K. The State of the Art in the On-Line Handwritten Signature Verification. Victoria, Australia, Faculty of Information Technology, Monash University, 2006. 39 p.
  2. Jain A.K., Griess F.D., Connell, S.D. Online signature verification // Pattern Recognition. 2002. No. 35. P. 2963-2972.
  3. Ortega-Garsia J., Fierrez-Aquilar J., Martin-Rell J. Complete Signal Modeling and Score Normalization for Function-Based Dynamic Signature Verification. // Audio and Video-Based Biometric Person Authentication. 2003. P. 658-667.


Все статьи автора «Анисимова Эллина Сергеевна»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: