Отличить настоящую подпись от поддельной визуально достаточно сложно, ведь даже подписи одного и того же автора могут существенно различаться. В этой связи возникла задача создания автоматических систем проверки подписи. Они используют подпись off-line (статическую, написанную на бумаге) или on-line (динамическую, написанную на экране графического планшета). При использовании статической подписи используется только информация о ее изображении. При применении динамической подписи используется следующая информация:
- координата X
- координата У
- величина нажатия
- величина наклона
- азимут.
Естественно, системы, использующие динамическую подпись для подтверждения документов, имеют большую эффективность.
Разработано много методов идентификации динамической подписи.
Существующие методы идентификации основаны на применении того или иного признака в идентификациии.
Признак называется глобальным, если он извлекается из всей подписи (например, длина траектории подписи, полное время записи, средняя скорость, среднее ускорение, время поднятия пера).
Признак называется локальным, если он извлекается из каждой точки подписи (координаты, значения скорости и ускорения).
Признак называется сегментарным, если подпись поделена на сегменты и признак получен из целого сегмента.
Положив в основу определенные признаки, выделяют два разных подхода к идентификации динамической подписи.
- Параметрический подход производит вычисление и сравнение значений глобальных признаков, или параметров, подписи. Значения признаков шаблонных подписей сохраняются на карте. Множество знначений признаков иногда называются “сжатием” подписи.
- Второй подход, называемый функциональным, предполагает значимыми значения всех выбранных локальных признаков подписи и осуществляет поточечное сравнение шаблонной и тестовой подписей с использованием множества этих значений. Этот подход обычно требует больше информации о подписи. Например, если дана обычная подпись, семплированная со скоростью 200 Гц, возможно получить 1000 и более точек; если в каждой точке вычисляются значения 25 признаков, то для одной подписи имеем 25000 значений признаков, необходимых для сравнения с таким же количеством значений признаков других подписей.
В данной работе рассмотрим подробнее параметрический подход к идентификации подписи.
Основные проблемы:
- Какое количество глобальных признаков необходимо для идентификации?
- Требуется ли какое-либо преобразование подписей (например, изменение размера, сглаживание) до вычисления признаков?
- Сколько подписей использовать для вычисления шаблонной подписи?
- Будет ли шаблонная подпись регулярно обновляться?
- Как вычислять расстояние между шаблонной и тестовой подписями?
Рассмотрим основные исследования, проведенные с использованием параметрического подхода.
Lorette [3] использует следующие 7 геометрических и динамических признаков, инвариантных относительно поворотов и масштабирований:
- количество соединенных компонентов (1+число поднятий пера);
- число петель;
- данные о полных накопленных фазах подписи;
- полная продолжительность записи;
- продолжительность соединенных компонентов;
- средняя и максимальная скорость в соединенных компонентах.
Все переменные были нормализованы к среднему значению 0 и стандартному отклонению 1, расстояние было вычислено с использованием нормы Евклида. База данных 203 подписей, взятых с 14 волонтеров (по 15 подписей с каждого участника), была использована для оценки предложенной техники.
Данные были классифицированы с помощью иерархической классификации, используя только по 5 подписей каждого автора. Было получено 14 классов – система сама определила число классов. Оставшиеся 10 подписей были привязаны к ближайшим классам. Правильность произведенной классификации 91,7%. Итеративный процесс, используемый для улучшения классификации, позволил достичь правильности классификации 93,6%. В эксперименте не использовались поддельные подписи.
Hastie, Kishon, Clark, Fan [2] описали метод идентификации подписей, состоящий из 5 шагов:
- Сглаживание – для усреднения ошибки измерения используется интерполяция кубическими сплайнами.
- Вычисление скоростей подписей.
- Time Warping – вычисляется функция трансформации времени так, что находится соответствие между шаблонной и проверяемой подписями.
- Сегментация – подпись сегментируется на последовательность сегментов, называемых символами (letters), с использованием областей низкой скорости (низкая скорость – меньше 15% от средней скорости).
- Усреднение – оценка шаблонной подписи.
Тестовая подпись проходит с 1 по 4 шаг. Расстояние между шаблонной и тестовой подписями вычисляется в конце шага 3; если же здесь решение не найдено – в конце шага 4. Метод демонстрирует использование данных, записанных с помощью графического планшета, который захватывает координаты (х, у) и нажатие пера.
Техника, основанная на применении Байесовских нейронных сетей к идентификации рукописной on-line подписи, была представлена в работе Chang и др. [1]. Предложенный метод идентификации проводился на китайских подписях. В проведенном исследовании было использовано множество из 16 признаков: полное время, количество сегментов, средняя скорость, соотношение ширины и высоты, отношение плотностей верхней и нижней (а также левой и правой частей). Исследователи использовали базу данных 80 человек, содержащую 800 подлинных и 200 поддельных подписей. Были получены следующие результаты: FRR составила 2%, FAR – 2,5%.
Nelson, Turin, Hastie [4] предложили множество из 25 признаков, которое включало 2 временно-зависимых признака, 6 признаков, связанных со скоростью и ускорением, 4 связанных с формой признака, 8 признаков, дающих плотность распределения углов касательной, 4 признака, представляющих секторальные плотности угловых изменений, и признак корреляции между соответствующими компонентами скорости пера. Авторы использовали три разных метода вычисления расстояния между шаблонной подписью и тестовой подписью: евклидово расстояние, расстояние Махалонобиса и метод квадратичного дискриминанта. Описан простой метод выбора признаков, он состоит в вычислении коэффициентов стандартного отклонения каждого из признаков от среднего значения и упорядочение признаков в соответствии с их коэффициентами. Используя меру Евклида, исследователи определили наилучшие 10 из 25 признаков и получили результаты: FRR=0,5%, FAR=14%, которые оказались приемлемыми в приложениях для кредитных карт.
Библиографический список
- Chang, H.D., Wang, J.F., Suen, H.M. Dynamic handwritten Chinese signature verification //Proceedings of the 2nd International Conference on Document Analysis and Recognition, Oct. 20-22, Tsukuba Science City, Japan, 1993.P: 258-261.
- Hastie, T., Kishon, E., Clarc, M. & Fan, J. A Model for Signature Verification // Proc IEEE Int Conf on Systems, Man, and Cybernetics, Charlottesville, 1991. P. 191-196.
- Lorette G. On-line Handwritten Signature Recognition based on Data Analysis and Clustering // Proc. of 7th International Conf. on Pattern Recognition, Montreal, 1984. V. 2. P. 1284-1287.
- Nelson, W., Turin, W., & Hastie, T.. Statistical Methods for On-line Signature Verification.// International Journal of Pattern Recognition and Artificial Intellingence. 1994. Vol. 8, No. 3. P. 749-770.