УДК 004.932.2

МЕТОДЫ СБОРА ПРИЗНАКОВ ПРИ РАСПОЗНАВАНИИ РУКОПИСНЫХ СИМВОЛОВ

Анисимова Эллина Сергеевна
Елабужский институт (филиал) ФГАОУ ВПО "Казанский (Приволжский) федеральный университет"
ассистент кафедры информатики и дискретной математики

Аннотация
Распознавание рукописных символов представляет большую проблему в области обработки изображений и распознавания образов. Эффективность распознавания во многом зависит от эффективного извлечения признаков, способных отделить образцы пользователя от образцов других пользователей. В этой связи в данной статье рассмотрены основные методы сбора признаков символьных данных.

Ключевые слова: распознавание рукописных символов


FEATURES AQUISITION METHODS IN HANDWRITTEN CHARACTERS RECOGNITION

Anisimova Ellina Sergeevna
Elabuga Institute (branch) of Kazan (Volga Region) Federal University
Assistant of the Department of Informatics and Discrete Mathematics

Abstract
Recognition of handwritten characters is a big problem in the field of image processing and pattern recognition. Detection efficiency largely depends on the efficient recovery features that can separate the user samples from other users of the samples. In this context, this article describes the main methods for collecting evidence of the character data.

Библиографическая ссылка на статью:
Анисимова Э.С. Методы сбора признаков при распознавании рукописных символов // Современная техника и технологии. 2016. № 3 [Электронный ресурс]. URL: https://technology.snauka.ru/2016/03/9710 (дата обращения: 13.07.2023).

1. Введение

В последние годы одним из самых увлекательных и перспективных направлений исследований в области обработки изображений и распознавания образов являлось распознавание рукописных символов. Некоторые исследователи сосредоточили внимание на новых методах и идеях, которые бы позволили сократить время обработки, а также обеспечили более высокую точность распознавания. В общем случае, распознавание рукописных символов классифицируется на два типа такие, как оффлайн и онлайн. В оффлайн распознавании рукописные символы обычно оцифровываются оптическим сканером и оконченное письмо бывает доступно как изображение. Онлайн методы превосходят противостоящие им оффлайн методы в связи с доступностью временных данных в онлайн методах. Однако разные приложения такие, как сортировка почты, обработка банковских чеков, чтение документов и распознавание почтовых адресов, требуют оффлайн методы распознавания рукописного ввода. Поэтому оффлайн распознавание рукописного ввода продолжает быть активной и перспективной областью исследований и требует изучения новых техник, которые позволили бы улучшить точность распознавания символов.

2. Извлечение признаков

Извлечение признаков по-прежнему является одним из основных строительных блоков системы распознавания рукописных символов. Эффективность системы распознавания главным образом зависит от извлечения эффективных признаков и выбора подходящего классификатора. Этап извлечения признаков анализирует сегментную единицу (часть) текста и выбирает набор признаков, которые могут быть использованы для однозначной идентификации этой единицы. Полученные признаки затем используются как вход в классификатор почерка. Эти признаки являются уменьшенным представлением содержимого изображения, которое сосредоточено на сохранении наиболее важных для задачи идентификации характеристик. Цель извлечения признаков состоит в идентификации шаблонов с помощью минимального числа признаков, эффективных в распознавании классов шаблонов. Методы извлечения признаков главным образом подразделяются на три основные категории:

1. Статистические.

2. Структурные.

3. Глобальные преобразования.

1. Статистические

Представление изображения документа с помощью статистического распределения точек рассматривает изменения стиля до некоторой степени. Обычно это более предпочтительно для легкого извлечения и быстрых вычислений и также, когда не требуется восстановление изображения.

1.1. Зона

Изображение символа подразделяется на блоки, известные как зоны. Когда горизонтальная плоскость разделяется на m линий и вертикальная плоскость на n линий, то число сформированных зон будет mxn. Затем для конкретной области зоны вычисляется средняя интенсивность уровня серого. Зональная интенсивность блока ограничена конкретной областью вместо всего изображения. Форма символа будет однозначно определять каждый набор символов и, следовательно, используется как признак.

 

Рисунок 1. Изображение символов I и Z, зонирование изображений на 9 зон

1.2. Пересечение

Другим популярным статистическим признаком является количество пересечений линейным сегментом контура.

1.3. Проекция

Изображение символа делится на к областей, как показано на рисунке 2, и тогда проекция, взятая в горизонтальном направлении, даст горизонтальную проекцию, и аналогично в вертикальном направлении и по диагонали даст соответственно вертикальную и диагональную проекции, как показано на рисунке 2.

 

Рисунок 2. Пример клеточной проекции. Геометрические фигуры на рисунке представляют бенгальскую цифру восемь в стандартной форме (слева) и в рукописной искаженной форме (справа). Следует заметить, что даже с этими искажениями клеточная проекция обоих символов весьма схожа.

2. Структурные

Разные локальные и глобальные свойства набора изображений символов могут быть представлены геометрическими и топологическими признаками, имеющими высокую устойчивость к стилю почерка и искажению.

2.1. Топологическая структура

Символ представлен выделением и подсчетом разных топологических признаков таких, как точки максимума, минимума и экстремума, ниже и выше порога, количество петель, количество горизонтальных и вертикальных линейных сегментов и концевых точек.

2.2. Геометрические свойства

Символ представляется такими геометрическими свойствами, как отношение ширины к высоте, относительное расстояние от первого пикселя к последнему сверху вниз и может включать пиксельное расстояние от самого левого до самого правого.

2.3. Деревья и графы

Символы преобразуются в набор топологических примитивов, включающих штрихи, петли, точки пересечения, концевые точки и т.д. Затем эти примитивы формируются с использованием атрибутов или графов отношений. Представление этих графов осуществляется двумя методами. Первый метод использует координаты формы символа. Вторым методом является абстрактное представление вершин, соответствующих штрихам, и дуг, соответствующих отношениям между штрихами. Деревья используются для представления символов множеством признаков, имеющих иерархическую связь.

3. Глобальное преобразование

Методы глобального преобразования преобразуют изображение в компактную форму, которая уменьшает размерность признака. Преобразование изображения может быть представлено линейной комбинацией рядов в целом хорошо определенных функций синуса и косинуса. Первые N коэффициентов преобразования Фурье принимаются в качестве характеристического вектора конкретного символа. Так как доступно обратное преобразование, то изображение может быть восстановлено.

3.1. Вейвлет-преобразование

Вейвлет-преобразование – это метод разложения в ряд, который позволяет нам представить сигнал на разных уровнях разрешения. Сегменты изображения документа, которые могут соответствовать буквам или словам, характеризуются вейвлет-коэффициентами, эквивалентными различным уровням разрешения. Эти коэффициенты затем направляются в классификатор для распознавания.


Библиографический список
  1. S. Mori, C.Y. Suen and K. Kamamoto, “Historical review of OCR research and development,” Proc. of IEEE, vol. 80, pp. 1029-1058, July 1992.
  2. N. Arica and F. Yarman-Vural, “An Overview of Character Recognition Focused on Off-line Handwriting”, IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, Vol.31 (2), pp. 216 – 233. 2001.
  3. V.K. Govindan and A.P. Shivaprasad, “Character Recognition – A review,” Pattern Recognition, Vol. 23, no. 7, pp. 671- 683, 1990.
  4. R. Plamondon and S. N. Srihari, “On-line and offline handwritten character recognition: A comprehensive survey,” IEEE. Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, no. 1, pp. 63-84, 2000.
  5. Vipin, Rajeshwar D., Rajni, “Character Recognition using Neural Network”, International Journal of Advanced Trends in Computer Science and Engineering, Vol. 2, No.3, 2013.


Все статьи автора «Анисимова Эллина Сергеевна»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: