УДК 004.021: 004.932

ОБ ОДНОМ МЕТОДЕ ОЧИСТКИ ФОНА В ОТСКАНИРОВАННЫХ ДОКУМЕНТАХ

Дмитриев Владислав Леонидович1, Мухаметова Лилия Каримовна1
1Стерлитамакский филиал Башкирского государственного университета

Аннотация
В статье рассматривается проблема очистки фона в изображениях, содержащих отсканированные документы. Предложен метод, основанный на количественном анализе цветовых оттенков точек изображения, в котором используется распределение точек по оттенкам в полях документа. Приведено два варианта реализации описываемого метода на практике, выполнено сравнение эффективности обоих вариантов метода.

Ключевые слова: обработка сканированных изображений, поля документа, устранение шума, цветовой оттенок


ABOUT ONE METHOD OF CLEANING BACKGROUND IN SCANNED DOCUMENTS

Dmitriev Vladislav Leonidovich1, Mukhametova Liliya Karimovna1
1Sterlitamak branch of the Bashkir state University

Abstract
The article discusses the problem of cleaning of the background in images containing scanned documents. The proposed method is based on the quantitative analysis of color shades of pixels in the image, in which uses the distribution of dots on the shades in the margins of your document. Given two realizations of the described method in practice, the made compared the efficiency of both variants of the method.

Библиографическая ссылка на статью:
Дмитриев В.Л., Мухаметова Л.К. Об одном методе очистки фона в отсканированных документах // Современная техника и технологии. 2016. № 1 [Электронный ресурс]. URL: https://technology.snauka.ru/2016/01/8956 (дата обращения: 20.07.2023).

В настоящее время достаточно актуально стоит вопрос оцифровки бумажных документов, например, в сфере деятельности архивных учреждений с целью сохранения документов архивного фонда требуется создание их электронных копий. Под оцифровкой документов понимают процесс перевода документов из традиционной (бумажной) формы в электронный (цифровой) вид с помощью специальных технических средств.

Как правило, после сканирования полученные копии документов практически всегда требуют дополнительной обработки: уменьшение или полное исключение шумовой составляющей (очистка фона документа), настройка яркости и контрастности, удаление различной посторонней информации (пятен, возможных сторонних записей, и т.д.), восстановление поврежденных участков (имевших место на исходном бумажном носителе), распознавание текста и графики, и т.д.

Для осуществления дополнительной обработки могут быть использованы такие программы, как Abbyy FineReader, Adobe Photoshop, ScanKromsator [8], Neat Image Pro+, и другие.

Одним из основных видов обработки полученных электронных копий документов является очистка фона документа (исключение шумовой составляющей). Если полезная информация (текст, графика) сильно контрастирует с фоновым шумом, то в таком случае шум может быть достаточно легко исключен путем изменения яркости и контрастности изображения. Однако в большинстве случаев такой простой подход оказывается не эффективным, и вместе с удалением шума приводит к утрате части полезной информации. В таком случае приходится использовать более сложные процедуры по удалению шума, часть из которых будут требовать выполнения некоторых операций в ручном режиме. Стоит также отметить, что существующие программы по исключению шумовой составляющей достаточно эффективны лишь для черно-белых изображений или изображений в оттенках серого цвета. Работа с цветными копиями приводит к ряду дополнительных трудностей.

В представленной работе предложен метод исключения шумовой составляющей, основанный на количественном анализе оттенков пикселей, составляющих изображение. В общем случае метод позволяет работать с цветными изображениями в формате RGB. Метод представлен в двух вариантах.

Рассмотрим первый вариант предлагаемого метода.

Очевидно, что в большинстве случаев для изображений, содержащих текст и простую научную графику (графики функциональных зависимостей, диаграммы, экспериментальные кривые, и т.д.), основная часть пикселей изображения как раз и представляет собой шумовую составляющую. Именно такие пиксели, состоящие из наиболее часто встречающихся оттенков, и нужно будет исключать.

Поэтому метод сводится к поиску во всем изображении пикселей, цвета которых наиболее часто встречаются в изображении. Так как изображение может оказаться достаточно большим, то поиск таких пикселей может быть достаточно медленным. Поэтому его необходимо организовать более эффективно [2].

При программной реализации способа эффективность достигается введением трехмерного массива размером 256×256×256, в который помещается информация о количестве пикселей, имеющих оттенки R, G и B (этим и обусловлено введение трехмерного массива). Для быстрого перебора пикселей изображения будем использовать свойство битовой карты TBitMap – ScanLine [3, 4]. Это свойство представляет собой массив указателей на строки с данными битовой карты (строки точечного изображения). Само значение свойства ScanLine изменить нельзя (оно доступно только для чтения), но можно изменить данные, на которые оно указывает. Таким образом, мы получаем цвет пикселя непосредственно из области памяти, в которую записано изображение, что существенно ускоряет процесс анализа изображения.

Процесс исключения пикселей можно выполнять или в ручном, или в автоматическом режиме. Для ручного режима процесс поиска можно прекращать, когда изображение визуально уже практически не содержит шума. При автоматическом режиме поиска и исключения шума необходимо ввести некоторый критерий, по достижении которого процесс нужно завершать. Таким критерием может выступать, например, максимальное количество пикселей, состоящих из определенных оттенков.

Рассмотрим теперь второй вариант предлагаемого метода.

Как правило, любой документ, представленный на бумажном носителе, имеет поля того или иного размера. После сканирования документа его поля будут содержать информацию, которую можно использовать для исключения шума – пиксели полей изображения документа и будут являться шумом.

Поэтому второй вариант метода заключается в рассмотрении пикселей, расположенных на полях документа и последующем исключении из всего изображения пикселей, имеющих тот же цвет, что и пиксели полей документа.

При программной реализации метода предусмотрено указание полей документа в ручном режиме для последующего автоматического исключения цветов пикселей полей из всего документа. В программу также введены инструменты, позволяющие выделять области (в том числе произвольной формы) в любой части документа, содержащие шум. Возможность выделения областей позволяет существенно улучшить качество итогового изображения в случае неравномерного распределения шума по изображению. На практике чаще всего бывает достаточно воспользоваться инструментами выделения областей не более 3-5 раз.

Во многих случаях второй вариант метода оказывается более эффективным и позволяет очень быстро исключать шумовую составляющую из изображения. В случае необходимости можно комбинировать оба варианта описанного метода.

Оба варианта рассмотренного выше метода реализованы в виде программного продукта на языке визуального программирования Delphi. Программа позволяет работать с файлами формата JPEG и BMP.

Ниже на рис. 1-8 показаны исходные изображения отсканированных документов (рис. 1, 3, 5, 7) и результаты обработки на основе описанных алгоритмов (рис. 2, 4, 6, 8). Результаты, представленные на рис. 2 и 4 получены комбинированием обоих вариантов метода. Расчеты также проводились на копиях работ [1, 5, 6].


Рис. 1. Пример 1: исходное изображение документа


Рис. 2. Пример 1: обработанное изображение документа после исключения шума


Рис. 3. Пример 2: исходное изображение документа


Рис. 4. Пример 2: обработанное изображение документа после исключения шума


Рис. 5. Пример 3: исходное изображение документа


Рис. 6. Пример 3: обработанное изображение документа после исключения шума


Рис. 7. Пример 4: исходное изображение документа

На рис. 8 показан результат обработки документа [7] только на основе данных из полей изображения документа (второй вариант метода). Видно, что оба варианта дают вполне хорошие результаты, однако рис. 6 и 8 все еще содержат некоторый шум. Повторное принудительное применение к изображению рис. 6 и 8 первого варианта метода приведет к некоторой потере полезной информации, т.к. наиболее часто встречающиеся цвета пикселей изображения уже будут соответствовать графикам и символам.


Рис. 8. Пример 4: обработанное изображение документа после исключения шума на основе данных из полей документа

Практические результаты применения метода говорят о том, что для получения изображения, практически лишенного шумовой составляющей, может потребоваться комбинация обоих вариантов предложенного метода. Тем не менее, во многих случаях оказывается достаточным использование второго варианта метода, основанного на использовании данных из полей документа. Использование инструментов выделения областей позволяет быстро и относительно просто исключить шум даже на сильно зашумленных изображениях.


Библиографический список
  1. Гималтдинов И.К., Дмитриев В.Л., Ситдикова Л.Ф. Динамика звуковых волн в насыщенных парогазовой смесью пористых средах // ТВТ. 2014. Т. 52. № 4. – С. 572.
  2. Дмитриев В.Л. Об эффективных алгоритмах решения ряда задач при обучении программированию // Профильная школа. 2014. Т. 2. № 3. – С. 19-26.
  3. Дмитриев В.Л. Модификация LSB-метода на основе последовательностей особенных точек изображения // Отраслевые аспекты технических наук. 2013. № 12. – С. 17-20.
  4. Дмитриев В.Л. Защита сетевых публикаций на основе динамически изменяющихся изображений // Отраслевые аспекты технических наук. 2014. № 6. – С. 15-19.
  5. Дмитриев В.Л., Потапов А.А. Закачка в пласт горячего газа как энергоэффективный способ разработки газогидратного месторождения // Электронный научный журнал “ФИЗ-МАТ”. 2013. № 4. – С. 3-12.
  6. Дмитриев В.Л., Потапов А.А. Инжекция горячего газа как энергоэффективный способ добычи газа из газогидратного месторождения // Сборник научных трудов II Всероссийской научно-технической конференции с международным участием «Высокие технологии в современной науке и технике». Т.2. – Томск: Изд-во Томского политехнического университета. 2013. – С. 365-368.
  7. Шагапов В.Ш., Насырова Л.А., Потапов А.А., Дмитриев В.Л. Тепловой удар под воздействием энергии излучения на пористую среду, частично заполненную газогидратом // Инженерно-физический журнал. 2003. Т.76. №5. – С. 47-53.
  8. Создание электронных книг из сканов djvu или pdf из бумажной книги. [Электронный ресурс]. – Режим доступа: http://www.slideshare.net/ssuser8c4412/ss-7408123


Все статьи автора «Дмитриев Владислав Леонидович»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: