Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

THE EXAMINATION OF POSSIBILITIES OF IMAGE RECOGNITION

Aleshkina E.V. 1
1 Voronezh Institute of High Technologies
This paper discusses issues related to image recognition. It is noted that as the most informative stable characteristics of an image, think of their form. Form for the general case is connected with the external shape, the contours of objects. Information about how similar signals for the analyzed image and a particular pattern may occur when they coincide, and is associated with the values of the correlation integral that defines the corresponding functionality. The function represents the energy characteristic, its value is related to brightness and the area visible using a standard image. For the experiment presented three geometric shapes – circle, ellipse and rectangle. Dependence of the functionals on the degree of distortion of the shapes of the figures. Studies have shown that the use of the values of the correlation integral provides a fairly high efficiency of recognition of distorted images.
image recognition
information
correlation integral
standard

В существующих условиях для измерительных и прикладных систем, активным образом применяют цифровое преобразование изображений [1]. На основе цифрового преобразования изображений идет формирование условий для того, чтобы изображения более лучшим образом воспринимались, формировался определенный художественный образ, выделялись информативные признаки (например, это относится к системам распознавания объектов) и т.д. Изображения преобразовывают на основе разных способов, среди которых существуют оптические, фотохимические и цифровые подходы. На основе цифровых подходов возникают все большие возможности вследствие непрерывного роста технических возможностей [2].

Определенные подходы к тому, чтобы исследовались изображения, базируются не только на том, что применяются априорные данные, связанные с оптическими характеристиками изображений, но на том, какие возможности, определяемые реализацией процедур анализа [3, 4].

При анализе разных источников можно отметить те процедуры обработки, которые наиболее частым образом применяются [5-7]: операция свертки для пространственных областей; фильтрация для пространственно-частотных областей; шейдинг-коррекция (при этом яркость выравнивается по полю изображения); осуществление нелинейного амплитудного преобразования по сигналу изображения; проведение операции сопоставления с порогом; проведение бинаризации изображений; реализация ранговой фильтрации; проведение локальных процедур усреднения; реализация градиентных преобразований; осуществление интерполяции изображения для пространственной области; реализация инверсии изображений; проведение анализа для логических связей в изображениях; проведение операций суммирования и вычитание по изображениям; осуществление поиска экстремумов в изображениях.

В качестве наиболее информативной устойчивой характеристики простых изображений считают их формы. Форма для общего случая связана с внешним очертанием, контурами предметов. Такой подход может применяться в разных прикладных областях [8, 9]. То есть, существует специфическая по каждому классу изображений траектория их границ, как замкнутая линия, если рассматривать ее в относительных системах координат.

Информация о том, насколько схожи сигналы i(х, у) и j(х, у) может проявиться, когда они максимально совпадают и связана со значениями корреляционного интеграла

aleh01.wmf (1)

в точке экстремума. Для того, чтобы выявить параметр, содержащий необходимую информацию, была проанализирована зависимость характеристик корреляционного интеграла, определяющего соответствующий функционал, от того, как искажалась форма изображения.

Функционал Кij представляет собой энергетическую характеристику, ее значение связано с яркостью и площадью видимого через эталон изображения. Можно наблюдать ее экстремум для тех случаев, когда эталон полным образом помещается на изображении, при этом необязательно требовать совпадения их формы.

Для эксперимента представлены три геометрические фигуры, изображенные на рис. 1.

alehk1a.tif

а)

alehk1b.tif

б)

alehk1c.tif

в)

Рис. 1. Геометрические фигуры, предъявленные для эксперимента

Требуется определить степень сходства эллипса с прямоугольником и кругом. По изображению v фигур а) и б) с помощью графического редактора Paint формировался эталон j в виде файла в формате Windows BitMap Image размером 30х40 пикселей. Здесь же форму изображения эллипса постепенно изменяли. Затем оценивали сходство полученных изображений i с каждым из эталонов j.

В данном примере эталонным будем считать изображение прямоугольника. Изображение эллипса вписано в прямоугольник так, как показано на рис. 2.

alehk2.tif

Рис. 2. Эллипс, вписанный в прямоугольник

В процессе исследования форма эллипса подвергалась искажению: менялась его высота, длина при этом оставалась фиксированной, то есть равной длине прямоугольника (рис. 3).

Всего было сделано восемь подходов «сжатия». Для каждого полученного изображения определялась степень сходства формы эталона и формы эллипса. Для этого по формуле (1) вычислялось значение корреляционного интеграла Kij. На рис. 4 представлена зависимость функционалов Kij от степени искажения L формы эллипса.

alehk3.tif

Рис. 3. Принцип изменения формы изображения эллипса

На рис. 4 наглядно демонстрируется, что наибольшая степень сходства эллипса с эталоном прослеживается при значении корреляционного интеграла kij(max) = 4,617, то есть при максимальном количестве точек соприкосновения площадей.

alehk4.wmf

Рис. 4. Зависимость показателей сходства формы эллипса с эталоном от степени ее искажения

Далее введем пороговое значение функционала kp = 0,7. Если величина kij больше порога, то предъявленное изображение, соответствующее этому показателю, принадлежит эталону. Это определяет границы эллипса, чтобы он был распознан. Распознавание достигается в случае, когда значение корреляционного интеграла меньше порогового. В противном случае изображение не может быть распознано. В данном примере изображения со значением А > 4 могут быть распознаны.

Проводилось сравнение изображений эллипса и круга. В данном примере эталонным будем считать изображение круга. Изображение эллипса вписано в круг. Как и в предыдущем примере, меняется форма эллипса путем «сжатия», его длина при этом остается фиксированной, то есть равной длине круга (рис. 5).

alehk5.tif

Рис. 5. Принцип изменения формы изображения эллипса

Аналогично предыдущему примеру, производится несколько этапов «сжатия» и для каждого полученного изображения определяется значение корреляционного интеграла Kij. На рис. 6 представлена зависимость функционалов Kij от степени искажения А формы эллипса для данного примера.

alehk6.wmf

Рис. 6. Зависимость показателей сходства формы эллипса с эталоном круга от степени ее искажения

На рис. 6 наглядно демонстрируется, что наибольшая степень сходства эллипса с эталоном прослеживается при значении корреляционного интеграла Kij(max) = 20,55 то есть при максимальном количестве точек соприкосновения площадей.

Далее введем пороговое значение функционала Kp = 0,7. В данном случае распознавание достигается при А > 1.

Сравнение результатов распознавания круга и прямоугольника показывает, что диапазон распознаваемых значений для круга больше.

Таким образом, в качестве показателя сходства изображения и эталона по форме целесообразно использовать значение корреляционного интеграла, который обеспечивает достаточно высокую эффективность распознавания искаженных изображений.

На основе представленного выше алгоритма создан программный продукт, реализующий предложенный принцип распознавания образов.