Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

RECOGNITION OF HETEROGENEITIES ON DIGITAL REPRESENTATIONS WITH THE USE OF NEURAL NETWORK

Starozhilova O.V. 1 Zakharov K.A. 1
1 Federal State Budget Educational Institution of Higher Education «Povolzhskiy State University of Telecommunications and Informatics»
In the article problems of identification of heterogeneities on digital images are considered, the mathematical model is constructed on the basis of the neural approach. The task of interpreting X-ray images is solved within the neural network approach for each set of parameters from the learning set. To identify the vector function, a two-layer neural network of direct propagation with a sigmoidal hidden layer of neurons and a linear output layer is considered. The structure of the neural network is selected experimentally. Trained neural networks were linearized, and the coefficients of the obtained linear model were compared with the components of the reference matrices. Filtering is carried out in the spatial and frequency domains. An algorithm of a neural network classifier has been developed that implements at the hardware level the principles of neural network technology for image texture recognition. The image estimation method takes into account the statistics of the pixel values from the local set, based on the study of the histograms of the "zone of interest" and the standard. A technique has been developed that ensures the selection of the cell size when scanning the "zones of interest" on digital radiographs. To improve image quality, pre-processing of pictures using band-pass frequency filters and conversion in a pseudocolor is used. Histogram analysis of the image and texture segmentation is used to increase the diagnostic potential of the image. As the learning algorithm, the back propagation algorithm is used.
neural network
model
principles of нейросетевой technology
authentication of heterogeneities
histogram analysis.

На современном этапе развитие технической и медицинской диагностики неразрывно связано с визуализацией внутренних структур объекта. Визуальная аналитика как методв поддержки аналитической работы с данными позволяет наглядно представить большие массивы числовой и другой информации в интуитивно понятной и информативной визуальной форме. Визуализация.по пленочным рентгеновским снимкам не позволяет детально проводить идентификацию артефактов и анализ количественных данных. Актуальность разработки новых методов и моделей цифровой обработки изображений, определяется, прежде всего, возросшими требованиями к качеству и надежности разрабатываемых систем и устройств, созданием перспективных информационных технологий с использованием нейронных сетей.

Существует много различных видов визуализации, например компьютерная томография, ангиография, урография, рентгенография, сцинтиграфия. Нейронные сети представляют собой мощный математический инструмент, показавший свою состоятельность при решении широкого класса задач, таких как распознавание образов, аппроксимация, классификация, прогнозирование. Разработка и обоснование математических, алгоритмических, программноаппаратных средств автоматического обнаружения и идентификации артефактов на сканируемых изображениях имеет существенное значение для создания новых перспективных кластерных программных модулей. Для создания математической модели был предложен метод регуляризации, основанный на теореме Байеса, позволяющий повысить обобщающую способность модели.

Рассматривается математическая модель изображений, в которых значительную часть поля яркости занимает пространственно-протяженный объект. Тогда область изображения можно разбить на две, соответствующие объекту и фону : .

Области D можно поставить в соответствие эталонное изображение, каждый элемент которого определяется в зависимости от его принадлежности области D0 или :

Используя данное представление, можно получить модель нормализуемого изображения в виде следующего соотношения:

где , -центрированные однородные случайные поля с заданными автоковариационными функциями, v(n1, n2) - шумовая составляющая наблюдаемого изображения, и — параметры яркостного преобразования изображения относительно эталона. Величина является контрастом между объектом и фоном (разность между их средними значениями), а величина — средней яркостью фона. Построена математеческая модель, использующая метод Бардина-Терсоффа-Хаманна, основана на первопринципном расчете структуры поверхности.

При исследовании рентгеновских изображений необходимо рассмотреть процесс формирования цифрового изображения в пространственной и Фурье-области. Как правило, процесс формирования цифрового изображения приводит к размытию изображения, мелкие детали теряются, наблюдаются помехи различного происхождения. Поэтому возникает необходимость максимально учесть эти факторы при разработке моделей изображений.

Преобразование в цифровую форму означает, что дискретизация изображения происходит в определенных точках дискретной сетки . Если ограничить рассмотрение прямоугольными сетками размерами , где – число строк, – число столбцов, то эти точки можно записать:

при

где – упорядоченный кортеж, комплекснозначный вектор.

Как правило, интенсивность освещенности не накапливается точно в этих точках, а в определенной области вокруг них. Тогда сигнал в узлах сетки является интегралом:

,

где – изображение различной яркости, которое могло бы получиться с помощью оптической системы.

Операция включает свертку с прямоугольной функцией и дискретизацию в узлах сетки. Следовательно, процесс формирования изображений в пространственной области и Фурье-области описывается с помощью следующей операции:

где и – результирующие и обратное преобразование Фурье соответственно [5].

Процесс формирования цифрового изображения приводит к размыванию снимка, в Фурье-пространстве это ведет к ослаблению высоких волновых чисел, формируется результирующее яркостное изображение с ограниченной полосой пропускания. В процессе формирования изображений в пространственной области 2-х мерного сигнала могут вноситься искажения, а, следовательно, необходима коррекция.

Однако особенность процесса дискретизации означает, что теряется вся информация, за исключением узлов сетки. Математически этот процесс состоит в умножении непрерывной функции на функцию, которая равна нулю везде, за исключением узлов сетки. Эта операция может выполняться с помощью умножения функции изображения на сумму -функций, размещенных в узлах сетки .

Дискретизацию можно выразить как

где при и – узлы так называемой обратной сетки.

Плотная дискретизация приводит к крупной сетке в Фурье-пространстве и наоборот. Следовательно, дискретизация приводит к воспроизведению спектра изображения в каждом узле сетки в Фурье-пространстве.

Если спектр изображения является настолько протяженным, что части его перекрываются с периодически повторяемыми копиями, тогда перекрывающиеся части чередуются.

Надежное условие для исключения наложения состоит в следующем: спектр должен ограничиваться областью, которая имеет протяженность вокруг центрального узла сетки вплоть до линий, разбивающих область между центральным узлом сетки и всеми остальными узлами [1].

Использование классических нейронных сетей для распознавания изображений затруднено, как правило, большой размерностью вектора входных значений нейронной сети, большим количеством нейронов в промежуточных слоях и, как следствие, большими затратами вычислительных ресурсов на обучение и вычисление сети.

Входное изображение пикселей имеет 625 нейронов во входном слое. Кроме того задача распознавании ренгенографических образов часто требует классификации изображений, превышающих размер пикселей, а также учет топологии входного изображения. Будем говорить, что задача идентификации решена успешно, если значение невязки выхода построенной модели с наблюдаемым выходом реального объекта не превосходит заранее заданной величины невязки .

Для идентификации векторной функции рассматриваем двухслойную нейронную сеть прямого распространения с сигмоидальным скрытым слоем нейронов и линейным выходным.

Сверточным нейронным сетям в меньшей степени присущи описанные выше недостатки. Часть нейронов некоторого рассматриваемого слоя нейронной сети может использовать одни и те же весовые коэффициенты. Нейроны, использующие одни и те же веса, объединяются в карты признаков, а каждый нейрон карты признаков связан с частью нейронов предыдущего слоя. При вычислении сети получается, что каждый нейрон выполняет свертку (операцию конволюции) некоторой области предыдущего слоя (определяемой множеством нейронов, связанных с данным нейроном).

Помимо, сверточных слоев в сверточной нейронной сети могут быть слои субдискретизации (выполняющие функции уменьшения размерности пространства карт признаков) и полносвязные слои. Все три вида слоев могут чередоваться в произвольном порядке, что позволяет составлять карты признаков из карт признаков, а это на практике означает способность распознавания сложных иерархий признаков.

Структура нейронной сети подбирается экспериментально. Расширенное на одну строку и один столбец входное изображение, содержащееся в первом слоев, подается на вход сверточному слою, состоящему из 20 карт признаков размером каждая. Каждый нейрон выполняет операцию свертки части входного изображения. Так как каждый нейрон из некоторой произвольно выбранной карты признаков выполняет свертку с ядром части изображения размером пикселей, то все изображение разбивается на перекрывающиеся области пикселей. Перекрытие составляет 3 пикселя, отсюда по вертикали имеем 7 областей пикселей, по горизонтали 4 области пикселей, отсюда, размерность карты признаков — нейронов.

Выходные значения нейронов сверточного слоя подаются на вход полносвязному слою (каждой связи между нейронами соответствует уникальный весовой коэффициент). Выходной слой также является полносвязным. Обучение нейронной сети требует качественной и большой выборки. Если не удалось определить, что за символ включает изображение, это изображению выставлялся в соответствие произвольный класс. В итоге, подготовлены пары класса изображение/метка.

К изображениям были применены искажающие преобразования: операции масштабирования; обрезка границ изображения и приведение изображения с обрезанными границами к заданному размеру с билинейной интерполяцией; эрозия и дилатация случайных прямоугольных регионов всего изображения. Компьютерная обработка цифрового изображения предоставляет возможность изменять пространственное разрешение, что повышает диагностическую информативность.

В качестве алгоритма обучения использовался алгоритм обратного распространения ошибки. Для ускорения обучения использовался стохастический вариант метода Левенберга-Марквардта.

Изображение, пропускается через серию свёрточных, нелинейных слоев, слоев объединения и полносвязных слоёв, и генерируется вывод-класс описывающий изображение. Вводное изображение — это матрица с пиксельными значениями [2]. Глубина у фильтра должна быть такой же, как и глубина вводного изображения, и размеры этого фильтра — . После прохождения фильтра по всем позициям получается матрица карта признаков .

Нейронная сеть достигла способности распознавать все изображения, ошибка составляет 2%. Тестирование нейронной сети проводилось на изображениях тестовой выборки: ошибка распознавания составила 6% [3].

После того, как построено обучающее множество, выбраны метод оценки функционирования нейронной сети и метод обучения, необходимо определиться с количеством нейронов в скрытом слое. Было проведено исследование, выявляющее зависимость между точностью модели, полученной в результате идентификации, и количества нейронов на скрытом слое. Для этого нейронные сети с различным количеством нейронов были обучены на одном и том же множестве.

Обученные нейронные сети были линеаризованы, а коэффициенты полученной линейной модели сравнивались с компонентами эталонных матриц. Полученные результаты для оценки параметров качества и идентификации изображения использованы для создания кластеров изображений, в основе которых лежит аппарат нейронных сетей, позволяющий в реальном масштабе времени осуществлять распознавание неоднородностей на лучевых изображениях, применяемых при обучении нейронной сети.

Разработана методика, обеспечивающая выбор размера ячейки при сканировании «зон интереса» на цифровых рентгенограммах; предложен алгоритм обработки изображений с оптимальными параметрами, с использованием сверточных нейронных сетей. Алгоритмы реализуется в построчно-столбцовой форме. С ростом количества сигмоидальных нейронов скрытого слоя увеличивается точность результатов идентификации.

Для улучшения качества изображения используется предварительная обработка снимков с использованием полосовых частотных фильтров и преобразованием в псевдоцвета [4]. Простая «однородная» структура делает их привлекательными для практического использования и аппаратной реализации.