Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

РАСПОЗНАВАНИЕ НЕОДНОРОДНОСТЕЙ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННОЙ СЕТИ

Старожилова О.В. 1 Захаров К.А. 1
1 ФГБОУ ВО Поволжский государственный университет телекоммуникаций и информатики
В статье рассмативаются задачи идентификации неоднородностей на цифровых изображениях, математическая модель построена на основе нейронного подхода. Задача интерпретации рентгеновских изображений решается в рамках нейросетевого подхода для каждого набора параметров из обучающего множества. Для идентификации векторной функции рассматривается двухслойная нейронная сеть прямого распространения с сигмоидальным скрытым слоем нейронов и линейным выходным слоем. Структура нейронной сети подбирается экспериментально. Обученные нейронные сети были линеаризованы, а коэффициенты полученной линейной модели сравнивались с компонентами эталонных матриц. Фильтрация проводится в пространственной и частотной областях. Разработан алгоритм нейросетевого классификатора, реализующего на аппаратном уровне принципы нейросетевой технологии для распознавания текстуры изображения. Метод оценки изображения учитывает статистику значений пикселей из локального множества, основан на исследовании гистограмм «зоны интереса» и эталона. Разработана методика, обеспечивающая выбор размера ячейки, при сканировании «зон интереса» на цифровых рентгенограммах. Для улучшения качества изображения используется предварительная обработка снимков с использованием полосовых частотных фильтров и преобразованием в псевдоцвета. Гистограммный анализ изображения и сегментация текстур используется для повышения диагностического потенциала изображения. В качестве алгоритма обучения используется алгоритм обратного распространения ошибки.
нейронная сеть
модель
принципы нейросетевой технологии
идентификация неоднородностей
гистограммный анализ.
1. Осадчий, А.С Повышение эффективности рентгенодиагностики путем компьютерной обработки рентгенограмм Текст. / A.C. Осадчий, И.П. Королюк, Ю.Л. Минаев // Врач-аспирант. -2007. -№6. -С. 501-507.
2. Оссовский, С. Нейронные сети для обработки информации / С. Оссовский, пер. с польского под ред. И.Д. Рудинского. М.: Финансы и статистика, 2002. - 344с.
3. Хлесткин А.Ю. Распознавание текстур рентгенографических снимков и УЗИ изображений программными методами Текст. / А.Ю. Хлесткин, В.П. Кривозубов, A.B. Николаева // Инфокоммуникационные технологии. 2006. - № 3. - С. 64-69.
4. Хлесткин А.Ю., Старожилова О.В. Модели слияния рентгеновских и сцинтиграфических изображений в распознавании артефактов //Инфокоммуникационные технологии. – 2010. – № 2. – С. 40–42.
5. Яне, Б. Цифровая обработка изображений / Б. Яне; пер. с англ. А.М: Измайловой. -М.: Техносфера, 2007. -584 с.

На современном этапе развитие технической и медицинской диагностики неразрывно связано с визуализацией внутренних структур объекта. Визуальная аналитика как методв поддержки аналитической работы с данными позволяет наглядно представить большие массивы числовой и другой информации в интуитивно понятной и информативной визуальной форме. Визуализация.по пленочным рентгеновским снимкам не позволяет детально проводить идентификацию артефактов и анализ количественных данных. Актуальность разработки новых методов и моделей цифровой обработки изображений, определяется, прежде всего, возросшими требованиями к качеству и надежности разрабатываемых систем и устройств, созданием перспективных информационных технологий с использованием нейронных сетей.

Существует много различных видов визуализации, например компьютерная томография, ангиография, урография, рентгенография, сцинтиграфия. Нейронные сети представляют собой мощный математический инструмент, показавший свою состоятельность при решении широкого класса задач, таких как распознавание образов, аппроксимация, классификация, прогнозирование. Разработка и обоснование математических, алгоритмических, программноаппаратных средств автоматического обнаружения и идентификации артефактов на сканируемых изображениях имеет существенное значение для создания новых перспективных кластерных программных модулей. Для создания математической модели был предложен метод регуляризации, основанный на теореме Байеса, позволяющий повысить обобщающую способность модели.

Рассматривается математическая модель изображений, в которых значительную часть поля яркости занимает пространственно-протяженный объект. Тогда область изображения можно разбить на две, соответствующие объекту и фону : .

Области D можно поставить в соответствие эталонное изображение, каждый элемент которого определяется в зависимости от его принадлежности области D0 или :

Используя данное представление, можно получить модель нормализуемого изображения в виде следующего соотношения:

где , -центрированные однородные случайные поля с заданными автоковариационными функциями, v(n1, n2) - шумовая составляющая наблюдаемого изображения, и — параметры яркостного преобразования изображения относительно эталона. Величина является контрастом между объектом и фоном (разность между их средними значениями), а величина — средней яркостью фона. Построена математеческая модель, использующая метод Бардина-Терсоффа-Хаманна, основана на первопринципном расчете структуры поверхности.

При исследовании рентгеновских изображений необходимо рассмотреть процесс формирования цифрового изображения в пространственной и Фурье-области. Как правило, процесс формирования цифрового изображения приводит к размытию изображения, мелкие детали теряются, наблюдаются помехи различного происхождения. Поэтому возникает необходимость максимально учесть эти факторы при разработке моделей изображений.

Преобразование в цифровую форму означает, что дискретизация изображения происходит в определенных точках дискретной сетки . Если ограничить рассмотрение прямоугольными сетками размерами , где – число строк, – число столбцов, то эти точки можно записать:

при

где – упорядоченный кортеж, комплекснозначный вектор.

Как правило, интенсивность освещенности не накапливается точно в этих точках, а в определенной области вокруг них. Тогда сигнал в узлах сетки является интегралом:

,

где – изображение различной яркости, которое могло бы получиться с помощью оптической системы.

Операция включает свертку с прямоугольной функцией и дискретизацию в узлах сетки. Следовательно, процесс формирования изображений в пространственной области и Фурье-области описывается с помощью следующей операции:

где и – результирующие и обратное преобразование Фурье соответственно [5].

Процесс формирования цифрового изображения приводит к размыванию снимка, в Фурье-пространстве это ведет к ослаблению высоких волновых чисел, формируется результирующее яркостное изображение с ограниченной полосой пропускания. В процессе формирования изображений в пространственной области 2-х мерного сигнала могут вноситься искажения, а, следовательно, необходима коррекция.

Однако особенность процесса дискретизации означает, что теряется вся информация, за исключением узлов сетки. Математически этот процесс состоит в умножении непрерывной функции на функцию, которая равна нулю везде, за исключением узлов сетки. Эта операция может выполняться с помощью умножения функции изображения на сумму -функций, размещенных в узлах сетки .

Дискретизацию можно выразить как

где при и – узлы так называемой обратной сетки.

Плотная дискретизация приводит к крупной сетке в Фурье-пространстве и наоборот. Следовательно, дискретизация приводит к воспроизведению спектра изображения в каждом узле сетки в Фурье-пространстве.

Если спектр изображения является настолько протяженным, что части его перекрываются с периодически повторяемыми копиями, тогда перекрывающиеся части чередуются.

Надежное условие для исключения наложения состоит в следующем: спектр должен ограничиваться областью, которая имеет протяженность вокруг центрального узла сетки вплоть до линий, разбивающих область между центральным узлом сетки и всеми остальными узлами [1].

Использование классических нейронных сетей для распознавания изображений затруднено, как правило, большой размерностью вектора входных значений нейронной сети, большим количеством нейронов в промежуточных слоях и, как следствие, большими затратами вычислительных ресурсов на обучение и вычисление сети.

Входное изображение пикселей имеет 625 нейронов во входном слое. Кроме того задача распознавании ренгенографических образов часто требует классификации изображений, превышающих размер пикселей, а также учет топологии входного изображения. Будем говорить, что задача идентификации решена успешно, если значение невязки выхода построенной модели с наблюдаемым выходом реального объекта не превосходит заранее заданной величины невязки .

Для идентификации векторной функции рассматриваем двухслойную нейронную сеть прямого распространения с сигмоидальным скрытым слоем нейронов и линейным выходным.

Сверточным нейронным сетям в меньшей степени присущи описанные выше недостатки. Часть нейронов некоторого рассматриваемого слоя нейронной сети может использовать одни и те же весовые коэффициенты. Нейроны, использующие одни и те же веса, объединяются в карты признаков, а каждый нейрон карты признаков связан с частью нейронов предыдущего слоя. При вычислении сети получается, что каждый нейрон выполняет свертку (операцию конволюции) некоторой области предыдущего слоя (определяемой множеством нейронов, связанных с данным нейроном).

Помимо, сверточных слоев в сверточной нейронной сети могут быть слои субдискретизации (выполняющие функции уменьшения размерности пространства карт признаков) и полносвязные слои. Все три вида слоев могут чередоваться в произвольном порядке, что позволяет составлять карты признаков из карт признаков, а это на практике означает способность распознавания сложных иерархий признаков.

Структура нейронной сети подбирается экспериментально. Расширенное на одну строку и один столбец входное изображение, содержащееся в первом слоев, подается на вход сверточному слою, состоящему из 20 карт признаков размером каждая. Каждый нейрон выполняет операцию свертки части входного изображения. Так как каждый нейрон из некоторой произвольно выбранной карты признаков выполняет свертку с ядром части изображения размером пикселей, то все изображение разбивается на перекрывающиеся области пикселей. Перекрытие составляет 3 пикселя, отсюда по вертикали имеем 7 областей пикселей, по горизонтали 4 области пикселей, отсюда, размерность карты признаков — нейронов.

Выходные значения нейронов сверточного слоя подаются на вход полносвязному слою (каждой связи между нейронами соответствует уникальный весовой коэффициент). Выходной слой также является полносвязным. Обучение нейронной сети требует качественной и большой выборки. Если не удалось определить, что за символ включает изображение, это изображению выставлялся в соответствие произвольный класс. В итоге, подготовлены пары класса изображение/метка.

К изображениям были применены искажающие преобразования: операции масштабирования; обрезка границ изображения и приведение изображения с обрезанными границами к заданному размеру с билинейной интерполяцией; эрозия и дилатация случайных прямоугольных регионов всего изображения. Компьютерная обработка цифрового изображения предоставляет возможность изменять пространственное разрешение, что повышает диагностическую информативность.

В качестве алгоритма обучения использовался алгоритм обратного распространения ошибки. Для ускорения обучения использовался стохастический вариант метода Левенберга-Марквардта.

Изображение, пропускается через серию свёрточных, нелинейных слоев, слоев объединения и полносвязных слоёв, и генерируется вывод-класс описывающий изображение. Вводное изображение — это матрица с пиксельными значениями [2]. Глубина у фильтра должна быть такой же, как и глубина вводного изображения, и размеры этого фильтра — . После прохождения фильтра по всем позициям получается матрица карта признаков .

Нейронная сеть достигла способности распознавать все изображения, ошибка составляет 2%. Тестирование нейронной сети проводилось на изображениях тестовой выборки: ошибка распознавания составила 6% [3].

После того, как построено обучающее множество, выбраны метод оценки функционирования нейронной сети и метод обучения, необходимо определиться с количеством нейронов в скрытом слое. Было проведено исследование, выявляющее зависимость между точностью модели, полученной в результате идентификации, и количества нейронов на скрытом слое. Для этого нейронные сети с различным количеством нейронов были обучены на одном и том же множестве.

Обученные нейронные сети были линеаризованы, а коэффициенты полученной линейной модели сравнивались с компонентами эталонных матриц. Полученные результаты для оценки параметров качества и идентификации изображения использованы для создания кластеров изображений, в основе которых лежит аппарат нейронных сетей, позволяющий в реальном масштабе времени осуществлять распознавание неоднородностей на лучевых изображениях, применяемых при обучении нейронной сети.

Разработана методика, обеспечивающая выбор размера ячейки при сканировании «зон интереса» на цифровых рентгенограммах; предложен алгоритм обработки изображений с оптимальными параметрами, с использованием сверточных нейронных сетей. Алгоритмы реализуется в построчно-столбцовой форме. С ростом количества сигмоидальных нейронов скрытого слоя увеличивается точность результатов идентификации.

Для улучшения качества изображения используется предварительная обработка снимков с использованием полосовых частотных фильтров и преобразованием в псевдоцвета [4]. Простая «однородная» структура делает их привлекательными для практического использования и аппаратной реализации.


Библиографическая ссылка

Старожилова О.В., Захаров К.А. РАСПОЗНАВАНИЕ НЕОДНОРОДНОСТЕЙ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННОЙ СЕТИ // Международный студенческий научный вестник. – 2018. – № 1. ;
URL: https://eduherald.ru/ru/article/view?id=18114 (дата обращения: 07.12.2021).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074