Электронный научный журнал
Международный студенческий научный вестник
ISSN 2409-529X

ПРИМЕНЕНИЕ ШИРОКОМАСШТАБНОГО АЛГОРИТМА SLAM ДЛЯ ИЗМЕРЕНИЯ РАСПОЛОЖЕНИЯ ОБЪЕКТА

Айрапетов Д.П. 1
1 ФГБОУ ВО «Московский технический университет связи и информатики»
В статье проведён анализ метода  использования алгоритма SLAM. Рассмотрены ключевые этапы построения данной технической системы. Работа ориентирована на дальнейшее продолжение, основанное на проведённом анализе и базовой реализации. Рассмотрены технические средства реализации проекта. Перечислены основные принципы реализации метода. Произведена работа над изучением простой модели движения объекта. Рассматриваемые этапы представляют собой разработку алгоритмов и программного обеспечения. Показан пример использования нейронных сетей при выполнении поставленных задач. Рассмотрены рекомендации по использованию оборудования, разработке и эксплуатации системы. Сделаны выводы по результатам проведённой работы, на основе которых будут приняты последующие решения. Конечный продукт должен быть запущен с помощью аппаратуры Raspberry Pi3. Научный руководитель – к.т.н., с.н.с. кафедры ИСУиА Буянов Б.Я.
SLAM
движение
объект
нейронная сеть
локализация
1. Davison A.J. Real-Time Simultaneous Localisation and Mapping with a Single Camera.
2. Володин Ю.И. Телевизионная система объемного зрения для управления движением мобильного робота: дис. ... канд. техн. наук: 05.02.05: защищена 04.06.11 / Володин Юрий Сергеевич. – М., 2011. – 209 с.
3. LeCun Y., Bottou L., Bengio Y., Haffner P. Gradient-Based Learning Applied to Document Recognition // Proceedings of the IEEE, 86(11): 2278–2324.
4. RoboMe [Электронный ресурс] // URL: http://robome.ru/tehnicheskoe_zrenie (дата обращения: 11.12.2017).
5. Петрова Т.В. Машинное зрение. Математические машины и системы. – 2009. – №4. – С. 18.
6. Хабрахабр. Vision-based SLAM: монокулярный SLAM. – Режим доступа: https://habrahabr.ru/company/singularis/blog/277537/ (дата обращения 14.12.2017 г.).
7. Thrun S., Montemerlo M., Koller D., Wegbreit B., Nieto J., Nebot E. FastSLAM: an efficient solution to the simultaneous localization and mapping problem with unknown data association // Journal of Machine Learning Research, 2004.
8. Круглов В.В., Борисов В.В. – Искусственные нейронные сети. Теория и практика. – 2–е изд., стереотип. – М.: Горячая линия-Телеком, 2002. – 382 с.
9. Raspberry Pi 3. Обзор и начало работы. – Режим доступа: http://dmitrysnotes.ru/raspberry-pi-3–obzor-i-nachalo-raboty/ (дата обращения: 19.12.2017).

Технология LSD-SLAM – подход к локализации и сопоставлению на основе ключевого кадра, который основывается на следующих этапах [1]:

• движение камеры отслеживается в направлении опорного ключевого кадра на карте. Новые ключевые кадры генерируются, если камера слишком далеко отошла от существующих ключевых кадров;

• глубина (расстояние) в текущем эталонном ключевом кадре оценивается из стерео соответствий на основе отслеживаемого движения (временное стерео) [2];

• позиции ключевых кадров выполнены глобально согласованными с помощью взаимного прямого выравнивания изображений и оптимизации алгоритма графического позиционирования.

Для реализации требуется персональный компьютер на базе операционной системы Ubuntu, веб-камера, дополнительные программные пакеты.

В Stereo LSD-SLAM глубина в ключевых кадрах дополнительно оценивается непосредственно из статического стерео. Существует целый ряд преимуществ этого подхода: полагаться исключительно на временные или исключительно на статическую стереосистему. Статическая стереосистема позволяет оценивать абсолютный масштаб мира и не зависит от движения камеры. Тем не менее, статическое стерео ограничено постоянной базой (с во многих случаях фиксированным направлением), что эффективно ограничивает производительность до определенного диапазона [3].

air1.tif

Рис. 1. Работа SLAM

Временная стереосистема не ограничивает производительность до определенного диапазона. Один и тот же датчик может использоваться в очень малых и очень больших средах и легко перемещаться между ними. С другой стороны, он не обеспечивает масштабирование и требует передвижения камеры [4]. Дополнительным преимуществом сочетания временной и статической стереосистемы является то, что доступно несколько базовых направлений: в то время как статическое стерео обычно имеет горизонтальную базовую линию, что не позволяет оценить глубину вдоль горизонтальных кромок, временное стерео позволяет завершить карту глубины, обеспечивая другое движение направления [5].

Основные принципы реализации метода (алгоритма):

• обобщение LSD-SLAM на стереокамере, комбинируя временное и статическое стерео в прямом, режиме SLAM в режиме реального времени;

• моделирование изменения освещения при прямом выравнивании изображений, что повышает надёжность метода;

• систематическая оценка двух базовых наборов данных из полученных изображений.

air2.tif

Рис. 2. Графическая реализация алгоритма SLAM на собственном примере

Простая модель обучения на основе движения

Визуальное моделирование подвижного объекта-наблюдателя производится с помощью свёрточной нейронной сети (CNN) [6]. Объект оптимизирует его визуальные представления, минимизируя ошибку преобразований камеры, полученной при его передвижении на основе предсказания. Выполнение этой задачи эквивалентно обучению нейронной сети с двумя потоками, принимающей два изображения в качестве входных данных и предсказывает перемещение, чему объект подвергался, когда он перемещался между по X и Y, из которых два изображения были получены. Чтобы узнать полезные визуальные представления, агент постоянно выполняет эту задачу (в зависимости от окружающей обстановки) [7].

Рассматриваются разные варианты предварительной оценки для оценки полезности изученных функций. Перфекционирование – процесс оптимизации значений случайно инициализированной нейронной сети для вспомогательной задачи, которая не совпадает с целевым преобразованием камеры из пар изображений.

Движение объекта эквивалентно перемещению камеры. Перемещение ставится, как проблема прогнозирования [8].

air3.tif

Рис. 3. Изучение перемещения для контроля визуальных функций. Мобильный объект, оборудованный визуальными датчиками, получает последовательность изображений в качестве входных данных во время движения

air4.tif

Рис. 4. Программная реализация

air5.tif

Рис. 5. Графический анализ движения с помощью прогаммы «SLAM Tuning»

Микрокомпьютер Raspberry Pi3

Микрокомпьютер Raspberry Pi3 считается хорошим аппаратным устройством для реализации конечного продукта ввиду своих небольших размеров и быстродействия [9].

Что представляет из себя Raspberry Pi 3 Model B в техническом плане:

• SoC: Broadcom BCM2837;

• Процессор: ARM Cortex-A53 (4 ядра);

• Графический процессор: Broadcom VideoCore IV;

• Оперативная память: 1Гб LDDR2;

• Встроенные адаптеры: 10/100Мбит Ethernet;

• Bluetooth 4.1 LE, Wi-Fi 802.11n

air6.tif

Рис. 6. Микрокомпьютер Raspberry Pi3

Для разработки рекомендуется использовать пакеты Keras, Theano. Взаимодействие с ними пользователя происходит через систему Linux (Ubuntu). Персональный компьютер – база для разработки алгоритма, который в будущем предстоит транспортировать в память микрокомпьютера.

Заключение

Исследование показало, что базовая реализация алгоритма SLAM возможна при использовании среднестатистического оборудования. В дальнейшем, считается целесообразным использовать аппаратуру с большей вычислительной способностью.


Библиографическая ссылка

Айрапетов Д.П. ПРИМЕНЕНИЕ ШИРОКОМАСШТАБНОГО АЛГОРИТМА SLAM ДЛЯ ИЗМЕРЕНИЯ РАСПОЛОЖЕНИЯ ОБЪЕКТА // Международный студенческий научный вестник. – 2018. – № 3-1.;
URL: http://eduherald.ru/ru/article/view?id=18192 (дата обращения: 14.06.2021).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074