Определение позы
и одометрии робота
по изображениям его RGB-D камер
Под позой робота понимается его положение и ориентация в трехмерном пространстве. Понятие одометрии шире и включает также скорости (линейные и угловые), а также ускорение. Точное определение такого пространственного состояния важно для решения задачи локализации робота и дальнейшего планирования его поведения в трехмерном пространстве.
Семинар 6. Распознавание любых динамических объектов на изображениях бортовых камер
Сергей Линок, Андрей Криштопик
Особенно перспективно определение позы и одометрии робота с помощью нейросетевых моделей, анализирующих изображения от бортовых камер (монокулярных, стерео и RGB-D), которые являются наиболее дешевыми и распространенными сенсорами. В то же время современные методы SLAM (Simultaneous localization and mapping) не позволяют достаточно качественно решать такую задачу в сложных условиях освещения/видимости, при резких поворотах робота.

Решением является комплексирование данных от нескольких камер, инерциальных модулей, радаров, лидаров и т.п. Частным случаем, решающим задачу глобальной локализации робота, можно считать визуальное распознавание места (visual place recognition), использующее поиск по базе изображений и их нейросетевым векторным представлениям. Отдельное место в подобных задачах также часто занимают аналитические алгоритмы оптимизации позы камеры (группы камер).

В данном направлении мы занимаемся исследованием быстрых нейросетевых методов (в том числе трансформеров) для оценки одометрии по данным одной или нескольких бортовых камер. Отдельное направление исследований посвящено теме Place recognition по последовательности RGB-D изображений с учетом информации об их семантической сегментации. Тестирование разработанных подходов производится на открытых датасетах (KITTI, Oxfort RobotCar и т.д.) и на данных реальных роботов с применением операционной системы роботов ROS.