Интеграция методов оптимального управления и обучения с подкреплением для мобильного манипулятора
Мобильные манипуляторы (робототехнические системы, включающие мобильную платформу и прикрепленные к ней манипуляторы) могут применяться для выполнения различных задач в человекоориентированных средах (например, в офисных помещениях).

В данном направлении мы развиваем новые подходы к управлению такими системами при решении различных задач, которые возникают при функционировании в человеко-ориентированных средах. При этом мобильная база и манипулятор могут рассматриваться по отдельности, либо как единая динамическая система.
Использование лифта автономной робототехнической платформой
Управление такими системами может осуществляться на основе классических подходов, с применением машинного обучения с подкреплением, а также на основе интеграции классических и обучаемых подходов. Среди методов, основанных на обучении особый интерес уделяется ориентированным на выучивании динамических моделей системы (например, с использованием Neural Ordinary Differential Equations или Dynamic Movement Primitives)
Необходимые умения
  • Физико-математическая база: дифференциальные уравнения, оптимизация, теория управления, кинематика и динамика робототехнических систем
  • Программирование: С++, Python, Matlab, опыт создания программных проектов под Linux (в идеале – Robotic Operation System)
  • Работа с нейросетевыми моделями и фреймворками (PyTorch, Tensorflow)
  • Работа с фреймворками для оптимального управления (Acados, ForcesPro)
Публикации
  • Miguel Arduengo, Carme Torras, Luis Sentis “Robust and Adaptive Door Operation with a Mobile Robot” 2019 (https://arxiv.org/abs/1902.09051 ) - задача открытия двери
  • Shikhar Bahl, Mustafa Mukadam, Abhinav Gupta, Deepak Pathak “Neural Dynamic Policies for End-to-End Sensorimotor Learning” 2020 (https://arxiv.org/abs/2012.02788) – интеграция dynamic movement primitives и обучения с подкреплением для робототехники
  • Çağatay Yıldız, Markus Heinonen, Harri Lähdesmäki “Continuous-Time Model-Based Reinforcement Learning” 2021 (https://arxiv.org/abs/2102.04764 ) - интеграция моделирования динамики с помощью Neural Ordinary Differential Equations и обучения с подкреплением
Темы исследовательских проектов
  • Интеграция скиллов в единую архитектуру управления роботом
  • Манипулирование объектами при решении различных задач
  • Поиск решений прямой и обратной кинематики
  • Применение full-body control при решении различных задач