Интеграция методов оптимального управления и обучения с подкреплением для мобильного манипулятора
Мобильные манипуляторы (робототехнические системы, включающие мобильную платформу и прикрепленные к ней манипуляторы) могут применяться для выполнения различных задач в человекоориентированных средах (например, в офисных помещениях). В данном направлении мы развиваем новые подходы к управлению такими системами при решении различных задач, которые возникают при функционировании в человеко-ориентированных средах. При этом мобильная база и манипулятор могут рассматриваться по отдельности, либо как единая динамическая система.

Использование лифта автономной робототехнической платформой
Управление такими системами может осуществляться на основе классических подходов, с применением машинного обучения с подкреплением, а также на основе интеграции классических и обучаемых подходов. Среди методов, основанных на обучении особый интерес уделяется ориентированным на выучивании динамических моделей системы (например, с использованием Neural Ordinary Differential Equations или Dynamic Movement Primitives)
Необходимые умения
  • Сильная физико-математическая подготовка (дифференциальные уравнения, методы оптимизации, теория управления, кинематика и динамика робототехнических систем),
  • Отличное знание Python, опыт создания программных проектов под Linux (в идеале – Robotic Operation System)
  • При работе с методами, основанными на обучении: понимание принципов машинного обучения
  • Уверенное владение нейросетевыми фреймворками (PyTorch, Tensorflow)
  • Опыт работы с нейросетевыми моделями.
Ключевые слова
---
Публикации
  • Miguel Arduengo, Carme Torras, Luis Sentis “Robust and Adaptive Door Operation with a Mobile Robot” 2019 (https://arxiv.org/abs/1902.09051 ) - задача открытия двери
  • Shikhar Bahl, Mustafa Mukadam, Abhinav Gupta, Deepak Pathak “Neural Dynamic Policies for End-to-End Sensorimotor Learning” 2020 (https://arxiv.org/abs/2012.02788) – интеграция dynamic movement primitives и обучения с подкреплением для робототехники
  • Çağatay Yıldız, Markus Heinonen, Harri Lähdesmäki “Continuous-Time Model-Based Reinforcement Learning” 2021 (https://arxiv.org/abs/2102.04764 ) - интеграция моделирования динамики с помощью Neural Ordinary Differential Equations и обучения с подкреплением
Темы исследовательских проектов
  • Управление робототехнической системой из колесной платформы и закрепленного на ней манипулятора: классические методы и/или обучение с подкреплением