Методы обучения с подкреплением для управления всем телом робота в задачах мобильной манипуляции
Описание проекта
Исследование направлено на разработку методов обучения с подкреплением (RL) для координированного управления мобильной платформой и манипулятором, то есть управления всем телом робота в составе единой политики. Подобные задачи мобильной манипуляции особенно актуальны в реальных сценариях, где необходимо перемещаться по ограниченному пространству, избегать препятствий и точно взаимодействовать с объектами. Работа главным образом ориентирована на обучение сквозных политик, то есть таких, где входные данные от сенсоров напрямую преобразуются в управляющие воздействия без разбиения на отдельные этапы восприятия, планирования и управления (подход end-to-end).



Задачи исследования
  • Разработка алгоритмов RL для одновременного управления приводами колесной/ногой платформы и манипулятора
  • Разработка эффективных методов обучения таких алгоритмов
  • Обеспечение устойчивости политик к сбоям восприятия, шуму сенсоров и вариативности сцены
  • Перенос выученных политик из симуляции в реальный мир с минимальной деградацией качества (Sim2Real)