Описание проектаИсследование направлено на разработку методов обучения с подкреплением (RL) для координированного управления мобильной платформой и манипулятором, то есть управления всем телом робота в составе единой политики. Подобные задачи мобильной манипуляции особенно актуальны в реальных сценариях, где необходимо перемещаться по ограниченному пространству, избегать препятствий и точно взаимодействовать с объектами. Работа главным образом ориентирована на обучение сквозных политик
, то есть таких, где входные данные от сенсоров напрямую преобразуются в управляющие воздействия без разбиения на отдельные этапы восприятия, планирования и управления (подход end-to-end
).
Задачи исследования- Разработка алгоритмов RL для одновременного управления приводами колесной/ногой платформы и манипулятора
- Разработка эффективных методов обучения таких алгоритмов
- Обеспечение устойчивости политик к сбоям восприятия, шуму сенсоров и вариативности сцены
- Перенос выученных политик из симуляции в реальный мир с минимальной деградацией качества (Sim2Real)