Исследования | Методы обучения с подкреплением для управления всем телом робота в задачах мобильной манипуляции

Методы обучения с подкреплением для управления всем телом робота в задачах мобильной манипуляции

Описание проекта
Исследование направлено на разработку методов обучения с подкреплением (RL) для координированного управления мобильной платформой и манипулятором, то есть управления всем телом робота в составе единой политики. Подобные задачи мобильной манипуляции особенно актуальны в реальных сценариях, где необходимо перемещаться по ограниченному пространству, избегать препятствий и точно взаимодействовать с объектами. Работа главным образом ориентирована на обучение сквозных политик, то есть таких, где входные данные от сенсоров напрямую преобразуются в управляющие воздействия без разбиения на отдельные этапы восприятия, планирования и управления (подход end-to-end).

Задачи исследования

Разработка алгоритмов RL для одновременного управления приводами колесной/ногой платформы и манипулятора
Разработка эффективных методов обучения таких алгоритмов
Обеспечение устойчивости политик к сбоям восприятия, шуму сенсоров и вариативности сцены
Перенос выученных политик из симуляции в реальный мир с минимальной деградацией качества (Sim2Real)