Исследования | Разработка теории и методов обучения с подкреплением для робастного манипулирования

Разработка теории и методов обучения с подкреплением для робастного манипулирования

Цель работы - разработка и исследование методов обучения с подкреплением (RL) для робастного манипулирования объектами произвольной и сложной формы в условиях высокой вариативности сцены. Подобные методы находят практическое применение в задачах автономной манипуляции, таких как сборка, сортировка и упаковка в непредсказуемых условиях. Работа ориентирована на создание систем, способных эффективно обучаться стратегии захвата при взаимодействии с множеством объектов со сложной геометрией и физикой. Зачастую для обучения RL агентов или для решения частных подач приходится привлекать методы оптимального управления.

Задачи исследования

Разработка стратегии обучения робота для захвата объектов сложной формы без предварительного CAD-моделирования (то есть без использования заранее известных 3D-моделей объектов).
Исследование робастности захвата при наличии неопределённости в геометрии, массе и положениях объектов.
Построение среды, поддерживающих разнообразие форм и параметров объектов.
Интеграция визуального восприятия и тактильной обратной связи в обучение с подкреплением.
Оценка переносимости полученных политик на реальные сцены с множественными объектами.