Методы обучения с подкреплением для робастного манипулирования объектами сложной формы
Цель работы - разработка и исследование методов обучения с подкреплением (RL) для робастного манипулирования объектами произвольной и сложной формы в условиях высокой вариативности сцены. Подобные методы находят практическое применение в задачах автономной манипуляции, таких как сборка, сортировка и упаковка в непредсказуемых условиях. Работа ориентирована на создание систем, способных эффективно обучаться стратегии захвата при взаимодействии с множеством объектов со сложной геометрией и физикой. Зачастую для обучения RL агентов или для решения частных подач приходится привлекать методы оптимального управления.

Задачи исследования
  • Разработка стратегии обучения робота для захвата объектов сложной формы без предварительного CAD-моделирования (то есть без использования заранее известных 3D-моделей объектов).
  • Исследование робастности захвата при наличии неопределённости в геометрии, массе и положениях объектов.
  • Построение среды, поддерживающих разнообразие форм и параметров объектов.
  • Интеграция визуального восприятия и тактильной обратной связи в обучение с подкреплением.
  • Оценка переносимости полученных политик на реальные сцены с множественными объектами.