Цель работы - разработка и исследование методов обучения с подкреплением (RL) для робастного манипулирования объектами произвольной и сложной формы в условиях высокой вариативности сцены. Подобные методы находят практическое применение в задачах автономной манипуляции, таких как сборка, сортировка и упаковка в непредсказуемых условиях. Работа ориентирована на создание систем, способных эффективно обучаться стратегии захвата при взаимодействии с множеством объектов со сложной геометрией и физикой. Зачастую для обучения RL агентов или для решения частных подач приходится привлекать методы оптимального управления.
Задачи исследования- Разработка стратегии обучения робота для захвата объектов сложной формы без предварительного CAD-моделирования (то есть без использования заранее известных 3D-моделей объектов).
- Исследование робастности захвата при наличии неопределённости в геометрии, массе и положениях объектов.
- Построение среды, поддерживающих разнообразие форм и параметров объектов.
- Интеграция визуального восприятия и тактильной обратной связи в обучение с подкреплением.
- Оценка переносимости полученных политик на реальные сцены с множественными объектами.