ОписаниеИсследование посвящено разработке методов глубокого обучения с подкреплением (RL) для управления роботами с несколькими манипуляторами и мобильной платформой в условиях
частичной наблюдаемости и
наличия внешней семантической информации. Основной акцент делается на использование
графа знаний для компенсации отсутствующих сенсорных данных и расширения способности робота к обоснованному принятию решений в сложных многоэтапных задачах. Работа направлена на обучение адаптивных и обобщающих политик, способных эффективно координировать действия в условиях ограниченного восприятия.
Задачи исследования- Разработка методов многозадачного обучения с подкреплением (Multi-task RL) для систем с несколькими манипуляторами и подвижной базой.
- Планирование движений в частично наблюдаемой среде (где часть объектов недоступна сенсорам, но известна из семантической модели мира).
- Интеграция графа знаний (knowledge graph) в структуру RL-политики для обогащения информации о задаче и окружающей среде.
- Координация движений нескольких исполнительных устройств (манипуляторы + база) с учётом пространственных и временных ограничений.
- Повышение обобщающей способности политик к новым задачам, конфигурациям объектов и сценам.