Обучение с подкреплением на основе модели
Одним из ключевых свойств перцептивной и моторной системы человека является их предметность, т.к. ориентация как распознающей так и действующих подсистем на работу с конкретными объектами внешней среды. Оперирование объектами для предсказания их вида и динамики в перспективе может оказаться существенно более эффективным, чем оперирование цельными сценами.

Обучение с подкреплением на основе модели (model-based reinforcement learning) является перспективным направлением в области обучения с подкреплением, которое позволяет эффективно решать задачи, в которых взаимодействие со средой является дорогой операцией (таких как управление роботами).
Ретроспективное исследование среды в обучении с подкреплением | Артём Жолус
Необходимые умения
  • Сильная математическая подготовка (курсы математической статистики, дискретной математики, теории алгоритмов)
  • Понимание принципов машинного обучения
  • Отличное знание Python
  • Уверенное владение нейросетевыми фреймворками (PyTorch, Tensorflow)
  • Опыт работы с большими нейросетевыми моделями
Публикации
  • Zholus A., Panov A.I. Case-based Task Generalization in Model-based Reinforcement Learning // Artificial General Intelligence. AGI 2021
  • Kovalev A.K., Panov A.I., Osipov E. Hyperdimensional Representations in Semiotic Approach to AGI // Artificial General Intelligence. AGI 2020
Темы исследовательских проектов
  • Исследование влияния структуры модели мира на сходимость методов RL
  • Объектно-центричное обучение с подкреплением в среде Crafter
  • Мультизадачное обучения в среде IGLU
  • Иерархические объектно-центричные подходы для управления робототехнической системой