Обучение с подкреплением на основе модели
Одним из ключевых свойств перцептивной и моторной системы человека является их предметность, т.к. ориентация как распознающей так и действующих подсистем на работу с конкретными объектами внешней среды. Оперирование объектами для предсказания их вида и динамики в перспективе может оказаться существенно более эффективным, чем оперирование цельными сценами.

Обучение с подкреплением на основе модели (model-based reinforcement learning) является перспективным направлением в области обучения с подкреплением, которое позволяет эффективно решать задачи, в которых взаимодействие со средой является дорогой операцией (таких как управление роботами).
Ретроспективное исследование среды в обучении с подкреплением | Артём Жолус