High-throughput Asynchronous Reinforcement Learning
Вт, 14 Апреля 20:00
Алексей Петренко, PhD Student at University of Southern California, Robotic Embedded Systems Lab
Эксперименты крупных AI-лабораторий, такие как AlphaGo, AlphaStar и OpenAI Five, вызвали мощную волну интереса к обучению с подкреплением. Мы увидели, что доступ к большим вычислительным кластерам даёт исследователям возможность одновременно симулировать тысячи сред и агентов, и использовать миллиарды траекторий для обучения моделей. Но является ли доступ к суперкомпьютеру обязательным условием для проведения интересных и масштабных RL экспериментов?
На семинаре Алексей расскажет о вычислительных аспектах on-policy RL алгоритмов, и о том, каким образом можно кратно ускорить RL эксперименты с помощью алгоритмических оптимизаций и эффективной реализации, выжимая абсолютный максимум из доступного железа.