Весенний цикл

семинаров 2021
Центр когнитивного моделирования

Еженедельно по четвергам в 17:00
Весенняя серия семинаров, которую организует наш Центр, будет включать в себя два направления: обзор актуальных работ с ведущих конференций по тематикам наших лабораторий и выступления студентов и аспирантов с результатами (итоговыми и промежуточными) проектов, в которых они участвуют. По тематике семинаров мы условно выделяем четыре топика: обучение с подкреплением (RL), компьютерное зрение (CV), планирование поведения и управление (Plan, Control), общий искусственный интеллект (Sign, Neuro).

Наши семинары открытые - приглашаем принять участие всех желающих. Если у вас есть тема, которая укладывается в наши направления, пишите по нашим контактам - мы рады расширению сообщества и включим все достойные доклады в программу.


График
Waymo Сhallenge и повышение качества обнаружения трехмерных объектов на основе данных лидара, камеры и одометрии |
Юшаа Мурхиж &
Распознавание ложных срабатываний детектора объектов на основе классификации трехмерных облаков точек | Александр Голодков, Алексей Шагойко
Чт, 24 июня 17:00
В начале сегодняшнего семинара Юшаа подробно расскажет о своем решении в конкурсе Waymo Real-time 3D Detection (4-е место в командном зачете!) и проведет сравнение с решением 1-го места на CVPR2021-Workshop.

Во втором докладе Александр и Алексей сделают краткий обзор современных методов классификации трёхмерных облаков точек и покажут результаты работы выбранного классификатора на объектах из датасета Waymo, которые детектировала CenterPoint.

Соревнование: https://waymo.com/open/challenges
Mixing Q Networks for Multi-Agent Path Finding | Василий Давыдов
MCTS for Multi-Agent Path Finding | Александра Яковлева
Чт, 17 июня 17:00
В первой презентации будут представлены результаты применения алгоритма QMIX к задаче path finding. Данный алгоритм позволяет агентам при обучении учитывать Q-функции друг друга, что помогает им действовать более кооперативно. Также будет представлена наша реализация среды для multi-agent path finding.
Второй доклад отведен планированию, RL и применению Monte Carlo Tree Search для решения задачи поиска пути. В том числе будет рассмотрена статься от DeepMind, в которой они обобщают их подход до единого алгоритма AlphaZero, способного достичь сверхчеловеческой производительности во многих сложных играх, при этом, начав со случайной игры и не имея никаких знаний в предметной области, кроме правил игры.

Статья: https://deepmind.com/research/publications/general-reinforcement-learning-algorithm-masters-chess-shogi-and-go-through-self-play
Ретроспективное исследование среды в обучении с подкреплением | Артём Жолус
Чт, 10 июня 17:00
Обучение с подкреплением на основе модели (model-based reinforcement learning) является перспективным направлением в области обучения с подкреплением, которое позволяет эффективно решать задачи, в которых взаимодействие со средой является дорогой операцией (таких как управление роботами).
В данном докладе будут представлены результаты исследований сотрудников центра, а именно - алгоритм на основе model-based RL (MBRL), который позволяет ускорить решение агентом текущией задачи при помощи опыта, накопленного при решении предыдущих задач. В частности, будет разобрана статья, отправленная на конференцию NeurIPS 2021, в которой предлагается meta-learning алгоритм VRAMa на основе Dreamer.
Анализ методов трекинга объектов на основе изображений подвижной видеокамеры | Илья Башаров
Чт, 3 июня 17:00
Трекинг объектов в режиме реального времени - очень важная тема для научных исследований, связанных с беспилотными автомобилями, отслеживанием людей на последовательности изображений и др.

На семинаре мы рассмотрим основные этапы отслеживания объектов, какие подходы наиболее эффективны на данный момент, какие проблемы мы выявили и что мы предлагаем для их решения. Будут рассмотрены основные методы MOT: от SORT до FairMOT и новее, MOTS: от PointTrack до новейших трансформеров
Онлайн­-оптимизация эффективного распределения бюджета в рекламной кампании | Михаил Терентьев
Чт, 27 мая 17:00
Согласно теории вероятностей, проблема многорукого бандита (иногда называемая проблемой K- или N-вооруженного бандита ) - это проблема, в которой фиксированный ограниченный набор ресурсов должен быть распределен между конкурирующими (альтернативными) вариантами это максимизирует их ожидаемую прибыль, когда свойства каждого выбора известны только частично во время распределения и могут стать лучше понятыми по прошествии времени или путем выделения ресурсов для выбора.

Это классическая задача обучения с подкреплением , которая иллюстрирует дилемму компромисса между разведкой и эксплуатацией. Название происходит от представления игрока в ряду игровых автоматов (иногда называемых «одноруких бандитов »), который должен решить, какие машины использовать играть, сколько раз играть на каждой машине и в каком порядке играть на них, и продолжать ли на текущей машине или пробовать другую.

В докладе будет рассмотрена система позволяющая управлять бюджетом объявлений рекламной кампании таким образом, чтобы общее количество целевых действий по объявлениям было максимально.

Обзор включает описание архитектуры системы, состоящей из модуля, решающего задачу распределения бюджета в ключе задачи о многоруком бандите и модуля с эвристиками. Также представлено сравнение рассмотренных подходов к решению задачи.
Анализ классических и нейросетевых методов комплексирования данных одометрии | Линар Абдразаков
Анализ методов построения карт проходимости на основе комплексирования данных | Андрей Криштопик
Чт, 20 мая 17:00
Одной из важнейших задач в робототехнике является задача определение точного местоположения робота – проблема локализации или позиционирования. Данная проблема очень важна, так как информация о точном местоположении робота необходима для решения более сложных и комплексных задач навигации, построения пути и построения карты окружающей среды.

На сегодняшний день существует несколько различных подходов к решению проблемы локализации. Эти подходы применяют различные сенсоры и алгоритмы обработки данных, так один из подходов к локализации основан на анализе данных сенсоров пройденного расстояния, вероятностный подход к локализации и картографированию на основе SLAM- методик с использованием лазерного сканера или дальномеров. Любые методы оценки позиции робота имеют погрешности, обусловленные различными факторами физической среды. Для оценки этих погрешностей и уточнения реальной позиции робота на данный момент также существуют различные методики, которые мы рассмотрим на сегодняшем семинаре.
Методы и алгоритмы планирования и маршрутизации для групп мобильных роботов | Заин Али
Чт, 13 мая 17:00
При использовании роботов для решения новых задач, не связанных с промышленным производством и подразумевающих самостоятельное их функционирование в течение продолжительного времени, коллективные решения по сравнению с одиночным роботом отличаются большей эффективностью, низкой стоимостью, высокой надежностью и устойчивостью к внешним возмущениям.

Одной из ключевых задач при функционировании роботов в недостаточно известной обстановке является планирование безопасных траекторий, позволяющих строить гладкие безаварийные маршруты перемещения. Сложность синтеза траекторий для коллективов роботов состоит в том, что, во-первых, в рабочей зоне присутствуют другие мобильные роботы (подвижные препятствия), движение которых в большинстве случаев рассматривается как случайный процесс с неизвестными параметрами, а во-вторых, вычислительные возможности бортовых систем мобильных роботов ограничены, что не позволяет решать задачу планирования с использованием классических переборных или потенциальных алгоритмов.

На семинаре будет представлен обзор известных решений проблемы планирования траектории для группы роботов и ее вариантах. Вторая часть презентации будет посвящена задаче планирования пути с одновременной маршрутизацией с приблизительными и оптимальными решениями этих задач. Для каждого решения будет кратко описана идея алгоритма с примерами.
Обзор современных методов SLAM, учитывающих динамические объекты | Сергей Линок
Анализ методов визульной локализации в трехмерном облаке точек
| Илья Белкин
Чт, 29 апреля 17:00
Международная конференция IEEE по робототехнике и автоматизации (ICRA) - это ежегодная научная конференция, посвященная достижениям в робототехнике. Это одна из ведущих конференций в своей области, наряду с Международной конференцией по интеллектуальным роботам и системам (IROS).

На семинаре будут рассмотрены подходы к решению задачи vSLAM в динамичных средах. Обзор включает в себя 20 статей, в том числе с коференций IROS и ICRA за 2018 - 2021 годы.

Второй доклад отведен анализу современных методов локализации с помощью камеры на трехмерной карте. Будут представлены идеи подходов, а также результаты некоторых из них на датасете, собранного с помощью мобильного робота ClearPath Husky.
Слайды С. Линок: https://docs.google.com/presentation/d/1RHadgbiBIw...
Слайды И. Белкин: https://docs.google.com/presentation/d/1vld4ca56Ec...
Запись
Обзор работ по обучению с подкреплением с конференции AAMAS 2020 | Александра Яковлева
Чт, 22 апреля 17:00
AAMAS (International Conference on Autonomous Agents and Multi-Agent Systems), что в переводе на родной язык означает - Международная конференция по автономным агентам и мультиагентным системам.

Автором первой обозреваемой статьи "Deep Residual Reinforcement Learning", выйгравшей номинацию "Best Paper Award" конференции, является группа нашего английского коллеги из Оксфорда Шимона Вайтсона, также специализирующегося на обучение с подкреплением. В которой, они предлагают технику двунаправленной целевой сети для стабилизации остаточных алгоритмов, что дает остаточную версию DDPG, которая значительно превосходит обычный DDPG в тесте DeepMind Control Suite.

Вторая статья в обзоре - "Gifting in Multi-Agent Reinforcement Learning" канадской группы из университета McGill, в которой авторы отказываются от предположения, что многоагентное обучение с подкреплением обычно изучается на основе унаследованного от классического обучения с подкреплением подхода: функция вознаграждения является исключительным свойством окружающей среды и изменяется только под действием внешних факторов, - и вводят равное вознаграждение, при котором агенты могут сознательно влиять на функцию вознаграждения друг друга. В статье демонстрируют, что этот подход может значительно улучшить процесс обучения в условиях распределения ресурсов, и провести предварительный анализ комплексного воздействия дарований на динамику обучения.
Запись
Visual Question Answering работы за 2020 год | Алексей Ковалев
Чт, 15 апреля 17:00
Visual Question Answering (ответ на вопрос по изображению) – задача, которая объединяет в себе подходы компьютерного зрения и обработки естественного языка и заключается в ответе на вопрос, заданный по изображению.
Доклад посвящен двум вопросам, в первой части будет краткий обзор работ за 2020 год, представленных на ведущих международных конференциях. Во второй части поговорим о разрабатываемом в нашем Центре решении для VQA, объединяющем знаковую картину мира и векторно-символьные архитектуры.
Запись
Интеграция децентрализованного избегания столкновений и централизованного многоагентного планирования | Степан Дергачев
Чт, 8 апреля 17:00
Задача многоагентного планирования - это задача поиска совокупности неконфликтных траекторий для множества агентов, каждый из которых обладает собственным стартовым и целевым положением. Классическим подходом для решения этой задачи являются эвристические алгоритмы планирования, использующие в качестве модели пространства поиска графы специального вида.
Запись
Анализ методов предсказания траектории движения окружающих объектов | Василий Адешкин
Чт, 1 апреля 17:00
На семинаре обсудим современное состояние темы Object Motion Prediction - важного направления для беспилотного транспорта. Оно позволяет предсказывать будущие траектории наблюдаемых транспортных средств, пешеходов, домашних животных и т.п. Стажер лаборатории интеллектуального транспорта Василий Адешкин расскажет про новые работы с топовых конференций CVPR, WACV, ICCV, ECCV, а так же прокомментирует возможности программных реализаций state-of-the-art подходов.
Запись
Адапативное планирование в Apollo | Маис Жамал
Обучение с подкреплением в планировании
траектории в Apollo | Дмитрий Иванов
Чт, 25 марта 17:00
Apollo Open Source Planner framework - это высокопроизводительная гибкая архитектура, которая ускоряет разработку, тестирование и развертывание автономных транспортных средств. https://github.com/ApolloAuto/apollo
Первая презентация будет посвящена адаптивному принятию решений в сценариях Аполлона. Исследуемый сценарий - обгон динамического препятствия. В качестве решения использовалось дерево поведения, структура которого изучалась с помощью генетического алгоритма.
Во второй презентации Дмитрий расскажет про свою задачу на стажировке: обучения с подкреплением в планировании траектории (применительно к модулю Apollo). О том, как сейчас происходит планирование в Apollo, какие есть недостатки и каким алгоритмом он пробует заменить этот планировщик, а также об общих идеях алгоритма и дальнейших планах разработки.

Слайды Д. Иванов: https://drive.google.com/file/d/1LUuoQXGIuWOv8mrlG...
Слайды М. Жамал: https://drive.google.com/file/d/1-ZKsZMpcESc9iMC5g...
Запись
Практика использования систем логирования и визуализации результатов для RL и CV | Алексей Скрынник
Чт, 18 марта 17:00
На этом семинаре мы поговорим про то, как использовать систему логирования экспериментов при работе в команде, как легко встроить такую систему в уже готовый код, обсудим дополнительные особенности: подбор гиперпараметров, сравнение и визуализацию результатов, версионирование моделей. Разберем все это на примере Weights&Biases.
Запись
Планирование для робототехнической платформы с учетом кинематических ограничений | Брайн Ангуло, Зейн Али, Владислав Головин
Чт, 11 марта 17:00
В докладе будут рассмотрены различные методы решения одной из фундаментальных задач мобильной робототехники - задачи планирования траектории движения робота с учетом кинематических ограничений. Учет этих ограничений существенно усложняет задачу и делает её решение гораздо менее тривиальным, чем, например, геометрическое планирование. Тем не менее, как мы покажем в докладе, существуют техники, способные решать задачу в этой постановке за приемлимое время.
Запись
Анализ подходов к генерации семантических карт высокой размерности на основе бортовых сенсоров беспилотных транспортных средств | Алексей Карманов
Чт, 4 марта 17:00
На семинаре будет рассмотрено предназначение HD карт, основные методы их создания, а также генерация HD карт с помощью бортовых камер. Во второй части существенная доля внимания будет уделена online mapping'у и распознаванию динамических объектов (так называемая задача Bird-eye view сегментации).
Запись
Обзор работ по обучению с подкреплением
конференции ICLR 2021 | Андрей Городецкий
Чт, 25 февраля 17:00
International Conference on Learning Representations (ICLR) - это конференция, посвященныя развитию области искусственного интеллекта, называемой репрезентативным обучением, но обычно именуемая глубоким обучением.

Наряду с ICML и NeurIPS, ICLR является одной из трех основных конференций по машинному обучению и искусственному интеллекту и постоянно набирает большое количество статей. В этом году конференция приняла 860 из 2997 докладов. ICLR 2021 пройдет с 3-7 Мая, опираясь на прошлогодний опыт, будет полностью переведена в онлайн режиме из-за пандемии.

На семинаре будет проведён обзор работ конференции с акцентом на unsupervised и meta reinforcement learning. С помощью этих подходов можно использовать опыт прошлого взаимодействия агента со средой или набор субоптимальных траекторий среды для ускорения настройки агента на новые задачи. Также в отсутствии фунции награды (reward function) можно проводить стабилизацию динамических систем или получать потенциально полезные навыки для решения поледующих задач / обучения поведению агента.
Запись
MPC в управлении манипуляторами | Константин Миронов
Чт, 18 февраля 17:00
Model Predictive Control в настоящее время является распространенным методом адаптивного управления робототехническими манипуляторами. Существенной сложностью применения этого метода является то, что в MPC используются линейные модели процесса, в то время как стандартные модели динамики манипуляторов являются нелинейными и, сооответственно, требуют линеаризации. В рамках доклада рассматриваются современные подходы к применению MPC для управления робототехническими манипуляторами.
Запись
Обзор работ по обучению с подкреплением NeurIPS 2020 v2.0 | Петр Кудеров, Артем Жолус

Чт, 11 февраля 17:00
Продолжаем знакомиться с работами по обучению с подкреплением с конференции NeurIPS 2020. В прошлый раз Артем сделал акцент на статьях посвященных model-based RL, сегодня ребята расскажут про статьи из других областей reinforcement learning.
Запись
Особенности реализации алгоритмов CV и SLAM в ROS2 | Юшаа Мурхиж, Линар Абдразаков, Илья Белкин
Чт, 4 февраля 17:00
ROS (Robot Operating System) обеспечивает разработчиков библиотеками и инструментами для создания приложений робототехники. ROS обеспечивает аппаратную абстракцию, предлагает драйверы устройств, библиотеки, визуализаторы, обмен сообщениями, менеджеры пакетов и многое другое. ROS выпускается в соответствии с условиями BSD лицензии и с открытым исходным кодом.
С момента запуска ROS в 2007 году в сообществе робототехники и ROS многое изменилось. Цель проекта ROS 2 - адаптироваться к этим изменениям, используя преимущества ROS 1 и улучшая то, чего нет.

На семинаре будут продемонстрированы особенности ROS2 и ее отличия и преимущества перед ROS1 при решении задач компьютерного зрения и SLAM.
Запись
Обзор работ по обучению с подкреплением конференции NeurIPS 2020: модели среды и планирования | Артем Жолус
Чт, 28 января 17:00

NeurIPS — ведущая конференция по машинному обучению и вычислительной нейробиологии, на которой каждый год в декабре тысячи ведущих ученых и исследователей собираются для обмена исследованиями в области когнитивных наук, психологии, компьютерного зрения, статистической лингвистики и теории информации.
На нашем втором семинаре Артем Жолус, магистрант МФТИ, проведет обзор наиболее интересных статей, а также выделит общие тенденции направления model-based Reinforcement Learning.
Запись
Методы монокулярного визуального SLAM | Андрей Боковой, Кирилл Муравьёв
Анализ нейросетевых подходов к решению задачи Place Recognition | Ярослав Соломенцев
Чт, 21 января 17:00

Будет дан анализ возможностей методов визуального SLAM на основе данных толького одной камеры мобильного робота.
Представлены различные бенчмарки глобальной локализации по изображениям рассмотренные в том числе на ECCV2020, а также state-of-the-art методы решения такой задачи с помощью нейронных сетей.
Запись