ОписаниеПроект посвящён разработке методов обучения коммуникации в мультиагентных системах, где агенты должны научиться эффективно взаимодействовать друг с другом для совместного решения задач.
В условиях, когда доступна информация о правильных действиях (ground truth), но отсутствуют примеры того, как именно должно происходить общение между агентами, исследуются подходы к обучению моделей, способных самостоятельно выстраивать полезные коммуникационные протоколы.
Задачи исследования- Разработка методов обучения агентов выстраивать коммуникационные протоколы без примеров целевого общения с помощью обучения с подкреплением
- Исследование архитектур нейросетевых моделей для совместного кодирования восприятия и обмена сообщениями между агентами
- Разработка механизмов координации сообщений и декодирования информации в условиях неполной наблюдаемости
- Создание методов обучения агентов с использованием информации о правильных действиях (supervision по действиям) при отсутствии ground truth для коммуникации
- Разработка бенчмарков и симуляторов для тестирования вырабатываемых протоколов взаимодействия
- Анализ эффективности возникающих стратегий коммуникации по метрикам совместного решения задач и устойчивости к шумам