Александр Панов | Обучение с подкреплением на основе модели мира

Ведущий научный сотрудник AIRI и ФИЦ ИУ РАН, руководитель Центра когнитивного моделирования МФТИ рассказывает про методы обучения с подкреплением на основе модели мира. В начале обсуждается общая постановка задачи, преимущества и сложности использования модели среды. Во второй части разбираются основе методы в этой области: VIN, VPN, MCTS, AlphaGo, Dreamer. Ссылка на презентацию: Плейлист со всеми лекциями «Лето с AIRI»: Анонсы научных мероприятий всегда публикуются в Telegram-канале AIRI:
Back to Top