Семинар 24. Recurrent Action Transformer with Memory (RATE)

Выступающие: Егор Черепанов В последнее время использование трансформерных архитектур в обучении с подкреплением вызывает все больше внимания. Это связано с их способностью рассматривать траекторию движения агента в среде как последовательность, что сводит проблему обучения к моделированию последовательности. В средах, где решения агента зависят от событий из прошлого, очень важно отразить как само событие, так и момент принятия решения в контексте модели, однако квадратичная сложность механизма внимания ограничивает возможности расширения контекста. Для решения этой проблемы вводится понятие “эффективного контекста“, получаемого с использованием механизмов памяти. В докладе будет описан данный подход и приведены результаты экспериментов на средах с памятью с использованием RATE. 👉🏻 Дата: , четверг в 17:00 Подписывайтесь на каналы нашего Центра, чтобы следить за новостями о стажировках, магистратуре, аспирантуре и других интересных событиях: ВК — Телеграм — Магистратура и аспирантура —
Back to Top