Исследование среды с помощью моделей мира

Исследование среды является одной из важнейших проблем в обучении с подкреплением. Во многом это связано с тем, что для эффективного обучения агенту необходимо получать достаточно разнообразный опыт взаимодействия со средой. На данный момент существует уже достаточно большое количество методов, которые позволяют решать трудные с точки зрения исследования среды задачи. Тем не менее, задача эффективного исследования среды в общем случае является не решенной. Большинство современных подходов основаны на идее внутреннего вознаграждения за новизну информации, полученной агентом о среде. На семинаре мы разберем статьи “Novelty Search in Representational Space for Sample Efficient Exploration“ и “Latent World Models For Intrinsically Motivated Exploration“, а также сравним их с другими современными подходами, использующими intrinsic reward. Докладчики: Александр Никулин и Свидченко Олег.
Back to Top