Atari57 в последние несколько лет является, наверно, одним из самых популярных наборов сред для обучения с подкреплением, сочетая в себе большое количество разнообразных задач для проверки качества алгоритмов. Большинство алгоритмов обучения с подкреплением успешно превосходят людей в большей части из этих игр, однако до настоящего момента ни один из алгоритмов не мог показывать стабильно высокие результаты во всех играх из представленных.
На семинаре мы рассмотрим статью с алгоритмом Agent57, который стаб
2 views
17
4
5 years ago 00:07:25 8
DeepMind Made A Superhuman AI For 57 Atari Games! 🕹