Кирилл Аксенов, Интеграция RL и планирования,

Планирование действий по известной модели - один из важных классических подходов в искусственном интеллекте. При интеграции с методами обучения с подкреплением оказывается возможным использовать обновляемую модель и добиваться действительно значимых результатов. Начиная с простых алгоритмов, мы в этом туториале разберемся, как работает AlphaZero, после чего посмотрим на современные SOTA алгоритмы последних двух лет. – ведущая независимая открытая конференция по искусственному интеллекту в России.

8 views