Занятие №15 «Обучение с подкреплением»
Пятнадцатое занятие курса «Нейронные сети и их применение в научных исследованиях» для группы НС204.
Преподаватель: Дмитрий Иванов.
Таймкоды:
00:00 Reinforcement Learning
02:29 MDP
31:22 Давайте теперь искать наилучшую политику или наилучший способ поведения
48:39 Bellman
01:16:25 Библиотека OpenAI Gym
01:20:24 MDP practice
01:24:21 Разбор практики и вопросы
Официальный сайт: