Основные алгоритмы в обучении с подкреплением //Демо-занятие курса «Reinforcement Learning»
Вместе с преподавателем вы познакомитесь с основными алгоритмами обучения с подкреплением. Вы начнете свой путь с обучения простого агента в задаче прохождения лабиринта и будете погружаться все глубже в теорию, усложняя поведение агента в окружающей среде. Узнаете как применять нейросети для обучения агентов, как обучить агента в среде с дискретным и непрерывным набором действий и в финале познакомитесь с методами обучения взаимодействующих агентов, способных совместно решать сложные задачи, требующие кооперации.
В результате урока вы получите представление обо всем многообразии алгоритмов обучения с подкреплением и будете понимать как выбрать наиболее подходящий из них для решения ваших задач.
00:00 - Введение
15:57 - Начало базового блока об RL
29:18 - Что такое обучение с подкреплением
32:07 - Обзор алгоритмов RL
1:04:43 - Марковский процесс
1:31:00 - Практика
Ссылка на материалы -
«Reinforcement Learning» -
Преподаватель: Игорь Стурейко (к.ф.-м.н.) - Teamlead, главный инженер проекта – НИИгазэкономика
Пройдите опрос по итогам мероприятия -
Следите за новостями проекта:
- Telegram:
- ВКонтакте:
- LinkedIn:
- Хабр:
14 views
27
4
4 weeks ago 01:10:05 1
Mentor In Tech 6.0: Обзор технологий искусственного интеллекта
4 weeks ago 00:18:45 1
НОТА в ООН от Правительства СССР -
4 weeks ago 00:07:02 5
РЕАКЦИЯ: Парень гитариста. Пердящая Базука. 5 лет. Итоги.