RLHF Intro: from Zero to Aligned Intelligent Systems | Igor Kotenkov
Ссылка на презентацию: !AlnN0aqNwShslWtiuDJOR_qt3Urn
Мой телеграм канал:
Список всех моих образовательных материалов, статей, лекций итд:
Перед вами - обзорная-лекция блока Instruct Models Датафеста 2023го года. В ней рассказано о проблемах в мире машинного обучения, о несоответствии функций для оптимизации и реальных задач, для которых модели предназначаются.
В лекции будут рассказаны основы RL, языковых моделей, а затем показано, как эти два направления можно объединить, чтобы тренировать модель напрямую оптимизировать воспринимаемое человеком качество генерации. В заключении будет дан обзор текущих тенденций в мире RLHF (Reinforcement Learning from Human Feedback) и рассказано про то, что же такое AI Alignment и почему им нужно заниматься уже сейчас.
Подпишитесь на наш канал, чтобы не пропустить новые видео о машинном обучении и искусственном интеллекте. Не забудьте поставить лайк и поделиться эти
3 views
148
69
4 months ago 00:25:40 1
Отказы в гарантии на китайские авто / Как дилеры дают заднюю
4 months ago 00:07:47 1
바이낸스 초보자 가이드 | 바이낸스 가입방법부터 선물거래까지 쉽게 따라할 수 있는 방법 공개 | 가입하고 수수료 30% 할인과 10% 페이백 혜택 받는 팁