3. Что такое модели трансформера и как они работают

В этом уроке Луис Серрано рассказывает о принципах работы моделей трансформера, которые могут генерировать текст, отвечать на вопросы, выполнять команды, писать рассказы и стихи, и даже писать код. На самом деле, трансформеры устроены не так сложно, как может показаться, но требуют больших наборов данных и вычислительной мощности. Оглавление: 00:00 Вступление 01:50 Что такое трансформер 04:35 Генерирование предложения по одному слову 08:51 Анализ тональности 12:37 Нейронные сети 17:50 Токенизация 18:33 Эмбеддинги 24:28 Позиционное кодирование 27:16 Механизм ’Attention’ 31:50 Функция ’Softmax’ 35:09 Архитектура трансформера 38:21 Тонкая настройка 41:41 Заключение • Автор: Luis Serrano, канал (@SerranoAcademy) • Переводчик: Софья Сутыгина • Редактор и диктор: Евгений Бартов • Оригинальное видео: --- Записаться на курсы переводчиков/учебную практику; заказать перевод/редактуру: ,
Back to Top