Как думают LLM?

13 июня в 12:00 по МСК профессор Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО, рассказал о том, как думают LLM. Цель лекции — раскрыть понятие интерпретабельности больших языковых моделей. В лекции: - сравнили понятие интерпретации модели в квантовой физике и в задаче вывода LLM; - увидели, как LLM выполняет сложные рассуждения на основе внутреннего устройства больших языковых моделей и их функционирования с точки зрения программиста; - рассмотрели иллюстрации на простейшей модели nano-gpt и выводы на основе этого представления; - познакомились с последними результатами интерпретации LLM с использованием карт активности нейронов. «В конечном итоге мы могли бы даже запретить такие комбинации нейронов, как ложь, обман, стремление к власти или агрессивные реакции, чтобы модель никогда не генерировала такого рода данные независимо от того, насколько настаивает пользователь. И, может быть, перенести эти возможности на мозг живых существ», – рассказал Владимир Крылов. Если вы хотите работать в ИТ и в Artezio, отправляйте своё резюме по ссылке Подписывайтесь на телеграм-канал AI4Dev: 00:00 Введение. 00:55 Лекция. 45:05 Вопросы.

10 views

822

220