Олег Шляжко: Оптимизация обучения больших GPT моделей

Data Fest Online 2021 NLP in Industry track Поговорим про ограничения, встающие на нашем пути при попытке обучать модели размерами в миллиарды весов. Рассмотрим методы их обхода и практические примеры применения на GPT-3 LM. Посмотреть эфир и список треков и организаторов: Зарегистрироваться на фест и получить доступ к трекам: Вступить в сообщество: Соцсети Data Fest:
Back to Top