«GigaChat: наш опыт обучения LLM»
Дани Эль-Айясс, Исполнительный директор, SberDevices
Большие языковые модели (LLM) являются новым этапом развития интеллектуальных систем, решающих задачи на естественном языке. Помимо глубокого понимания структуры языка, LLM также формируют знания о мире во время обучения на больших корпусах текста, что выводит их на новый качественный уровень, открывая новые эмерджентные способности, такие как подходы, основанные на нулевом или крайне мало числе примеров (Few-Shot/Zero-Shot Learning/Prompting) и построение рассуждений (Reasoning).
Но обучение подобных моделей является сложной задачей, требующей большого количества ресурсов и тонкой настройки. В докладе мы хотим поделится нашим опытом обучения модели ruGPT-3.5 — большой языковой модели от Сбера, лежащей в основе генеративного сервиса GigaChat, начиная с предобучения и заканчивая RLHF-пайплайном.
1 view
155
41
2 months ago 00:53:51 1
Хемингуэй: Советский шпион? / Личности / @MINAEVLIVE
2 months ago 01:18:53 1
ТЕРРАРИЯ За МЕТАТЕЛЯ! Полное прохождение TERRARIA!
2 months ago 00:25:32 3
FlyMeet AI - Telegram Mini App для планирования встреч, звонков с искусственным интеллектом на борту
3 months ago 00:06:05 1
Беспилотная “Ласточка“, ИИ восстановит второй том “Мёртвых душ“, робот-дворецкий | ВОТ-ВОТ #40
3 months ago 01:07:13 1
Стали бедными в Англии! Потеряли 20,000$! На нас напали?
3 months ago 01:46:07 1
Мы для отношений - или они для нас? Игнатий Журавлев о невротизме, созависимости и одиночестве
3 months ago 00:49:59 1
Забытые дороги ВОСТОЧНЫХ САЯН. Рубимся по СТАРОЙ колее золотоискателей. #саяны #байкал #тунка
4 months ago 00:53:45 1
Началась важнейшая технологическая битва между странами! Кто победит и к чему это приведет мир?
4 months ago 02:15:54 1
Как может измениться мир? Юрий Максимов о будущем бизнеса, переосмыслении конкуренции и визионерстве
4 months ago 00:03:35 1
🎶 “Cмартфон“ - Песня кота Мурзика про зависимость от гаджетов | ИИ и стихи ART LERO - ELENA
4 months ago 00:39:20 2
КУПИЛ ЗАБЫТЫЕ ПОСЫЛКИ за рублей! **много товаров**
4 months ago 00:22:46 1
БИТВА ИИ В ПРОГРАММИРОВАНИИ: КТО ИЗ ЧАТ-БОТОВ НА САМОМ ДЕЛЕ СТОИТ ВАШЕГО ВНИМАНИЯ?