Finetuning Mistral-7B для уменьшения галлюцинаций модели при RAG (retrieval-augmented generation)
Код из видео:
Разработка AI-решений на заказ:
Широкий выбор карт для обучения и инференса нейронных сетей:
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
00:00 - что такое RAG (Retrieval-Augmented Generation)
01:03 - арендуем сервер
02:06 - подключаемся к серверу по ssh
02:56 - подключаемся к серверу в VS Code
05:06 - настраиваем kernel в jupyter notebook
05:40 - описание кейса (чат-бот для магазина сматфонов)
06:11 - prompt engineering
06:44 - параметры LORA-адаптеров
07:35 - top-k sampling, top-p sampling
08:13 - диалог с Saiga-Mistral, галлюцинации LLM
09:38 - датасет Company Cases
11:49 - форматирование промпта, padding, DataCollatorForCompletionOnlyLM
13:15 - BitsAndBytesConfig
14:35 - обучение с помощью SFTTrainer
15:25 - тестирируем RuDlg-Mistral, уменьшение галлюцинаций
16:34 - тестируем RuDlg-Mistral с различным описанием личности чат-бота
Реклама. ООО «ДТЛ». ИНН 9717073792. erid: LjN8KK7XN
8 views
3308
881
6 months ago 00:17:47 8
Finetuning Mistral-7B для уменьшения галлюцинаций модели при RAG (retrieval-augmented generation)