Finetuning Mistral-7B для уменьшения галлюцинаций модели при RAG (retrieval-augmented generation)

Код из видео: Разработка AI-решений на заказ: Широкий выбор карт для обучения и инференса нейронных сетей: Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU). 00:00 - что такое RAG (Retrieval-Augmented Generation) 01:03 - арендуем сервер 02:06 - подключаемся к серверу по ssh 02:56 - подключаемся к серверу в VS Code 05:06 - настраиваем kernel в jupyter notebook 05:40 - описание кейса (чат-бот для магазина сматфонов) 06:11 - prompt engineering 06:44 - параметры LORA-адаптеров 07:35 - top-k sampling, top-p sampling 08:13 - диалог с Saiga-Mistral, галлюцинации LLM 09:38 - датасет Company Cases 11:49 - форматирование промпта, padding, DataCollatorForCompletionOnlyLM 13:15 - BitsAndBytesConfig 14:35 - обучение с помощью SFTTrainer 15:25 - тестирируем RuDlg-Mistral, уменьшение галлюцинаций 16:34 - тестируем RuDlg-Mistral с различным описанием личности чат-бота Реклама. ООО «ДТЛ». ИНН 9717073792. erid: LjN8KK7XN

8 views

3314

883