2 лекция (2 сем.) МО в Сбере от
2 лекция (2 сем.) МО в Сбере от
Ссылка на презентации, блокноты и т.п.
Содержание лекции:
Данные:
• Табличные: * Категориальные (номинальные, порядковые) * Числовые (дискретные, непрерывные)
• Другие (изображение / видео, временной ряд, текст)
Получение Данных
Pandas наше всё; рисуем, рисуем и еще раз рисуем
Предварительная Обработка:
* нормализация, стандартизация, степенное;
* Label/Ordinal/ OneHot Encoding
* Уменьшение размерности
Конструирование Признаков:
EDA читаем что умные люди пишут
Выбор Модели:
Интерпретируемость или точность %
Оценка Модели:
Перекрестная проверка,
Метрики (лучше несколько)
Настройка Модели:
GridSearch / RandomSeacrh, гиперпараметры предобработка и т.п.
Анализ Модели:
Визуализируем что можем в модели; смотрим где ошибаемся