ОБРАБОТКА ЗВУЧАЩЕЙ РЕЧИ / PIPELINE SPEECH RECOGNITION / DSС HSE NN / ЛЕКЦИЯ 1

Лекция от представителя Тинькофф Екатерины Чуйковой о обработке звучащей речи, современный способах и архитектурах. 00:00 интро 1:06 вступление и план лекции 2:05 формулировка задачи 2:56 применение распознавания речи 4:43 проблемы 5:57 выравнивание 7:04 токены и их виды 8:10 выявление фичей из звука 12:46 другие способы выявления фичей 13:21 классическое акустической моделирование 13:51 end-to-end моделирование 15:07 пример выхода нейронной сети 16:37 переход от выравнивания к тексту: техники 17:29 минусы greedy decoding на примере 19:54 prefix beam search 22:54 оценивание правдоподобия последовательности слов 23:57 использование языковой модели с beam search 25:32 архитектура STT систем 26:29 метрики качества WER и LER 28:35 данные для обучения 29:28 дополнительные задачи при распознавании речи 31:00 confidence score для переранжирования гипотез 31:51 денормализация 32:52 endpointer, VAD для улучшения качества 35:15 разделение дикторов 36:24 голосовая активация 38:05 context biasing 39:54 команда Тинькофф
Back to Top