Распознавание и синтез речи. Классические методы распознавания речи – М. Ф. Аль-Шедиват

В данной лекции вы узнаете про классические методы распознавания и параметрического синтеза речи. Распознавание речи можно разделить на две фазы: акустическое моделирование и декодирование. На лекции были разобраны как генеративные (основанные на смесях Гауссиан [GMM]), так и дискриминативные (основанные на глубоких нейронных сетях [DNN] со стандартной кросс-энтропийной [CE] функцией потерь) подходы к акустическому моделированию, а также упрощенно показано, как выглядит построение HCLG-графа, и как происходит декодирование с его помощью. В области синтеза речи лектор вкратце затрагивает лишь один из множества подходов к решению данной задачи, основанный на рекуррентных нейронных сетях [RNN].
Back to Top