Введение в обработку естественного языка (Виталий Радченко)

В данной лекции слушатели узнают о том как предобрабатывать текстовые данные, извлекать признаки из текста, и превращать текст в числа. Будут разобраны популярные методы, такие как: - stemming, - bag-of-words, - n-граммы, - tf-idf перевзвешивание, - сингулярное разложение матриц слов и другие техники. Каждый трюк будет сопровождаться соответствующим кодом, используя Sklearn и/или другие библиотеки.
Back to Top