Обработка естественного языка (NLP) посредством spaCy и Python | Курс для начинающих | Эпизод 4

В этом видео. * Распознавание именованных сущностей. - Распознавание именованных сущностей NER - важная задача в NLP. Визуализация и анализ извлеченных данных. Атрибуты токена для извлечения и анализа информации. - Обсуждение основных элементов spaCy и машинного обучения. Важность понимания машинного обучения для работы с текстом. * Векторы слов. - Объяснение важности векторов слов для понимания текста. - Векторы слов как числовые представления слов (эмбеддинги) в многомерном пространстве. Использование векторов слов для анализа текста. Преимущества многомерного представления слов перед одномерным. - Обучение векторов слов. Использование больших коллекций текстов для понимания смысла слов. Важность понимания векторов слов для работы с NLP. - Использование векторов слов в spaCy, демонстрация на примерах. - Сходство векторов слов не определяет их синонимичность. Вычисление коэффициента сходства между объектами в spaCy через встраивание слов и предсказание биграмм. Использование эмбеддингов. Пример расчета сходства документов. • Автор: Dr. William Mattingly, канал (@freecodecamp) • Переводчики: Алексей Баврин, Екатерина Рубан • Редактор и чтец: Евгений Бартов • Оригинальное видео: --- Записаться на курсы переводчиков/учебную практику; заказать перевод/редактуру: ,
Back to Top