Дмитрий Усталов: Применение Толоки для задач NLP

Data Fest Online 2021 NLP in industry track Спикер: Дмитрий Усталов, Аналитик-разработчик в Яндекс.Толоке Кандидат физико-математических наук 1. Что такое краудсорсинг и Яндекс.Толока? 2. Чем краудсорсинг полезен для задач NLP? (Создание эталонных наборов данных, доразметка ваших данных, использование в качестве baseline.) 3. Какие популярные наборы данных построены при помощи краудсорсинга? (SQuAD, TWSI, ImageNet, etc.) 4. Какие трудности есть с краудсорсингом в NLP? (Открытые ответы и отложенная приёмка, необходимость сведения к задачам классификации) 5. Что можно придумать? (Агрегировать тексты при помощи языковых моделей, методы RASA и HRRASA; Crowd-Kit; дорожка по сравнению методов) Посмотреть эфир и список треков и организаторов: Зарегистрироваться на фест и получить доступ к трекам: Вступить в сообщество: Соцсети Data Fest:

4 views

132