DL2022: Генерация текстов (NLG, часть 1)

Представление слов: токенизация на подслова (byte-pair encoding (BPE), wordpiece, unigram language model, sentencepiece), посимвольный подход (представления слов из анализа символов, Compositional Character Model, Character-Aware NLM), гибридный подход (действуем на уровне слов, если надо – на уровне символов, Compositional Character Model, Character-Aware NLM).
Back to Top