Как нейросеть научили читать тексты XVII века

Рукописи, может быть, и не горят, но точно ветшают и портятся. Понять, что написано в двухсотлетних документах, бывает непросто — и из-за их состояния, и из-за особенностей языка. Но на помощь приходят нейросети. В прошлом году Яндекс запустил «Поиск по архивам». Это сервис, который помогает людям искать упоминания своих предков в архивных документах так же, как в интернете. Для этого команда обучила модель читать старинные тексты, и она уже распознала миллионы страниц. 👀 Попробуйте найти в архивах корни своей семьи: Это рубрика «Вопрос со звёздочкой», в которой разработчики Яндекса простым языком объясняют сложные технологии. Татьяна Сапатова занимается распознаванием текста в Яндексе и, в частности, в «Поиске по архивам». В «Вопросе со звёздочкой» она рассказывает об особенностях дореформенной орфографии и поиске по старинным записям, которые раньше могли читать только эксперты. #поискпоархивам #технологии #нейросети #it #яндекс #генеалогия тайм-коды: 00:00 — Что такое «Поиск по архивам» 00:46 — Огонь, вода, титло и другие сложности распознавания 01:39 — Как эксперты учили нейросеть читать 02:37 — Как модель находила слова в узорах 03:22 — Планы на будущее
Back to Top