InScience

rawpixel.com / Freepik

Яндекс обучил свои нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Попробовать технологию в действии уже можно в сервисе «Поиск по архивам», сообщает ТАСС.

Для обучения нейросети разработчики использовали массив данных из сотен тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров. Материалы размечали и расшифровывали специальные эксперты. Они же контролировали качество распознавания.

«Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов», — сообщает пресс-служба Яндекса.

Новая технология повысит эффективность работы историков, социологов, демографов, генеалогов.

Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.

Тэги