Loading...
Для обучения нейросети разработчики использовали массив данных из сотен тысяч рукописных строк из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров. Материалы размечали и расшифровывали специальные эксперты. Они же контролировали качество распознавания.
«Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов», — сообщает пресс-служба Яндекса.
Новая технология повысит эффективность работы историков, социологов, демографов, генеалогов.
Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.