Loading...

Yannis Assael et al./Nature

Международная команда ученых создала новую генеративную модель ИИ Aeneas и обучила ее на более чем 176 тысячах латинских надписей. Aeneas выполняет три задачи — восстанавливает поврежденный текст, определяет его происхождение и предсказывает возраст. Модель поможет ускорить процесс восстановления латинских текстов и в 2 раза точнее датировать их. Исследование опубликовано в журнале Nature.

Изучение древних надписей — сложная задача. Часто в текстах не хватает букв, слов или целых фрагментов. Историки тратят много времени, чтобы понять, что было написано, когда и кем, сравнивая тексты, содержащие похожие слова или фразы.

Международная команда ученых решила упростить восстановление и анализ древних текстов. Они собрали более 176 тысяч латинских надписей и изображения 5% из них, датируемых от VII века до н. э. до VIII века н. э., и обучили на них генеративную модель искусственного интеллекта Aeneas, названную в честь легендарного предка основателей Рима.

Модель состоит из трех нейросетей: одна восстанавливает поврежденный текст, вторая определяет его происхождение, а третья — оценивает возраст документа. Когда Aeneas видит надпись с пропущенными частями, она подбирает похожие тексты из своего набора данных и предлагает наиболее вероятный вариант.

Исследователи протестировали модель вместе с 23 экспертами по древним надписям. Они восстановили текст из удаленных фрагментов, а также определили место и время создания надписей. Когда эксперты работали самостоятельно, они датировали текст с точностью до 31 года, в то время как Aeneas ошибался на 13 лет. Команда человека и ИИ показала средний результат: ошибки по датам сократились до 14 лет.

Кроме того, ученые проверили модель на знаменитом тексте Res gestae divi Augusti — автобиографии императора Августа. Aeneas верно определил эпоху создания текста, проигнорировав даты, упомянутые в надписях, и заметил важные орфографические особенности. Также модель хорошо показала себя при изучении алтаря с латинскими надписями и даже предложила похожие тексты с другого алтаря того же региона, не зная, что они связаны.

Пока Aeneas работает не идеально — она не справляется с уникальными надписями, для которых существует мало аналогов, и обучена на небольшом наборе данных. Однако уже сейчас модель может помочь историкам анализировать огромные объемы данных и ускорить поиск похожих древних текстов.


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.