Google представив ШІ-інструмент "Еней" для розшифровки стародавніх текстів: як він працюватиме

Транснаціональна корпорація Google представила нову модель штучного інтелекту для вивчення розшифровки стародавніх текстів. За допомогою ШІ "Еней" (Aeneas) з'явиться можливість розшифровувати латинські слова, яких бракує в давньоримських написах.
Нова розробка може стати революційним інструментом, який допоможе історикам розширити знання людства про минуле. Відповідне дослідження було опубліковано в журналі Nature.
Як працює нова модель ШІ
Модель штучного інтелекту "Еней" (Aeneas) здатна передбачити походження стародавніх латинських текстів, оцінити їхній вік і відновити відсутні частини. Інструмент розробили члени команди, яка створила раніше ШІ, здатний розшифровувати давньогрецькі написи.
Вивчення стародавніх написів, відомих як епіграфіка, є складним завданням, оскільки в деяких текстах відсутні літери, слова або фрагменти, а мовні особливості з часом змінюються. Історики аналізують тексти, порівнюючи їх з іншими написами, що містять схожі слова або фрази. Однак пошук цих написів вимагає неймовірно багато часу.
Щоб спростити відновлення, переклад та аналіз написів, команда, до якої увійшли дослідники з університетів Великої Британії та Греції, а також з лондонської компанії Google з розробки штучного інтелекту DeepMind, розробила генеративну модель штучного інтелекту, навчену на написах із трьох найбільших у світі баз даних латинської епіграфіки.
Об'єднаний набір даних містив текст з 176 861 напису – плюс зображення 5% з них – з датами від сьомого століття до нашої ери до восьмого століття нашої ери. Модель складається з трьох нейронних мереж, кожна з яких призначена для різних завдань: відновлення відсутнього тексту; передбачення походження тексту; і оцінка його віку. Поряд із результатами Aeneas також надає список схожих написів із набору даних для підтвердження своєї відповіді, ранжованих за ступенем їхньої релевантності до вихідного напису.
Реконструкція стародавніх текстів
Науковий співробітник Google DeepMind Янніс Ассаель зазначив, що "Еней" може миттєво витягувати відповідні паралелі з усього набору даних, оскільки кожен текст має унікальний ідентифікатор у базі даних. Команда перевірила точність і корисність моделі, попросивши 23 епіграфістів відновити текст, видалений із написів. Фахівцям також було запропоновано датувати написи і визначити їхнє походження, як самостійно, так і за допомогою моделі.
Самостійно експерти датували написи з точністю до 31 року від правильної відповіді. Дати, передбачені "Енеєм", виявилися правильними з точністю до 13 років.
Під час визначення географічного походження написів і відновлення фрагментів тексту фахівці, які мали доступ до списку схожих написів моделі та її прогнозів, виявилися точнішими, ніж фахівці, які працювали поодинці та використовували тільки модель. Крім того, маючи список і прогнози моделі, фахівці датували написи з точністю до 14 років від правильної відповіді.
Що передувало
Нещодавно було розроблено ШІ-інструмент під назвою Ithaca, здатний розшифровувати давньогрецькі написи, вік яких налічує тисячі років. Цей інструмент не тільки допомагає відновлювати загублені тексти, а й здатний визначати місце походження написів і навіть датувати їх з високим ступенем точності. Новий інструмент значно прискорює роботу епіграфістів, пропонуючи нові можливості для вивчення античної історії та культури.
Нагадаємо, український центр оцінювання якості освіти (УЦОЯО) планує залучити до перевірок відповідей на завдання національного мультипредметного тесту штучний інтелект. Поки що відомство, відповідальне за проведення тестування, не залучало такі технології.
Раніше OBOZ.UA розповідав, що діти змогли розгадати головоломку, яка виявилася не під силу ШІ.
Тільки перевірена інформація у нас у Telegram-каналі OBOZ.UA і Viber. Не ведіться на фейки!











