Історичні послання та документи, зашифровані незрозумілими шифрами, можна знайти в бібліотеках та архівах по всьому світу. Штучний інтелект допомагає історикам розшифрувати ці загадкові тексти. Глибоко в архівах Ватиканської бібліотеки понад 400 років лежала непрочитаною таємнича рукописна книга, заповнена дивними символами.
Згідно з написом на внутрішній стороні обкладинки, її загадкові сторінки, судячи з усього, приховували секретні ліки «від недуг людського тіла». Такі лікувальні практики в той час трималися в таємниці, оскільки могли викликати підозри або навіть звинувачення в чаклунстві.
Відомий як шифр Борга, цей рукопис обсягом 408 сторінок здебільшого незрозумілий — він закодований за допомогою 34 незрозумілих символів з кількома римськими літерами, а титульна сторінка написана арабською мовою.
Не було відомого ключа, який би розшифрував зашифроване. Деякі сторінки також пошкоджені через свій вік, що ще більше ускладнює розшифрування коду. Але за допомогою машинного навчання — форми штучного інтелекту — дослідники змогли розгадати код.
Вони виявили, що текст був наповнений тисячами дивних методів лікування, таких як вживання кількох склянок високоякісного червоного вина або ферментація мускатного горіха в тісті для боротьби з дизентерією.
«Це нагадує детективну роботу, де кожен символ, візерунок і часткове рішення можуть наблизити нас до чиїхось таємниць і до втраченого історичного світу», — каже Беата Мегеші, професорка комп’ютерної лінгвістики у Стокгольмському університеті у Швеції, яка була частиною команди, що розшифрувала текст.
Навіть за допомогою ШІ процес розшифрування ключа був кропітким.
Зараз Мегеші та її колеги очолюють зусилля з використання можливостей штучного інтелекту для розшифрування історичних шифрів, що потенційно може відкрити багатство закодованої інформації з минулого, яка раніше була нерозшифрованою.
За деякими оцінками, близько 1% матеріалів в архівах та бібліотеках по всьому світу є повністю або частково зашифрованими.
Деякі з найдавніших відомих шифрів датуються часами Стародавньої Греції та Риму.
Приманки, мертві мови та нерозбірливий почерк
У сукупності зашифровані історичні документи приховують дипломатичну розвідку, ритуали таємних товариств, медичні знання, любовні романи або повсякденні подробиці, які люди хотіли зберегти в таємниці.
Це інформація, якої наразі бракує в історичних наративах. У деяких випадках розшифрування цих документів може переписати те, що ми знаємо про відому особистість або цілий період історії.
Одним із недавніх прикладів такого шифру була колекція зашифрованих листів, які, як виявилося, були написані Марією, королевою Шотландії, під час її тривалого ув’язнення в Англії. Вони розкрили її участь у змовах з метою повернення трону та її напружені стосунки з сином, Яковом VI Шотландським і майбутнім королем Яковом I Англійським.
Історичні шифри можуть бути відносно простими: наприклад, шифр Борга використовує простий шифр заміни, що означає, що кожен символ замінювався однією римською літерою, щоб приховати написане.
Інші, однак, можуть бути важкими для розшифрування. У деяких випадках нічого не відомо про мову оригіналу, якою був написаний нешифрований текст. Додаткові, беззмістовні символи також можуть бути вставлені як приманка, щоб збити з пантелику тих, хто сподівається підглянути текст.
В інших випадках для позначення однієї літери може використовуватися кілька знаків. Це може означати величезний обсяг роботи — часто пов’язаний із методом проб і помилок — для розшифрування навіть невеликого обсягу тексту.
Сесіль П’єро, криптолог з Французького національного інституту досліджень в галузі інформатики (INRIA) у Нансі, Франція, та її колеги витратили шість місяців, щоб поступово розгадати ключ до 500-річного листа від Карла V, імператора Священної Римської імперії та короля Іспанії, який був написаний з використанням 120 різних шифрувальних символів на трьох сторінках.
Розшифрований лист показав, що Карл V – один із наймогутніших людей свого часу – був збентежений страхом перед змовою з метою його вбивства. Король був наляканий тим, що італійський найманий воєначальник, який служив французькому королю Франциску I, збирався його вбити.
Перш ніж розпочати розшифрування, дослідники повинні спочатку ретельно перетворити рукописний шифр на цифровий документ, який можна завантажити в програмне забезпечення для розшифрування.
Нерозбірливий почерк і вицвіле чорнило можуть ще більше ускладнити це завдання.
П’єро каже, що зазвичай їй потрібно цілий день, щоб просто розшифрувати двосторінковий лист, що містить незнайомі їй символи.
Як ШІ допомагає швидше розшифровувати таємниці
Але ШІ починає прискорювати цей процес.
Мішель Вальдіспуль, професорка німецької лінгвістики в Університеті Осло в Норвегії, та її колеги нещодавно використали онлайн-платформу штучного інтелекту під назвою Transkribus для транскрибування таємного листа, написаного аристократом Зигмундом Хойснером фон Вандерслебеном до шведського верховного канцлера Акселя Оксеншерни в 1637 році, у розпал Тридцятирічної війни — релігійного конфлікту, який зрештою забрав мільйони життів і спустошив величезні території Європи.
Цей інструмент було навчено розпізнавати різні мови, алфавіти та стилі почерку, що охоплюють кілька століть. Після завантаження зображення документа в систему штучний інтелект виявляє блоки тексту та окремі рядки, а потім сканує весь текст символ за символом, перетворюючи його в цифрову форму.
Хоча знадобилися деякі ручні виправлення, інструмент досить добре впорався з листом фон Вандерслебена, оскільки він був зашифрований лише частково за допомогою цифр, розділених крапками, які були акуратно написані з чіткими пробілами між ними. Інші частини не були закодовані і просто написані німецьким шрифтом 17 століття.
Існуючі платформи транскрипції на основі штучного інтелекту часто стикаються з труднощами, коли рукописи зашифровані незвичайними символами, такими як вигадані знаки, астрологічні символи або цифри, написані дивним чином.
Але Мегеші, Вальдіспуль та їхні колеги розробляють власний інструмент на основі штучного інтелекту, щоб перетворювати рукописні історичні тексти з незрозумілими символами або шрифтами на документи, придатні для машинного зчитування, в рамках багатонаціонального проєкту Descrypt.
«Ми розробляємо більш адаптивні моделі, навчені та протестовані на широкому спектрі шрифтів, алфавітів та символічних репертуарів», — каже Мегеші.
Після транскрибування секретного документа можна розпочинати детективну роботу. Наразі криптологи часто використовують спеціально розроблене комп’ютерне програмне забезпечення, що не базується на штучному інтелекті, яке використовує алгоритми для визначення, який шифр було використано, та розшифрування коду.
Прості шифри часто можна розшифрувати, проаналізувавши частоту використання символів та зіставивши їх із літерами алфавіту, які зустрічаються з такою самою частотою в мові. Наприклад, в англійській мові літера E є найпоширенішою, тоді як Z, Q та X — найрідкіснішими.
Але, наприклад, у листі фон Вандерслебена з фронту Тридцятирічної війни він використовував до восьми різних символів для позначення літери E. Це означало, що для поступового розшифрування коду були потрібні метод проб і помилок, а також знання Вальдіспуля старонімецької мови.
«Це був постійний обмін між машиною та людиною, яка перевіряла результати», — каже Вальдіспуль. «Можливо, колись штучний інтелект зможе робити це повністю самостійно».
За шифром ховалися попередження фон Вандерслебена про загрозу, яку становили угруповання шведських протестантських союзників у війні.
Він повідомив Оксеншерні, що був змушений здійснити стратегічний відступ з конфлікту після того, як дізнався про змову серед своїх союзників, зокрема лорда Франца Генріха Саксонського.
Повернення до розшифрування старих кодів
Мегесі та її команда зараз досліджують, як ШІ може взагалі оминути етап транскрипції, просто аналізуючи фотографії сторінок для розшифрування таємних повідомлень.
Нещодавно вони продемонстрували, як цей підхід може працювати для простих кодів, де кожна літера замінена одним символом.
Вони протестували систему на 105-сторінковому рукописі, який вони вже розшифрували, відомому як шифр Копіале, що детально описує ритуали, правила та ідеали німецького таємного товариства 18 століття.
Навчивши ШІ розпізнавати загальний почерк, а потім показавши йому зображення конкретних рядків з шифру та відповідний розшифрований німецький текст, система змогла точно розшифрувати частини тексту, яких раніше не бачила.
Така система може бути особливо корисною, коли мова, на якій написано шифр, невідома.
«Це відкриває захоплюючі можливості для рідкісних і нестандартних систем письма», — каже Мегєші. «Кінцева мета — об’єднати транскрипцію та розшифрування в один крок».
Вальдіспуль та її колеги з проєкту Descrypt ретельно досліджують старі архіви у пошуках шифрованих текстів для створення бази даних. Це може виявитися життєво важливим для збору достатньої кількості даних для навчання ШІ, здатного розшифровувати коди. Великі мовні моделі, на яких базуються чат-боти ШІ, такі як ChatGPT, навчаються на трильйонах слів із книг, статей та веб-сайтів.
Знайти еквівалентну кількість даних для розшифрування кодів є складним завданням.
Серед зібраних матеріалів — 400 загадкових листівок, написаних шифрованим текстом, що датуються періодом від кінця 1800-х до початку 1800-х років.
Кілька фрагментів, розшифрованих на сьогодні, свідчать, що деякі з них є любовними листами, написаними німецькою мовою.
Команда Мегесі використала результати своєї роботи для створення інструменту у стилі чат-бота на базі штучного інтелекту, який поєднує транскрипцію та дешифрування в одному кроці.
Чат-бот поєднує алгоритми дешифрування, навчені на парах шифрованих символів та тексті, який вони представляють, з великими мовними моделями, навченими на історичних текстах з різних періодів, щоб допомогти надати підказки щодо коду.
Також використовуються алгоритми розпізнавання зображень, навчені на анотованому рукописному тексті.
Інструмент на базі штучного інтелекту також зможе самоудосконалюватися, враховуючи виправлення від експертів, які ним користуються.
Ідея полягає в тому, що дослідники, або навіть широка громадськість, зможуть надати чат-боту зашифрований історичний текст, і той розшифрує його.
Під час тестування свого чат-бота на базі штучного інтелекту з використанням шифру «Борг» Мегєші та її колеги виявили, що він здатний перекласти та розшифрувати фрагмент із 500 символів трохи більше ніж за 29 хвилин.
Він навіть надав переклад англійською мовою. Крім того, система задокументувала процес і пояснила, чому отримане рішення є правдоподібним. Це важливо для того, щоб переконатися, що штучний інтелект не «марить» і не вигадує інтерпретацій.
Команда також нещодавно протестувала систему з двома іншими шифрами, які вони раніше розшифрували і які представляють різні часові періоди, мови, типи секретних кодів та рівні складності. Вона швидко розшифрувала їх також, продемонструвавши, що здатна впоратися з широким спектром шифрів.
«Штучний інтелект найбільше допомагає з масштабом, швидкістю, виявленням закономірностей та інтеграцією завдань», — каже Мегєші.
Такі інструменти штучного інтелекту можуть стати ключовими для розшифрування історичних шифрів, які досі залишалися нерозгаданими. Вони також допоможуть розшифрувати стародавні тексти, написані алфавітами, які сьогодні ніхто не може прочитати. Наприклад, 4000-річний Фаїстський диск з Криту залишається нерозшифрованим, як і давньогрецька мова «Лінійне письмо А».
«Мене захоплює не лише можливість розгадати одну конкретну історичну загадку, а й перспектива створення методів, які можуть допомогти дослідникам у багатьох різних випадках», — каже Мегєші.
Джерело: www.bbc.com/future/article/20260527-plots-love-letters-and-diplomacy-the-medieval-secrets-being-revealed-by-ai
Ми збираємо новини з Reuters, BBC, Bloomberg та інших світових ЗМІ.
Коротко, факти, без фейків та зайвого галасу.
👉 Підписуйтесь у Telegram