
Еще недавно расшифровка древних рукописей была делом на годы - с гипотезами, версиями, спорами... Но тексты, написанные на неизвестных языках или зашифрованные сложным кодом, так и оставались нераспознанными. А обугленные свитки или тщательно вымаранные строки считались утраченными навсегда.
Но все изменилось с появлением искусственного интеллекта. Нейросети научились «видеть» скрытые закономерности, восстанавливать утраченные фрагменты и читать то, что раньше было нечитаемым. В итоге молчавшие веками тексты наконец заговорили.
История, которая могла бы затеряться в пыльных архивах, неожиданно получила вторую жизнь благодаря ИИ. Речь идет о любовном письме, написанном в Англии в феврале 1477 года. В нем девушка по имени Марджери Брюс обращалась к своему жениху Джону Пастону III из Топкрофта (графство Норфолк).

До этого понять смысл послания было невозможно: оно составлено в неформальной манере, с вольной орфографией, личными сокращениями и непонятными символами. Но эксперты компании MyHeritage призвали на помощь недавно созданную нейросистему Scribe, которая и перевела текст письма на современный язык, «расшифровав» эмоции и контекст, скрытые за архаичной формой. И выяснилось, что в XV веке люди переживали те же драмы, что и сегодня: пылкие чувства сталкивались с прозаической нехваткой денег...
Марджери писала, что у нее тяжело на душе: ее матери не удалось уговорить отца увеличить приданое. У Джона личных средств было маловато, и брак оказался под угрозой. Но девушка заверяла жениха, что не отказалась бы от него, даже если бы его положение было вдвое хуже. Заодно она просила сохранить содержание письма в тайне.
К счастью, та коллизия разрешилась благополучно. Из архива семьи Пастонов известно, что Марджери и Джон все-таки поженились, и в 1479 году у пары родился сын.
Благодаря современным генеалогическим сервисам удалось разыскать их потомков. Некоторые из них признались, что эта история помогла им по-новому взглянуть на прошлое: стало очевидно, что люди того времени гораздо ближе к нам, чем кажется.
Еще одна рукопись XV века, над которой годами ломали головы, наконец приоткрыла свою тайну - и снова благодаря искусственному интеллекту. «Манускрипт Войнича», купленный подданным Российской империи аптекарем и антикваром Вильфредом Войничем в 1912 году, долго считался либо мистификацией, либо шифром, к которому нет ключа.

240 страниц странных символов и не менее загадочных иллюстраций: фантастические растения, астрономические схемы и сцены с обнаженными женщинами в зеленой жидкости. За сто лет текст пытались расшифровать профессиональные криптографы, лингвисты и просто энтузиасты - безрезультатно.
Все изменилось в 2023 году, когда российские ученые из Сколтеха подключили к анализу нейросеть. ИИ нашел скрытые закономерности и показал: это не бессмыслица, а созданный на основе придуманного алфавита искусственный язык с элементами латыни и романских наречий.
Удалось расшифровать отдельные фрагменты, и они оказались неожиданно «практичными». В манускрипте речь идет о ботанике и фармацевтике. Правда, содержание соответствует уровню знаний полутысячелетней давности: часть описанных растений действительно существует, часть - гибриды, а некоторые выглядят полностью вымышленными.
Самое любопытное - рецепты. В тексте есть инструкции по созданию лекарств, и некоторые из них перекликаются с тем, что современная наука только начинает изучать. Это уже заинтересовало фармацевтические компании.
И хотя прорыв произошел, финала пока нет. Кто и зачем создал этот манускрипт - по-прежнему неизвестно. Нейросеть лишь приблизила разгадку, но сохранила интригу.
Внезапно начали раскрываться уж совсем «безнадежные» тексты, пережившие знаменитое извержение Везувия в 79 году н. э. Эти папирусы хранились в библиотеке города Геркуланума, где было около двух тысяч рукописей. После катастрофы они превратились в обугленные свитки. При попытке развернуть их рукописи рассыпались в прах.

Считалось, что заглянуть в эти тексты не удастся уже никогда. Но три года назад был объявлен конкурс Vesuvius Challenge («Вызов Везувия»). Участникам дали КТ-сканы свитков и предложили раскрыть их цифровым способом. Победили трое студентов-программистов, которые несколько месяцев работали над одной из «сгоревших» рукописей.
Первая удача случилась, когда удалось распознать слово «фиолетовый». А затем с помощью нейросетей команда извлекла уже тысячи знаков. И содержание оказалось неожиданно простым и понятным. Это философское рассуждение об удовольствии - от еды, музыки и вообще от жизни, а также о том, как с этим связано чувство страха. По мнению экспертов, автором мог быть философ-эпикуреец Филодем из Гадары.
Главное здесь даже не сам текст, а метод. Теперь ясно: и тронутые огнем рукописи можно читать. А значит, впереди - новые находки.
ИИ добрался не только до средневековых шифров и античных свитков: у нас в России под «цифровую лупу» попали черновики Пушкина. Специалисты российской компании Smart Engines использовали нейросетевую систему «Да Винчи», чтобы восстановить слова и целые строфы, которые поэт когда-то густо зачеркнул, работая над своими сочинениями. Алгоритм изучил почерк Александра Сергеевича, запомнил характерные движения пера и на их основе «дописал» утраченные фрагменты.
Изначально эта технология создавалась для других задач - например, для распознавания паспортов. Она умеет определять геометрию документа, игнорировать помехи, работать с фото под любым углом и даже с зеркальными изображениями. Но, как оказалось, тот же принцип отлично подходит и для работы с рукописями.
В итоге удалось восстановить несколько отрывков, которые поэт выбраковал. А это уже не просто технический трюк, а вклад в понимание того, как именно работал Пушкин. Какие формулировки ему не нравились, где он сомневался, что переписывал: все это проступило сквозь чернила.
Вот пример. В известном стихотворении «Храни меня, мой талисман» Пушкин в строчке со словами «мятежный сладостный обман» зачеркивает «мятежный» и вместо этого пишет «священный», полностью меняя смысл фразы.
Но тут возникает закономерный вопрос. Если автор сознательно зачеркивал слова, возможно, он не хотел, чтобы их кто-то когда-либо увидел. И теперь, когда нейросети научились эти слова возвращать, граница между исследованием и вторжением в замысел становится совсем уж прозрачной.
КОМПЕТЕНТНО
- Искусственный интеллект сегодня - всего лишь инструмент, - напоминает обозреватель «Новости IT-канала» Александр Маляревский. - По сути, это система, которая ищет сложные закономерности в огромных массивах информации. Расшифровывая сложные тексты, ИИ не «владеет» языком, которого нет в его данных. Он не даст готового ответа, но может помочь найти к нему дорогу: разбить задачу на части, найти повторяющиеся структуры и подтолкнуть исследование в нужную сторону.
При этом всегда остается риск ошибок. Если принять неточную расшифровку за истину и на ее основе двигаться дальше, можно получить цепочку искажений. Отсюда главный вывод: исследование должен вести человек. Он ставит задачи, подбирает данные, интерпретирует результат и несет за него ответственность. Как, например, в медицине: нейросеть способна анализировать снимки МРТ, но окончательное решение все равно за врачом.