当前位置: 首页 > news >正文

利用人工智能破解中世纪密码

世界各地的图书馆和档案馆中都保存着被晦涩难懂的密码所掩盖的历史文献和信息。人工智能正在帮助历史学家破解这些神秘的文本。

在梵蒂冈图书馆的深处,一本神秘的手写书籍静静地躺在那里,四百多年来无人问津。书页上密密麻麻地写满了奇异的符号。根据封面内侧的文字记载,这些晦涩难懂的文字似乎隐藏着“治疗人体疾病”的秘方。在当时,这类疗法都被严加保密,因为它们可能会招致怀疑,甚至被指控为巫术。

这份被称为“博格密码”的408页手稿大部分内容难以理解——它使用34个晦涩难懂的符号、少量罗马字母以及一页阿拉伯文书写的封面进行编码。目前尚无已知的密钥可以破解加密内容。由于年代久远,部分页面已经破损,这使得密码的解读更加困难。

但借助机器学习(一种人工智能技术),研究人员成功破解了这段代码。他们发现,这段文字中充满了数千种奇特的疗法,例如饮用几杯优质红酒或在面团中发酵肉豆蔻来治疗痢疾。(您可以在梵蒂冈图书馆在线查看完整的加密文档,馆藏编号为 Borg.lat.898)。

“这就像侦探工作一样,每一个符号、模式和部分答案都可能让我们更接近某个人的秘密和一个失落的历史世界,”瑞典斯德哥尔摩大学计算语言学教授贝娅塔·梅格西说道,她是破译文本团队的成员之一。即使借助人工智能,破解密码的过程仍然十分艰辛。

现在,梅格西和她的同事们正致力于利用人工智能的力量更有效地破解历史密码,有可能解锁大量以前无法破解的古代编码信息。

这为罕见和非标准文字系统开辟了令人兴奋的可能性——贝娅塔·梅杰西

据估计,世界各地档案馆和图书馆中约有1%的资料被全部或部分加密。已知最早的一些密码可以追溯到古希腊和古罗马时期。

诱饵、死语言和糟糕的笔迹

这些加密的历史文献共同隐藏着外交情报、秘密社团的仪式、医学知识、爱情故事,以及人们想要保密的日常琐事。这些信息目前在历史叙述中缺失。在某些情况下,破译这些文献有可能改写我们对某个名人或整个历史时期的认知。(最近一个成功的例子是,人们发现了一些加密信件,这些信件是苏格兰女王玛丽在英格兰长期囚禁期间所写的。这些信件揭示了她参与夺回王位的阴谋,以及她与儿子——苏格兰国王詹姆斯六世(未来的英格兰国王詹姆斯一世)——之间紧张的关系。)

历史上的密码可能相对简单:例如,博格密码就使用了一种直接的替换密码,即用一个罗马字母替换每个符号来隐藏所写的内容。然而,其他一些密码则难以破解。在某些情况下,我们对未加密文本的原始语言一无所知。此外,还可以插入一些额外的、无意义的符号作为诱饵,以迷惑任何试图窥探文本的人。在其他情况下,多个符号可能被用来表示同一个字母。

这意味着即使解码一小段文字,也需要耗费大量精力——通常需要反复尝试。法国南锡国家信息与自动化研究所 (INRIA) 的密码学家塞西尔·皮埃罗和她的同事们花了六个月的时间,才逐步破解了一封五百年前写给神圣罗马帝国皇帝兼西班牙国王查理五世的信件。这封信共三页,使用了120种不同的密码符号。(解密后的信件揭示了查理五世——这位当时最有权势的人物之一——因担心有人密谋刺杀他而陷入困境。国王当时非常害怕,一位效力于法国国王弗朗索瓦一世的意大利雇佣军首领即将刺杀他。)

博格密码据信已有约 400 年的历史,其 408 页上混合了密码符号和一些拉丁文文字(图片来源:2026 年梵蒂冈宗座图书馆)。

在开始破译密码之前,研究人员必须先费力地将手写密码转换成可输入密码破解软件的数字文档。字迹潦草和墨迹褪色都会使这项任务更加困难。

皮埃罗说,她通常要花一天时间才能誊写一封两页的信,信中包含她不熟悉的符号。

人工智能如何帮助人们快速阅读秘密

但人工智能正在加速这一进程。挪威奥斯陆大学德语语言学教授米歇尔·瓦尔迪斯普尔(Michelle Waldispühl)及其同事最近利用名为Transkribus的在线人工智能平台,转录了贵族西吉斯蒙德·豪斯纳·冯·万德斯莱本(Sigismund Heusner von Wandersleben)于1637年写给瑞典大法官阿克塞尔·奥克森斯蒂尔纳(Axel Oxenstierna)的一封秘密信件。当时正值三十年战争的高峰期,这场宗教冲突最终夺去了数百万人的生命,并摧毁了欧洲的大片地区。

该工具已针对多种语言、文字和手写风格进行了训练,涵盖数个世纪。文档图像上传到系统后,人工智能会先检测文本块和单行,然后逐字扫描整个文本,将其转换为数字格式。

尽管需要进行一些人工校正,但该工具在解读冯·万德斯莱本的信件时效果相当不错,因为信件只有一部分使用了加密,加密方式是用数字和点分隔,这些数字书写工整,点与点之间留有明显的空格。其余部分则没有加密,而是直接用17世纪的德语字体书写。

现有的AI转录平台在处理使用特殊字符加密的手稿时往往举步维艰,例如自创符号、占星符号或书写方式奇特的数字。但作为跨国Descrypt项目的一部分,Megyesi、Waldispühl及其同事正在开发他们自己的AI工具,将包含晦涩符号或文字的手写历史文本转换为机器可读文档。

“我们正在开发更具适应性的模型,这些模型经过训练和测试,涵盖了广泛的文字、字母和符号体系,”梅格耶西说。

世界各地的许多档案馆和图书馆都保存着加密文本,其中可能包含宝贵的历史信息(图片来源:Getty Images)。

一旦秘密文件被转录完毕,破解工作便可展开。目前,密码学家通常使用专门设计的非人工智能计算机软件来辅助这项工作,这些软件利用算法来尝试确定所使用的密码并破解密码。简单的密码通常可以通过分析符号的使用频率,并将其与语言中出现频率相同的字母进行匹配来破解。例如,在英语中,字母 E 最为常见,而 Z、Q 和 X 则最少见。

例如,在冯·万德斯莱本从三十年战争前线寄出的信中,他使用了多达八个不同的符号来表示字母 E。这意味着需要反复试验,以及瓦尔迪斯普尔对古德语的了解,才能逐渐破解这个密码。

“这很大程度上是机器和人工验证者之间的反复交互,”瓦尔迪斯普尔说。“也许在某个时候,人工智能可以完全独立地完成这项工作。”

密码背后隐藏着冯·万德斯莱本对瑞典新教盟友在战争中各派系构成的威胁的警告。他告诉奥克森斯蒂尔纳,在得知盟友中存在阴谋(其中包括萨克森的弗朗茨·海因里希勋爵)后,他被迫从冲突中采取战略撤退。

重新开启冷案代码

梅格耶西和她的团队目前正在探索人工智能如何完全跳过转录阶段,仅通过分析书页照片来破译秘密信息。他们最近展示了这种方法如何应用于简单的密码,其中每个字母都被替换成一个符号。

他们用一份已破译的105页手稿测试了这套系统,这份手稿被称为“科皮亚莱密码”,详细记录了18世纪德国一个秘密社团的仪式、规则和理念。通过先用通用手写体训练人工智能,再用密码中特定行的图像以及相应的已解码德语文本进行训练,该系统能够准确破译之前未曾见过的文本部分。

当密码的底层语言未知时,这样的系统尤其有用。

“这为罕见和非标准文字系统开辟了令人兴奋的可能性,”梅格耶西说。“最终目标是将转录和破译合二为一。”

在克里特岛米诺斯宫殿遗址中发现的拥有4000年历史的费斯托斯圆盘上的符号至今仍大多未被破译(图片来源:Getty Images)。

瓦尔迪斯普尔和她在Descrypt项目中的同事们一直在搜寻旧档案,寻找密码脚本并将其汇编成数据库。这对于收集足够的数据来训练能够破解密码的人工智能至关重要。支撑诸如ChatGPT之类的AI聊天机器人的大型语言模型,都是基于来自书籍、文章和网站的数万亿个单词进行训练的。而要找到与此相当数量的数据用于密码破解,则极具挑战性。

他们收集的资料中包括400张神秘的明信片,这些明信片是用密码文字书写的,时间跨度从19世纪末到20世纪初。目前破译的少量碎片显示,其中一些是用德语写的爱情信。

梅格耶西的团队利用他们的研究成果,开发了一种人工智能聊天机器人式的工具,该工具将转录和解密功能集成于一体。这款聊天机器人结合了基于密文字符及其对应文本对训练的解密算法,以及基于不同历史时期文本训练的大型语言模型,从而帮助用户找到密码线索。此外,该工具还整合了基于标注手写文本训练的图像识别算法。该人工智能工具还能通过吸收专家用户的纠错意见来不断改进自身。

其理念是,研究人员甚至公众可以向聊天机器人提供一段编码的历史文本,并让它揭示文本的内容。

当研究人员使用博格密码测试他们的AI聊天机器人时,梅格耶西和她的同事发现,它能在29分钟多一点的时间内翻译并解码一段包含500个符号的文本。它甚至还提供了英文翻译。此外,它还记录了整个过程,并解释了解决方案的合理性。这对于确保AI没有产生幻觉或捏造解释至关重要。

该团队最近还用之前破译过的另外两种密码对该系统进行了测试,这两种密码分别代表不同的时期、语言、密码类型和复杂程度。系统也迅速破译了这两种密码,表明它能够应对多种密码。

人工智能在规模、速度、模式发现和任务整合方面最有帮助。

这类人工智能工具或许是破解至今仍难以捉摸的历史密码的关键。它们还有助于解读用现代人无法辨认的字母书写的古代文献。例如,克里特岛出土的拥有4000年历史的费斯托斯圆盘至今仍未被破译,早期希腊语“线性文字A”也同样如此。

令我兴奋的不仅是解决某个具体历史谜题的可能性,更是创造出可以帮助研究人员处理许多不同案例的方法的前景。

http://www.jsqmd.com/news/952075/

相关文章:

  • ai赋能jenkins:用快马平台智能生成与优化持续集成流水线脚本
  • 如何突破百度网盘下载限制:终极解析工具完全指南
  • 【结果+代码】2026中青杯B题第一问建立无参考图像质量评价(NR-IQA)的数学模型
  • 2026 年深圳全屋定制衣柜橱柜酒柜 10 万以内怎么选不踩坑 - 产品测评官
  • 2026年广东可靠的全屋定制工厂平台深度解析:如何选择真正省心的服务商? - 2026年企业资讯
  • 模型轻量化实战:将DenseNet-169部署到树莓派4B上做图像分类(附完整onnx转换与推理代码)
  • B站成分检测器:智能用户分析工具,让评论区身份一目了然
  • 2026年更新:特种电磁阀实力厂家宁波安利特的深度解析与选型指南 - 2026年企业资讯
  • WCH-Link Utility隐藏功能挖掘:不止烧录,还能一键读保护、读Flash和批量操作
  • 加油卡小程序开发玩法深度解析:功能架构、营销体系与落地方案
  • Python中类方法、静态方法、实例方法是否能访问类属性和实例属性
  • low-memory-server-swap-20260601
  • STC89C52电子时钟DIY避坑指南:从洞洞板飞线到Keil编程的完整心路历程
  • 驾校招生、排课、收费、考试全环节落地的SpringBoot+Vue可运行系统(含建库脚本与部署文档)
  • 云原生流量均衡调优:就绪探针优化与 IPVS 容器节点负载均匀分配机制
  • 高防CDN专注网站防御加速服务
  • 调试PHY芯片时,为什么插拔网线才能恢复网速?聊聊AR8035的硬复位与软复位
  • Windows Defender Remover终极指南:彻底解决“Device Guard Blocked“错误的3种方案
  • 星辰变归来最新官方下载渠道6月最新
  • 一文讲透必懂的RAG20个核心概念:从0到 1 学会
  • 方法概述,方法的其他形式,使用常见问题
  • 从EFPLMN到EFFPLMN:实战解析USIM卡如何影响你的手机搜网与信号
  • 从人的双眼到工程双目:双目立体视觉原理、同步方案与 2026 年算法突破
  • 保姆级教程:用Altium Designer导出Gerber文件,一次搞定PCB打样(附常见错误排查)
  • VcXsrv:Windows系统上运行Linux GUI应用的终极解决方案
  • 生态学家别再用SIAR了!手把手教你用R包SIMMR搞定稳定同位素混合模型分析
  • 如何用Zotero Style插件打造你的个性化文献管理系统
  • 盲盒潮玩一番赏小程序开发玩法分析:算法逻辑、功能架构与合规落地
  • ALMA观测揭示HD 100456原行星盘螺旋结构与行星形成机制
  • Jellyfin 卡顿是服务器不够吗?先分清转码和直播放