1912年,一份残余240页、从头至尾由未知文字与奇异插图写成的手稿在罗马附近的一所耶稣会大学图书馆中被波兰书商伏尼契(《牛虻》作者艾捷尔·丽莲·伏尼契的丈夫)发现并买下。
伏尼契手稿
碳十四测年法推定,这份手稿写成于15世纪初;但对于手稿的作者,没人能给出确切结论。手稿中的文字无法对应世界上任何一种已知语言,同时配有大量类似于植物、裸体人物以及天文符号的怪异图画;手稿从左至右书写十分流畅,没有明显的错误、修改痕迹甚至标点符号;同样地,没有任何类似密码对应的线索。
后世将这份神秘的手稿称为“伏尼契手稿”。无数密码学家、密码破译者乃至一战、二战中的情报人员在其面前束手无策。自“伏尼契手稿”被发现至今,无人能对手稿内容作出令人信服的解释。
简而言之,一本“天书”。
但最近,阿尔伯塔大学教授、自然语言处理专家Greg Kondrak和他的研究生Bradley Hauer宣称,运用人工智能,他们已经找到了破译“伏尼契手稿”的线索。
他们发现,“伏尼契手稿”上的文字实际上是古希伯来语,而且文字的排布有固定规律可循。
Kondrak称,研究的第一步,是找出手稿内容所使用的语言。为了达到这个目的,他们先让AI学习了以380种不同语言书写的《世界人权宣言》文本,以建立模式。在算法识别语言的准确率达到97%之后,AI对于“伏尼契手稿“进行了分析,判断文本内容有较高概率由加密过的希伯来语写成。
Kondrak和Hauer对此十分吃惊,在研究之初,他们本以为手稿中的文字是阿拉伯语。
“这很令人意外。”Kondrak在一份声明中说。“当然,告诉大家‘这是希伯来语’只是第一步,下一步要做的是搞清楚如何才能破译它。”
第二步,研究者们对于前人提出的一种假说进行了验证——有人认为,“伏尼契手稿”的文本规则其实是依照字母表排列顺序的异位构词法(举个例子,在此规则下,APPLE就会被转换为AELPP,BANANA就会变成AAABNN)。在先前的基础上,研究者们设计出了一种加入了这种构词规则,能将为本破译为正常希伯来语的算法。
“结果显示,超过80%的文本都能在一本希伯来语词典中找到,但我们还不知道这些单词拼在一起是否能说得通。”Kondrak说。
最后一步,研究者们依照上面的规则对手稿的第一句进行了破译。他们发现,在希伯来语中,破译所得结果并不能组成一个连贯的句子。
“然而,做过几次拼写上的修正后,谷歌翻译已经能够把它翻译成说得通的英文:
‘She made recommendations to the priest, man of the house and me and people.’”
研究者们在发表在《计算机语言协会学报》上的报告中如是写道。
Kondrak表示,对于“伏尼契手稿”的具体内容,他们其实依然不能理解。他认为,只有古希伯来方面的历史学家参与到研究中,他们才有对破译后的文本进行研究的机会。
与此同时,这支团队正计划将这种算法应用到其他古代文本的解读上。
作者系网易新闻·网易号“各有态度”签约作者
领取专属 10元无门槛券
私享最新 技术干货