《自然》- 人工智能首次破解古代赫库兰尼姆古卷的文本

《自然》周刊报道,机器学习技术在 CT 扫描中揭示了烧焦卷轴中希腊单词。

在富裕小镇赫库兰尼姆的一座别墅中出土的碳化纸莎草卷轴,该别墅被公元 79 年的维苏威火山喷发摧毁。

研究人员今天宣布,在“阅读”这些脆壳内记录的文字方面取得了重大进展,其中可能包括以前未知的古代文字文,包括文学和哲学作品。

青年学生 赢得全球竞赛

Brent Seales 和他的团队在法兰西学院对带有红色激光线的赫库兰尼姆卷轴进行 3D 扫描。赫库兰尼姆古卷是世界上大量受损手稿中最具标志性且难以接触的古卷之一。

来自赫库兰尼姆的烧焦卷轴无法轻易打开,但 X 射线扫描可以揭示其内容。

一名 21 岁的计算机科学专业学生赢得了一场全球竞赛,阅读了来自古罗马城市赫库兰尼姆的碳化卷轴中的第一篇文字,该卷轴自公元79 年火山喷发以来就无法阅读——与埋在庞贝城附近的火山喷发的是同一个。这一突破可能会从希腊罗马古代唯一保存完好的图书馆中打开数百篇文本。

内布拉斯加大学林肯分校的卢克·法里托 (Luke Farritor) 开发了一种机器学习算法,可以检测卷起的纸莎草纸上几行的希腊字母,其中包括 πορphiυρας ( porphyra s),意思是“紫色。法里托利用表面纹理的微妙、小范围差异来训练他的神经网络并突出墨水。

“当我看到第一张图像时,我感到震惊,”意大利那不勒斯大学的纸莎草学家、审查法里托研究结果的学术委员会成员费代丽卡·尼科拉迪 (Federica Nicolardi) 说。“这真是一个梦想,”她说。现在,“我实际上可以从卷轴的内部看到一些东西。”

公元79 年10 月,维苏威火山喷发,赫库兰尼姆被埋在 20 米深的火山灰下,数百卷卷轴被掩埋。早期打开纸莎草纸的尝试产生了一堆碎片,学者们担心其余部分永远无法展开或阅读。“这些都是如此疯狂的物体。它们都皱巴巴的,压碎了,”尼科拉迪说。

维苏威火山挑战赛设有一系列奖项,阅读卷轴中的四个或更多段落即可获得 70 万美元的大奖。10 月 12 日,组织者宣布,Farritor 因在 4 平方厘米的纸莎草纸上阅读了 10 个以上的字符而获得了 4 万美元的“首字母”奖。柏林自由大学的研究生尤瑟夫·纳德 (Youssef Nader) 获得第二名,获得 10,000 美元奖金。

豪华图书馆

意大利威尼斯卡福斯卡里大学的古​希腊和罗马历史学家西娅·萨默斯希尔德 (Thea Sommerschield) 表示,最终看到卷轴中的字母和文字“非常令人兴奋”。这些古卷是在十八世纪发现的,当时工人们发现了一栋豪华别墅的遗迹,该别墅可能属于尤利乌斯·凯撒的岳父家族。萨默斯希尔德说,破译纸莎草纸可能“彻底改变我们对古代历史和文学的认识”。当今已知的大多数古典文本都是几个世纪以来抄写员反复抄写的结果。相比之下,赫库兰尼姆图书馆包含来自任何其他来源、直接来自作者的作品。

到目前为止,研究人员只能研究打开的片段。一些拉丁文著作已被确定,但其中大多数包含与伊壁鸠鲁哲学学派相关的希腊文本。《论自然》的某些部分是由伊壁鸠鲁本人撰写的,还有一位名叫菲洛莫斯的名不见经传的哲学家关于恶习、音乐、修辞和死亡等主题的著作。有人认为,该图书馆可能曾经是他的工作藏品。但 600 多幅卷轴——大部分保存在那不勒斯国家图书馆,少数保存在英国和法国——仍然完好无损且未拆封。在别墅的较低楼层仍然可以找到更多的纸莎草,这些纸莎草尚未被挖掘。

Seales 和他的团队花了数年时间开发方法,使用 X 射线计算机断层扫描 (CT) 扫描“虚拟地解开”极薄的层,并将它们可视化为一系列平面图像。2016 年,他报道1使用该技术阅读了以色列恩基地 (En-Gedi) 的一本烧焦的卷轴,揭示了《利未记》(犹太律法和基督教《旧约》的一部分)的部分内容,写于公元三世纪或四世纪。但恩基底卷轴上的墨水含有金属,因此在 CT 扫描上它会发出明亮的光芒。较旧的赫库兰尼姆卷轴上的墨水是碳基墨水,本质上是木炭和水,在扫描中与它所在的纸莎草纸具有相同的密度,因此它根本不会显示出来。

Seales 意识到,即使亮度没有差异,CT 扫描也可能捕捉到纹理上的微小差异,从而区分涂有墨水的纸莎草区域。为了证明这一点,他训练了一个人工神经网络来读取打开的赫库兰尼姆碎片的 X 射线图像中的字母。然后,在 2019 年,他将两幅完整的卷轴从巴黎的法兰西研究所带到英国牛津附近的同步加速器 X 射线设备 Diamond Light Source,以迄今为止最高分辨率(每张 3D 图像 4-8 微米)扫描它们。元素或体素)。

然而,阅读完整的卷轴仍然是一项艰巨的任务,因此该团队向公众发布了所有扫描结果和代码,并发起了维苏威火山挑战。“我们都同意,我们宁愿早点阅读里面的内容,也不愿试图囤积所有东西,”西尔斯说。

大约 1,500 个团队很快就通过玩家聊天平台 Discord 进行讨论和协作。奖品是分阶段设计的,当达到每个里程碑时,获奖代码就会发布,供每个人使用。法里托一直对历史很感兴趣,小时候自学了拉丁语,很早就参与其中。

与此同时,西尔斯的团队致力于虚拟展开,发布压平碎片的图像供参赛者分析。六月下旬出现了一个关键时刻,当时一位参赛者指出,在某些图像上,肉眼偶尔可以看到墨水,这是一种微妙的纹理,很快被称为“裂纹”。法里托立即将注意力集中在噼啪声上,寻找进一步的字母暗示。

八月的一个晚上,他在参加一个聚会时收到一条提醒,称有一个新片段已发布,并且爆裂声特别明显。他通过手机连接,在新图像上运行算法。一个小时后,他走回家,拿出手机,看到屏幕上有五个字母。“我上蹿下跳,”他说。“哦,天哪,这真的有用。” 从那时起,仅用了几天时间就完善了模型并确定了奖品所需的十个字母。

维苏威火山挑战中破译的第一个词是希腊语πορφύρας,意思是“紫色”。

肯塔基大学数字修复项目主任布伦特·西尔斯正在检查赫库兰尼姆古卷的一部分。

计算机工程师在其中一个卷轴中发现了一个古希腊单词:πορφύραc,意思是紫色。

纸草学家也很兴奋。在打开的赫库兰尼姆古卷中尚未读到“紫色”一词。紫色染料在古罗马非常受欢迎,是由海蜗牛的腺体制成的,因此这个术语可以指紫色、长袍、能买得起染料的人的等级,甚至是软体动物。但尼科拉迪说,比单个单词更重要的是阅读任何内容。这一进展“使我们有可能恢复整个卷轴的文本”,包括标题和作者,以便可以识别作品并注明日期。

看到看不见的东西

Herculaneum是维苏威火山西侧的一个富裕的度假小镇,在公元 79 年的火山喷发中与庞贝古城一起被摧毁。

来自赫库兰尼姆的 500 到 600 幅碳化卷轴保存在英国、法国和意大利的博物馆、大学和国家收藏中,仍未被打开,但确切的数字很难估计,因为许多卷轴都支离破碎。卷轴非常脆弱,这意味着物理展开它们并不是一个可行的选择。

古代铭文的起源常常笼罩在神秘之中。几千年前刻在石头上的文字可能很难阅读,而且经常会丢失整个文本部分。现在,经过数千个现有铭文训练的神经网络可以帮助历史学家弄清楚一段文字的来源时间和地点,并填补缺失的单词和字符。

铭文Inscriptiones Graecae第 1 卷第 3 版文件 4,B 面 记录了一项有关雅典卫城法令,日期可追溯到公元前 485/4年。

伦敦谷歌 DeepMind 的研究员雅尼斯·阿萨尔 (Yannis Assael) 将维苏威火山挑战赛描述为“独特且鼓舞人心”。但他指出,这是更广泛转变的一部分,其中人工智能(AI)越来越多地帮助古代文献的研究。例如,去年,Assael 和 Sommerschield发布了一款名为 Ithaca 的人工智能工具,旨在帮助学者收集身份不明的古希腊铭文的日期和起源,并提出文本建议以填补任何空白。现在,它每周收到数百个查询,类似的工作也适用于从韩语到古代美索不达米亚使用的阿卡德语的语言。

视频加载中...

Seales 希望机器学习能够打开他所说的“隐形图书馆”。这是指实际存在但无人可见的文本,包括中世纪书籍装订中使用的羊皮纸;重写本,其中后来的文字掩盖了下面的一层;纸莎草纸,其中旧纸莎草的碎片被用来制作古埃及木乃伊盒子和面具。

然而,目前所有人的目光都集中在维苏威火山挑战上。大奖的截止日期是 12 月 31 日,西尔斯将这种情绪描述为“肆无忌惮的乐观”。法里托(Farritor)就是其中之一,他已经在卷轴的其他部分运行了他的模型,并看到更多的角色出现。

参考文献

Jo Marchant. AI reads text from ancient Herculaneum scroll for the first time. Nature (2023) doi: https://doi.org/10.1038/d41586-023-03212-1

Assael, Y., Sommerschield, T., Shillingford, B. et al. Restoring and attributing ancient texts using deep neural networks. Nature 603, 280–283 (2022). https://doi.org/10.1038/s41586-022-04448-z

展开阅读全文

页面更新:2024-02-12

标签:莎草   文本   希腊   铭文   人工智能   卷轴   墨水   火山   紫色   图像   古代   自然   文字

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top