首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数字科技助力古籍保护与利用

古籍蕴含着中华民族的灿烂文明和优秀的传统文化,保护好古籍对传承和弘扬中华优秀传统文化、增强文化自信有着重要意义。然而从古籍保护现状来看,我国目前还面临数字化程度低、以文本形式进行数字化的古籍数量少、难以检索等问题。

古籍蕴含着中华族的灿烂文明和优秀传统文化。保护古籍对继承和发展中华优良传统文化,增强文化自信具有重要意义。在今年政府工作报告中明确提出“加强文物古迹的保护利用和非物质文化遗产的传承”,体现了重视提高古籍水平和社会参与的广度和深度。

但是,从古籍保护的角度来看,我国仍面临着数字水平低,以文本形式进行数字化的古籍数量少和难以检索的问题。统计数据显示,目前有20万种古籍据不完全统计,其中有8万个数字扫描图像,而只有3万至4万个实现文字数字化。

为了促进这种情况的变化,3月17日,字节跳动向北大教育基金会捐赠,支持“北京大学-字节跳动数字人文开放实验室”,开发古籍数字平台,使用智能技术加速中华古籍资源的数字化建设。为全社会提供公益服务。该实验室将动员相关资源,努力在三年内完成10,000种精选古籍的智能整理。提供开放,体验良好的阅读服务和基本文本库,并使用知识图谱等技术帮助学者有效检索和利用古籍信息。同时,该项目还将启动结合OCR文本识别,句子阅读,物理识别和知识图谱等技术构建的一站式自动古籍智能梳理平台。它将免费向公众开放,以便收集机构,研究人员,相关专业的师生以及大多数古代爱好者可以自行完成古籍数字化工作,并加快整个行业数字古籍数据的效率。

多年来,郑永晓教授从事数字人文实践和理论探索,并参加了古典文献数字化早期的实践。他说,过去20年来,我国古籍文献数字化和古籍数据库建设已成为巨大的。但是,古籍数据库的建设也面临着发展的瓶颈。“尽管像“中华经典古籍库”,“四部丛刊”等各种工具,例如连接联机字典,时代转换和注释。它具有实用价值,但从根本上说这些数据库的主要内容是非结构化数据,除了全文检索外,还不能帮助学者完成其他任务。因此,必须升级古籍文献数据库。”因此,在必要时进行升级和替换旧书文件数据库。

从郑永晓的角度来看,未来的古籍文献数据库应结合数据挖掘技术,自然语言处理技术和相关学者的深入参与。它在古代词频分析,版本分析比较以及计算机辅助句子阅读方面取得了实际进展。他说:“我们必须利用人工智能,大数据等最新技术来完成人力难以完成的宏观分析和微观比较工作,并协助学者进行多维统计,比较和分析。产生新的知识和思想。”

“我们希望与北大的跨学科团队在OCR文本识别,自然语言处理和知识图谱等技术领域进行全面合作。充分利用人工智能技术来加速古籍数字化整理,研究和使用,使更多的研究者和爱好者能够获得更高效,便捷的方法。古代书中包含丰富的知识。”字节跳动负责人说。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220324A03B6N00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券