“数字藏经洞”数据库平台上线,AI技术让敦煌文化“活”起来

5月31日,敦煌研究院宣布“数字藏经洞”数据库平台正式上线,9900多卷敦煌文书经卷、60700多幅图像的数字化版本将与全球用户零距离接触,内容涵盖佛经、律典、契约、绢画等。

腾讯基于混元大模型和智能检索技术,助力网站实现更智能化的平台能力,为用户提供了古籍检索、多语言翻译、文白互译、智能问答、AI归纳等功能,让丰富而深厚的敦煌文化内容,被更好地展现和理解。

敦煌研究院自2017年开始与腾讯达成战略合作,此次,深度结合AI技术助力“数字藏经洞”数据库平台上线,是双方在探索前沿数字技术创新应用于文化遗产保护和传承中的又一次具有开拓性的重要尝试。

“数字藏经洞”数据库平台不仅收录了世界上最早的印本书籍《金刚经》、柳公权真迹拓本等传世珍宝,还有唐代的《放妻书》、中国最早的育儿教材《太公家教》、现存唐诗中的第一巨制《秦妇吟》等内容。

AI技术带来了“解读”这一文化和历史的全新方式。以《金刚经》为例,卷首的版画描绘了释迦牟尼在祇树给孤独园讲法的场景,卷尾清晰标注了868年的刊印日期。借助腾讯数字技术能力,用户不仅能欣赏到这些古籍的细节,还能与背后的故事进行深度互动。

此外,面对繁体字、无标点、竖排的原文,AI可一键将内容转换为简体字,并且自动生成白话文翻译,如:“如是我闻,一时佛在舍卫国祇树给孤独园”将被转化为“我曾听佛这样说:那时,佛陀住在舍卫国的祇树给孤独园”。

平台的AI小助手24小时营业,用户可以随时就古籍当中的疑惑“问AI”。

平台还为学者们提供了全链路的学术支持系统。通过智能检索引擎,支持语音与手写输入,结合中国图书馆分类法与多条件筛选,文献的精准定位可在秒级完成。

同时,平台还支持中、英、法、日等多语言互译,帮助敦煌文化在全球范围内无障碍传播。

腾讯通过智能检索平台(腾讯云ES)实现了古籍数据的智能化处理和精准检索。

平台对古籍数据进行了重新分词,确保文本能够被AI系统理解并有效处理。面对敦煌经卷中存在的大量繁体字、异形字、竖排、无标点和生僻字,技术团队引入了“古籍专属词典”,并与敦煌专家团合作优化了复杂词汇的分词方式。例如,将“佛在舍卫国祗树给孤独园”拆解为“佛 / 在 / 舍卫国 / 祗树 / 给孤独园”,使其成为AI可识别的最小数据单元。

同时,平台无缝集成大模型,将其强大的推理能力与智能检索平台结合,形成双模驱动的RAG(检索增强生成)技术架构。根据腾讯云大数据专家介绍,这是当前AI技术中最成熟和前沿的技术范式——大模型协同智能检索平台构建的RAG技术体系。

据了解,在处理复杂的古籍内容时,RAG技术能够将历史文献与现代技术相结合,实现“从海量文献中秒级锁定真知”,不仅提升了检索精准度,还确保了智能生成的答案具有高度相关性和准确性。

“数字藏经洞”数据库平台发布,将集中展示“流失海外敦煌文物数字化复原项目”成果,持续扩大与世界各地敦煌学收藏和研究机构的合作。

说明:本站所有内容均收集于互联网,如果有不妥之处,敬请谅解。如有侵权内容,请联系我们删除。内容并不能代表产品厂家,或者是第三方的观点,非专业技术类人员,请勿对服务器设备进行操作,以免造成设备不可使用或数据丢失。同时凯铧互联小编建议用户定期对云服务器数据进行备份保存! 北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案,高端网站建设,设计及维护服务,设计开发经验丰富,用户认可率高. 今天的分享就到这里啦,若您需要帮助, 可以直接扫描添加我们客服微信号,阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。