腾讯AI技术助力敦煌「数字藏经洞」全球上线

敦煌藏经洞古籍,第一次变得「人人可读」——

刚刚,敦煌研究院正式发布「数字藏经洞」数据库平台,发布敦煌文书经卷9900多卷、图像60700多幅,内容涵盖佛经、律典、契约、绢画等。

在腾讯智能检索和大模型技术助力下,沉睡于竖排繁体和生僻字中的古籍信息被唤醒,变得可检索、可翻译、可问答,不再晦涩难解,而是简明易懂。

「数字藏经洞」,让那些洞窟深处的文明,抵达了每一个人的眼前。

图片

重释敦煌:AI让古籍从可见到可懂

曾经,走进一卷敦煌古籍需要翻拓片、读注疏。「数字藏经洞」中的敦煌古籍,还能怎么打开?往下看——

//AI总结:10秒掌握万字长篇精髓

古籍的理解门槛高,以这本金刚经为例,全文五千多字,竖排、繁体。

图片

在AI技术支持下,晦涩佛经变得清晰可读。进入《金刚经》的主页,网站自动提炼白话文版的摘要:

佛告诉须菩提,一切有为法如梦幻泡影,不应执着于形相。菩萨应无我相、人相、众生相、寿者相,以无住心修行布施,方能觉悟。真正的佛法不可言说,唯有超越概念与分别,才能见如来本质。

图片

不仅知其然,还能知其所以然,AI智能归纳金刚经的背景知识,进一步介绍历史地位、核心思想、结构特点、文化影响,全方位理解《金刚经》。

//智能问答:AI助手24小时在线解惑

平台的AI小助手24小时营业,用户可以随时就古籍当中的疑惑「问AI」,相当于一位AI小助手陪你逛一千多年前的图书馆。

比如,藏经洞是哪年发现的?金刚经有多少字?无论你提出什么问题,都能秒级响应,给出答案。经过敦煌专家团的测试,回答准确率高达95%。

图片

//多语言互译:中英法日语随时切换

平台还支持中、英、法、日等多语言互译。尤其是在问答助手里,用户可以用任意四种语言输入,AI将用同样的语种和你交流,中英法日无障碍切换。多一种语言,就多一种让世界了解敦煌的方式。

图片

解码经卷:构建AI可理解的古籍语境

从千年残卷到数字解读的转身,背后是一整套为古籍量身定制的AI技术——

腾讯采用智能检索(腾讯云ES)+大模型构建检索增强生成(RAG)的能力组合,面向海量古籍信息的梳理和检索需求,提供又快又准的响应。

图片

每当用户输入问题时,系统会将跟这个问题相关的文献信息全都找出来,再利用大模型强大的生成能力,为用户提供准确的解答。

//古籍分词:让AI能看懂千年「行话」

海量数据实时检索的实现技术基础之一是分词,就是每一句话拆分为最小单元的词语,确保文本能够被AI系统理解并有效处理。

但传统的分词技术面对古籍的时候犯了难,例如把「佛在舍卫国祗树给孤独园」这个句子,分解成了单独的个字,人和机器都不知道啥意思。

图片

腾讯云ES团队引入了「古文分词器」,并与敦煌专家团合作优化了复杂词汇的分词方式, 形成了专属敦煌的古籍分词系统,将晦涩的古籍转化为了计算机能理解的最小数据单元,便于 AI 搜索。

无数个类似「佛在舍卫国祗树给孤独园」的句子,可以被正确拆解为「 佛 / 在 / 舍卫国 / 祗树 / 给孤独园」。

//混合检索:把相关古籍全部找出来

当你问完一个问题后,「数字藏经洞」系统会兵分两路在知识库中找寻相关文献。比如,你问「《金刚经》讲什么?」,腾讯云ES会同时启动两种搜索:

•关键词扫描(全文检索):精准抓取「金刚经」「须菩提」等关键信息;

•语义雷达(向量检索):理解「讲什么」是指核心思想,自动关联「破处执念」「无住生心」等抽象概念。

随后再经过分析和智能排序,找出和你问题最相关的数篇文献,送往大模型,以备后用。 

//集成大模型:双模驱动更精准

腾讯云 ES 与混元大模型、DeepSeek大模型无缝集成。

用户的输入+相关文献进入大模型后,大模型利用其强大的生成能力,为用户提供准确的解答。这一双模驱动架构不仅提升了检索精准度,还确保了智能生成的答案具有高度相关性和准确性。

在文化的长河中,腾讯将继续与敦煌同行,用数字技术为更多文明遗产拓展新的生命力。我们也相信,技术可以抵达的地方,正是文化可以继续生长的方向。

未来,还有更多「敦煌」,等待被温柔照亮。

点击文末阅读原文,进入「数字藏经洞」,即刻踏上一场跨越时空的数字文化之旅。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值