腾讯云程彬:构建下一代数智平台,加速Data+AI融合落地

点击蓝字⬆ 关注我们

本文共计2722字 预计阅读时长9分钟

在2025年6月27日举办的AICon全球人工智能开发与应用大会上,腾讯云大数据基础产品总经理程彬分享了腾讯云大数据在Data+AI领域的最新实践与思考,并就相关问题接受了媒体群访,以下是专访内容:

腾讯云大数据基础产品总经理 程彬

聚焦Data+AI融合,助力企业智能化转型

记者:随着AI技术的快速发展,大数据与AI的融合日益紧密。您认为未来大数据技术在与AI融合方面会有哪些新的突破和应用场景?腾讯云在推动大数据与AI融合方面有哪些具体的规划和实践?

程彬:未来大数据与AI融合将带来诸多突破与应用场景。一方面,大模型的理解与表达能力将打破传统数据技术仅以结构化数据为优先的局面,使数据平台能够处理包括非结构化数据在内的更广泛数据类型,数据规模有望扩大10倍,从而释放更大价值。另一方面,大模型在应用落地时需要依靠数据平台提供高质量的数据支撑,以实现生产级应用。

腾讯云在推动大数据与AI融合方面的规划和实践包括:利用大模型能力升级数据平台,实现从传统报表到认知智能的转变;在计算层面,通过一体化计算实现ETL、实时计算等能力,并对CPU、GPU等资源进行统一调度,降低企业升级成本;在存储方面,采用AI数据湖技术管理结构化与多模态数据;通过超大规模智能自治减轻运维负担,使系统能够自我演进。目前,腾讯云已构建了新一代数据智能平台,涵盖统一存储、加速层、调度能力、计算层面以及DataAgent等,可实现数据处理可视化,改变人机交互模式。

开源与开放并重,推动技术生态发展

记者:腾讯云大数据是如何看待开源的,能不能介绍一些在开源技术推动上腾讯云做哪些创新举措和贡献,还有实际的落地方案跟我们分享一下。

程彬:腾讯云始终秉持开放理念,不仅积极参与开源项目,更注重从开源到开放的转变,即兼容开源生态,让开源产品能轻松与腾讯云系统集成。例如,腾讯云的统一数据湖TCLake兼容开源格式iceberg,使得社区软件能够直接处理腾讯云上的数据,降低企业从传统数据平台向DATA+AI平台升级的门槛。此外,腾讯云还积极参与开源社区合作,如在iceberg社区中参与核心交流与研发工作,共同探讨其未来演进方向并承担相应开发任务。

另外腾讯云是Apache Doris社区在全球范围内贡献者最多、贡献度最大的云厂商;也是Elasticsearch社区目前已知的第三方公司维度全球最高的贡献水平。

TCLake上线在即,助力企业高效迁移

记者:TCLake上线情况怎么样?从开源到开放非常好,现在很多数据格式存在不兼容的情况,TCLake之后开源是不是还有更加大尺度的开放?还有简单介绍一下TCLake兼容比如说多模态统一元数据特点,这个是怎么做到的?简单介绍一下,谢谢。

程彬:TCLake将于7月份内测,其在开放格式方面除兼容iceberg外,也在评估Hudi等格式,但目前以iceberg为重点。TCLake的多模态统一元数据管理借鉴了Linux文件系统的思想,通过抽象层将结构化与非结构化数据统一管理,减少计算引擎适配代价,同时采用高性能存储满足元数据访问的高性能需求,确保数据写入与读取的高效性。

对于企业使用TCLake的迁移成本问题,如果企业数据支持iceberg格式,可实现相对低成本的平行迁移;若非iceberg格式,腾讯云提供专门的集成工具完成异构系统间迁移,总体而言,迁移成本较低,不会因数据集成增加企业负担。

应对行业竞争,打造差异化竞争优势

记者:行业上目前涌现了一些DataAgent类型产品,面对这个趋势,腾讯云有哪些思考和技术进展?

程彬:腾讯云将Agent视为数据智能场景中极为重要的交互方式变革,致力于构建完整的Data Agent体系,以此提升数据产品使用效率并降低门槛。腾讯云的TCDataAgent产品即将于下半年发布,它能够通过自然语言交互生成满足用户需求的代码或SQL语句,支持与开发者交互确认后一键转化为正式任务,极大地简化了数据开发流程。

深入探索RAG技术,提升非结构化数据处理能力

记者:刚才演讲当中提到很多非结构化数据,非结构化数据我们认为更多在AI里面是RAG业务,OB在前两年发了PowerRAG,其实大家都想去做RAG业务,你看到Oracle也有类似的产品,就是我想知道腾讯云在做不管是RAG也好,还是非结构化数据也好,我们现在有哪些新的特点或者说有哪些新的竞争力?

程彬:腾讯云在RAG技术方面具有独特优势。首先,腾讯云ES的RAG技术不仅注重向量检索能力,还融合了标量检索与SQL检索能力,通过混合检索方式提供更准确的数据结果。其次,在性能优化方面,腾讯云针对在线RAG服务的低延时需求进行了算法工程上的微创新。此外,腾讯云将RAG视为一个完整的Pipeline,支持用户将自身技术融入平台,并提供自动化调试优化功能,提升用户使用体验。

区分Agent与MCP,展望具身智能数据处理

记者:刚才提到很多Agent,我最近用Kimi Agent的时候,它不叫Agent,它叫depreciation,深度研究,他们理解可能就是深度研究就是一种Agent的能力,我们最近也提到很多PPT里的很多MCP这种,您怎么理解Agent和MCP之间的区别?你觉得有什么样的数据上面的一些联系或者说不同点?

程彬:Agent与MCP是两个完全不同的概念。MCP类似于一个协议标准,类似于USB接口,而Agent则是背后的智能体,具有Pipeline能力和工具调用能力。未来在AGI时代,Agent可能会与大模型深度融合,但在当前1-3年内,Agent仍具有重要价值,可作为外挂式存在帮助企业提升效率。

对于具身智能数据处理,程彬表示,具身智能领域如自驾领域的轨迹数据等,需要快速处理与实时分析能力。腾讯云大数据产品可通过MCP协议集成具身智能体产生的数据,完成数据分析后提供高质量数据支持其决策,同时也能支持具身智能算法模型训练。

解决AI代理幻觉风险,普惠化数据智能应用

记者:一直提到智能体的问题,腾讯云提出“自主代理分析”是下一代Data+AI核心能力,这种智能体如何解决AI代理在金融、医疗等严谨场景中的“幻觉风险”?因为我看到您展示一个特别大的结构,是需要完整的去端到端把所有的结构都建设好了之后才能消除,还是腾讯云有一个比较轻巧的解决办法为企业解决幻觉问题?

程彬:腾讯云通过多种技术手段解决AI代理在严谨场景中的幻觉风险。一方面,利用RAG方法结合NL2SQL技术,将自然语言转化为SQL语句,提升数据查询准确性。目前,腾讯云在权威测试集Bird-bench上的NL2SQL性能已达到75分左右,国内排名第 一,全球排名第三。另一方面,腾讯云通过优化NL2SQL技术,处理自然语言歧义、数据库数据缺乏规范以及数据库专业术语等问题,提高大模型在生产级应用中的表现。

付费方式灵活,看好大数据创业公司发展

记者:还有一个问题,您刚才说到腾讯已经做到了很多东西,我看到有这样一个关于腾讯云TCInsight大数据智能自治系统的客户案例,准确率非常高了,这个准确率对我们客户本身技术有要求吗?我必须要求客户也能达到什么样的技术环境才能够,比如人力配置才能够达到这么一个准确度,还是说无论是小白,还是什么样的客户,都可以帮你做到这一点。还有,如果跟您合作的客户付费方式是什么样子的,是弹性付费,还是一揽子解决的付费,有没有自己的特色,这是一类问题。还有一类问题,中国会不会出现大数据创业公司?

程彬:腾讯云TCInsight大数据智能自治系统对客户本身技术要求不高,主要由腾讯云提供技术支持,客户仅需进行少量简单设置。目前,TCInsight处于产品测试阶段,暂未商业化,未来付费方式将更多采用PaaS方式,按资源售卖,同时也会探索Serverless方式。

对于中国大数据创业公司的发展,程彬表示,随着大语言模型的出现,传统数据平台企业需要快速转型,未来有望出现更多对标Snowflake、Databricks的DATA+AI创业公司,腾讯云欢迎更多参与者加入,共同推动行业发展。

END

关注腾讯云大数据╳探索数据的无限可能

⏬点击阅读原文

了解更多产品详情

分享给认识的人吧

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值