腾讯云大数据TCIceberg亮相Iceberg全球技术峰会

点击蓝字⬆ 关注我们

本文共计873字 预计阅读时长3分钟

2025年4月,Iceberg Summit 2025全球峰会于旧金山圆满闭幕,峰会云集了全球顶尖科技厂商、社区明星用户及大数据领域专家超过500人线下参与。Iceberg创始人Ryan Blue以Iceberg V3最新发展动态拉开大会序幕,包括Variant、Geo数据类型,基于Deletion vector实现的数据更新 / 删除能力,以及用于追踪数据变化的Row Lineage等亮点特性及最新进展。腾讯、AWS、Google、Apple、Microsoft、Databricks、Snowflake等全球科技巨头参与,腾讯云大数据分享了基于Iceberg的批流一体开放智能湖仓方案TCIceberg,进一步印证了Iceberg已成为开源湖仓格式标准的事实。

腾讯云批流一体创新方案亮相

腾讯作为Apache Iceberg社区国内领军贡献者,截止2025年共计提交PR 110+,其中包括delete file重写、清理、向量化读取等重点特性。腾讯云从2019年开始就使用Iceberg帮助云上客户构建云原生的湖仓一体大数据基础设施,帮助用户完成统一湖仓存储,降低数据延迟,提升数据开发效率等业务目标。在本次峰会中,腾讯云大数据首次向全球展示了基于Iceberg的批流一体开放智能湖仓方案TCIceberg,引发全球开发者热烈关注

开放共赢:TCIceberg的技术创新与实践

腾讯云TCIceberg致力于打造全场景湖仓一体智能解决方案,在Iceberg现有表格式之上拓展实时湖仓场景,并提供智能数据优化服务。整体方案具备以下特点:

  • 无侵入拓展:有主键表中BaseStore与ChangeStore采用标准Iceberg表结构构建,并提供Merge-On-Read和Auto Compaction能力。

  • 近实时湖仓构建:相比Apache Iceberg中流式写入的更新数据没办法在下游进行流式消费,TCIceberg在支持流式写入的同时,支持按照CDC(Change Data Capture)格式读取流式增量数据,并提供可扩展的合并过程满足部分列更新、预聚合等场景。

  • 性能增强:TCIceberg通过自动分桶机制提升了更新场景下的merge-on-read性能。

  • 智能的数据优化:TCIceberg支持对表上的写入及查询操作实时监控,根据监控信息自动按需触发优化任务,调度优化资源,调整优化任务优先级进行合理的智能调度,提升优化质量及效率。

目前TCIceberg已上线腾讯云数据湖产品,并得到泛互、金融、教育等多行业广泛应用。

会后,来自AWS、EBay等企业工程师与腾讯云大数据团队围绕TCIceberg批流一体技术展开深度交流,对其创新的部分列更新(Partial Update)与聚合函数(Aggregation Function)等特性表达关注并探讨共建。未来腾讯云大数据团队也将持续与社区携手推动基于Iceberg批流一体技术的生态演进。

相关分享内容已被Apache Iceberg社区官方视频媒体收录,如需回顾请点击阅读原文

腾讯云大数据始终致力于为各行业客户提供轻快、易用,智能的大数据平台。

END

关注腾讯云大数据╳探索数据的无限可能

⏬点击阅读原文

了解更多产品详情

分享给认识的人吧

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值