
数据湖
文章平均质量分 73
野老杂谈
十年数据开发经验,曾就职于亚信、商汤、美团等公司。主要研究方向:大数据、人工智能、数据平台建设、数仓建设、数据治理、数据应用...
展开
-
【数据湖】Iceberg 表的分支和标签
Apache Iceberg 是一个用于大规模分析数据集的开源表格格式,它支持灵活的表格版本控制。Iceberg 提供了**分支**(Branch)和**标签**(Tag)两种机制,用于管理和维护表的历史快照,并对数据进行更加精细的版本控制。这些功能在数据工程、数据湖管理和合规审计中都非常有用。原创 2024-12-27 10:41:28 · 800 阅读 · 0 评论 -
【数据湖】Iceberg 简介
Apache Iceberg 是一个用于大规模分析数据集的开源表格格式。Iceberg 为计算引擎(包括 Spark、Trino、PrestoDB、Flink、Hive 和 Impala)提供了表格支持,采用高性能的表格格式,使其表现得像 SQL 表一样。原创 2024-12-27 09:45:19 · 394 阅读 · 0 评论