
Paimon
文章平均质量分 81
hbuzhuhaoju
厚德载物
展开
-
Paimon Tag和Branch创建文件存储过程
如果data-file被引用则不会被压缩,压缩仅针对未被引用的文件,创建tag时候根据当前快照进行创建。原创 2024-12-11 18:14:15 · 864 阅读 · 0 评论 -
对Paimon TimeTravel的理解
在 Paimon 中,每次提交或数据写入操作都会生成一个新的快照,保留数据在时间点的状态,以便进行版本控制和数据回溯(time travel)。在超过默认的 1 小时快照保留时间后,这些快照会被清理,以节省存储空间。因此,一旦这些快照被删除或回收,就无法再使用 time travel 功能访问这些已删除快照对应的历史数据。注意,如果你希望长期保存快照用于审计或其他目的,则需要根据需求增加保留时间或定期将数据备份到外部存储。这会将快照的保留时间设置为 24 小时,允许在更长时间内进行数据回溯。原创 2024-11-18 18:29:34 · 697 阅读 · 0 评论 -
对Paimon tag 和 Branch的理解
Tag是用于标记数据版本或状态的标签,适合于记录历史数据版本、恢复数据和进行数据审计。Branch是用于并行处理和管理不同版本数据的机制,适合于多流并行计算、实验和数据版本控制。原创 2024-11-18 18:28:18 · 500 阅读 · 0 评论 -
对Paimon文件布局的理解
Compaction是合并和优化数据文件的过程,以提升查询性能Delete是清理标记为删除且过期的数据文件的过程,以释放存储空间。原创 2024-11-18 18:25:17 · 822 阅读 · 0 评论 -
对Paimon的理解
机制实现数据版本管理和并行处理,同时避免了因版本控制而引入过多的存储开销。这些机制并不复制数据,而是通过。是Paimon的重要特性,Paimon通过。离线数仓数据备份的成本就大大减少了。,并不会导致显著的存储开销增长。,有效地优化了存储使用。来管理数据版本,配合后台的。原创 2024-11-18 18:22:10 · 908 阅读 · 0 评论