1. 常用引擎
☕️ Doris 表数据模型
- duplicate key
🎬 场景:适用于数据无需提前聚合的分析业务。
⚠️ 注意点:只指定排序列,相同的行并不会合并。
- unique key
🎬 场景:适用于有更新需求的业务。
⚠️ 注意点:key相同时,新记录覆盖旧记录。
- aggregate key
🎬 场景:可以提前聚合数据,适合报表和多维度业务。
⚠️ 注意点:
将会进行聚合操作,目前支持sum,min,max,replace 等
(1)sum:求和,多行的 value 进行累加。
(2)replace:替代,下一批数据中的 value 会替换之前导入过的行中的 value。
(3)max:保留最大值。
(4)min:保留最小值。
欢迎关注,一起学习
☕️ Clickhouse 表引擎
- *MergeTree
🎬 场景:
(1)支持索引和分区。
(2)支持生命周期TTL(列级 和表级)。
⚠️ 注意点:
(1)主键并不唯一,会建索引。
(2)order by 是必须的,主键、分区非必须。
- ReplacingMergeTree
🎬 场景:去重功能。
⚠️ 注意点: