Doris 冷热数据目录配置

be数据目录默认系统修改,并且配置冷热数据目录 --完成

mkdir -p /Data{1…14}/doris
mkdir -p /Data_ssd{1…2}/doris

/home/disk1/doris,medium:HDD: 表示该目录存储冷数据;

/home/disk2/doris,medium:SSD: 表示该目录存储热数据;

storage_root_path=/Data1/doris,medium:HDD;/Data2/doris,medium:HDD;/Data3/doris,medium:HDD;/Data4/doris,medium:HDD;/Data5/doris,medium:HDD;/Data6/doris,medium:HDD;/Data7/doris,medium:HDD;/Data8/doris,medium:HDD;/Data9/doris,medium:HDD;/Data10/doris,medium:HDD;/Data11/doris,medium:HDD;/Data12/doris,medium:HDD;/Data13/doris,medium:HDD;/Data14/doris,medium:HDD;/Data_ssd1/doris,medium:SDD;/Data_ssd2/doris,medium:SDD

HDD、SSD冷热数据划分 --手动修改重启be
建表阶段中显式指定:
properties {“storage_medium” = “hdd”}
properties {“storage_medium” = “ssd”}

### Doris冷热数据分表存储的实现 #### 方案概述 在Doris环境中实施冷热数据分离策略能够显著优化资源利用率并提高查询效率。对于冷热数据的管理,通常采用不同的物理介质来分别存放不同类型的数据——即热数据存放在高性能SSD盘上以保障快速访问;而冷数据则迁移到成本较低的大容量HDD硬盘或其他长期存储设施内。 #### 方法一:基于分区表的时间窗口迁移机制[^1] 创建带有时间字段作为分区键的表结构,在此基础之上设定合理的生命周期规则。每当达到预设阈值时(比如某个月份结束),自动触发后台作业将该时间段内的记录转移至专门用于保存历史档案的新建子表里。具体操作如下: ```sql CREATE TABLE IF NOT EXISTS hot_data ( `id` BIGINT(20), `event_time` DATETIME, ...其余字段... ) PARTITION BY RANGE(event_time)( PARTITION p_202309 VALUES LESS THAN ('2023-10-01'), PARTITION p_max VALUES LESS THAN MAXVALUE ); INSERT INTO cold_storage SELECT * FROM hot_data WHERE event_time < '指定日期'; DELETE FROM hot_data WHERE event_time < '指定日期'; ``` 上述SQL语句展示了如何构建一个按月划分区间的源表以及怎样把过期条目转移到目标位置的过程。 #### 方法二:利用物化视图加速查询响应速度[^4] 除了简单的搬移之外,还可以考虑引入物化视图技术进一步增强系统的灵活性与表现力。通过预先计算好常用组合条件下的汇总统计信息,并将其持久化下来供后续检索调用,从而减轻实时处理的压力。例如针对频繁发生的聚合类需求建立相应的中间结果集: ```sql CREATE MATERIALIZED VIEW mv_sales_summary AS SELECT product_id, SUM(sales_amount), COUNT(*) as order_count FROM sales_records GROUP BY product_id; ``` 这样即使面对海量级规模的历史订单明细也能迅速给出精确答案而不必每次都重新遍历整个集合。 #### 方法三:借助外部工具完成自动化运维流程 考虑到手动编写脚本可能带来的维护难题,推荐使用诸如xxl-job这样的开源框架来进行周期性的巡检工作。它允许开发者定义复杂的调度计划并通过HTTP接口远程控制集群内部的动作。这样一来不仅简化了日常管理工作而且提高了任务执行的成功率。 ```json { "jobDesc": "定期清理旧版本", "author": "admin", "scheduleConf": "* 0/5 * * * ? ", "executorHandler": "/api/clean-old-data" } ``` 以上配置片段描述了一个每隔五分钟运行一次的任务实例,负责检查是否存在超过保留期限未被访问过的对象并将它们标记为待回收状态。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值