Amazon Redshift 数据仓库的扩展与性能优化
1. 数据转换与查看
当数据处理任务完成后,你可以前往 Amazon Redshift 控制台检查查询和加载情况。在控制台中,你能看到创建临时表、加载 Amazon S3 文件以及执行合并语句(用于删除旧数据并插入新数据)所需的查询。
2. 数据仓库扩展的必要性
在当今的数据处理环境中,变化是唯一的常量。传统数据仓库系统在应对变化时,由于资源配置的前置时间长,往往面临较大困难。而 Amazon Redshift 则能轻松适应变化,无论是存储需求还是计算需求的改变,都能快速进行扩展或缩减,避免因错误决策带来高额成本。
扩展的目标是满足工作负载的变化,以维持当前的性能水平和相关服务级别协议(SLA)。当向数据仓库添加新的工作负载,或者分析的数据量增加并对工作负载的 SLA 产生明显影响时,就需要进行扩展。要使用 Amazon Redshift 实现扩展目标,可考虑以下两个策略:
- 确保数据仓库的规模大小合适。
- 确保工作负载经过性能调优。
3. 数据仓库的扩展方式
3.1 垂直扩展与水平扩展
在 Amazon Redshift 中,数据仓库的计算规模可以进行垂直扩展和水平扩展,具体如下:
| 扩展方式 | 描述 | 使用场景 |
| ---- | ---- | ---- |
| 垂直扩展 | 通过为单个查询增加额外的计算资源来“向上”扩展,导致 vCPU 总数或内存增加。 | 工作负载变化可预测,需要运行提取大量行、处理更多连接和管理更长事务的大型查询,同时要保留现有工作负载的 SL
超级会员免费看
订阅专栏 解锁全文
811

被折叠的 条评论
为什么被折叠?



