SQL数据库优化与集成策略
1. 删除操作与性能优化
在数据库查询中, WHERE NOT EXISTS 常出现在排除已删除实体的查询里。输入集包含所有曾存在的实体,输出集仅含仍存在的实体。“浪费率”指已删除实体占所有实体的比例,当多数实体被删除时,浪费率高。
以常见的CRUD应用为例,可能有一个大表存储应用的主要实体,如客户表。随着时间推移,客户不断增减,若使用实际的 DELETE 语句,可控制浪费率;若采用软删除,即设置一个字段模拟删除,仅选择未设置该标志的行,虽能保留数据,但会带来性能成本。
历史模型中的删除操作与CRUD模型中的软删除类似,都会保留数据但产生性能开销。为恢复性能,有以下两种选择:
- 添加时钟 :为模型添加时钟,基于少量时间段的查询可限制删除造成的浪费,只有留存的实体能进入下一个时间段。
- 使用托管索引 :若无法找到合适的时钟,可测量性能并计算实际浪费率。当多数实体被删除且影响查询性能时,考虑使用托管索引,此方法在队列场景中尤为适用。
2. 队列优化
队列模式中,查询选择无结果的工作项,最终转化为SQL中的 WHERE NOT EXISTS 子句。由于每个工作项最终都会被处理,该查询的浪费率接近100%。依赖反连接时,SQL引擎失去了直接寻址的能力,需扫描索引来确定哪些工作项未被排除。
为让SQL引擎直接索引包含的工作项,可重新审视软删除标志。在CRUD系统中,软删除是用 UPDATE
超级会员免费看
订阅专栏 解锁全文
1102

被折叠的 条评论
为什么被折叠?



