查询优化一般可以分为代数优化和物理优化,代数优化是指关系代数表达式的优化,物理优化则是指存取路径和底层操作算法的选择。
关系数据库系统的查询处理
查询处理步骤
RDBMS查询处理可以分为四个阶段:查询分析、查询检查、查询优化和查询执行。
1.查询分析
对查询语句进行扫描、词法分析、语法分析。从查询语句中识别出语言符号,进行语法检查和语法分析,判断查询语句是否符合SQL语法规则。
2.查询检查
根据数据字典对合法的查询语句进行语义检查,即检查语句中的数据库对象。还要根据数据字典中的用户权限和完整性约束定义对用户的存取权限进行检查。检查通过后便把SQL查询语句转换成等价的关系代数表达式。RDBMS一般都用查询树,也称为语法分析树,来表示扩展的关系代数表达式。
3.查询优化
查询优化就是选择一个高效执行的查询处理策略。代数优化是指关系代数表达式的优化,即按照一定的规则,改变代数表达式中操作的次序和组合,使查询执行效率更高;物理优化则是指存取路径和底层操作算法的选择。
4.查询执行
根据优化器得到的执行策略生成查询计划,由代码生成器生成执行这个查询计划的代码。
实现查询操作的算法
一、选择操作的实现
1.简单的全表扫描法
对查询的基本表顺序扫描,逐一检查每个元组是否满足选择条件,把满足条件的元组输出
2.索引(或散列)扫描法
如果选择条件中的属性上有索引,而已用索引扫描法。先通过索引找到满足条件的元组的主码或元组指针,再通过元组指