RBO(Rule-Based Optimization)-基于规则的优化器
该优化器按照硬编码在数据中的一系列规则来决定SQL的执行计划。
在RBO中,有着一套严格的使用规则,只要你按照规则去写SQL语句,无论数据表中的内容怎样,也不会影响到你的“执行计划”,也就是说RBO对数据不“敏感”。
数据的量级会严重影响同样SQL的性能。
CBO(Cost-Based Optimization)-基于代价的优化器
该优化器通过根据优化规则对关系表达式进行转换,生成多个执行计划,
然后CBO会通过根据统计信息(Statistics)和代价模型(Cost Model)计算各种可能“执行计划”的“代价”,即COST,从中选用COST最低的执行方案,作为实际运行方案。
CBO依赖数据库对象的统计信息,统计信息的准确与否会影响CBO做出最优的选择。
目前各大数据库和大数据计算引擎都倾向于使用CBO,
例如从Oracle 10g开始,Oracle已经彻底放弃RBO,转而使用CBO;而Hive在0.14版本中也引入了CBO。