从 TPCH 测试学习性能优化技巧之 Q6

原创于 2020-04-09 15:57:19 发布 · 162 阅读

CC 4.0 BY-SA版权

本文探讨了在处理大规模数据时，SQL与SPL在查询性能上的差异。通过对某一年中通过变换折扣带来的增量收入这一典型what-if场景的查询，展示了不同并行数下Oracle SQL与SPL的执行效率。结果显示，在数据量较大时，SPL利用其组表的列存优势，表现出更佳的性能。

一、查询要求

Q6语句查询得到某一年中通过变换折扣带来的增量收入。这是典型的"what-if"判断，用来寻找增加收入的途径。预测收入变化查询考虑了指定的一年中折扣在"DISCOUNT-0.01"和"DISCOUNT＋0.01 "之间的已运送的所有订单，求解把l_quantity小于quantity的订单的折扣消除之后总收入增加的数量。

Q6语句的特点是：带有聚集操作的单表查询操作。查询语句使用了BETWEEN-AND操作符，有的数据库可以对BETWEEN-AND进行优化。

二、 Oracle执行

Oracle编写的查询SQL语句如下：

select /*+ parallel(n) */

sum(l_extendedprice * l_discount) as revenue

from

lineitem

where

l_shipdate >= date '1995-01-01'

and l_shipdate < date '1995-01-01' + interval '1' year

and l_discount between 0.05 - 0.01 and 0.05 + 0.01

and l_quantity < 24;

其中/*+ parallel(n) */ 是Oracle的并行查询语法，n是并行数。

脚本执行时间，单位：秒

并行数	1	2	4	8	12
Oracle	328	240	183	154	135

三、 SPL优化

这是一个常规的过滤后聚合查询，结果集只有一条记录，没有特殊的优化技术，跟Q1一样使用多路游标充分利用并行即可。

SPL脚本如下：

	A
1	=1
2	=now()
3	>date=date("1995-01-01")
4	>discount=0.05
5	>quantity=24
6	=elapse@y(date,1)
7	=file(path+"lineitem.ctx").create().cursor@m(L_EXTENDEDPRICE,L_DISCOUNT;L_SHIPDATE>=date && L_SHIPDATE < A6 && L_DISCOUNT >= discount - 0.01 && L_DISCOUNT <= discount + 0.01 && L_QUANTITY < quantity;A1)
8	=A7.groups(;sum(L_EXTENDEDPRICE*L_DISCOUNT):revenue)
9	=now()
10	=interval@s(A2,A9)