一、 查询要求
Q14语句查询获得某一个月的收入中有多大的百分比是来自促销零件。用以监视促销带来的市场反应。
Q14语句的特点是:带有聚集、连接操作的简单查询。
二、 Oracle执行
Oracle编写的查询SQL语句如下:
select /*+ parallel(n) */
100.00 * sum(
case when p_type like 'PROMO%'
then l_extendedprice * (1 - l_discount)
else 0
end)/ sum(l_extendedprice * (1 - l_discount)) as promo_revenue
from
lineitem,
part
where
l_partkey = p_partkey
and l_shipdate >= date '1995-04-01'
and l_shipdate < date '1995-04-01' + interval '1' month;
其中/*+ parallel(n) */ 是Oracle的并行查询语法,n是并行数。
脚本执行时间,单位:秒
| 并行数 | 1 | 2 | 4 | 8 | 12 |
| Oracle | 351 | 275 | 218 | 176 | 157 |
三、 SPL优化
这是一个常规的连接后求和查询,充分利用并行即可。由于lineitem表数据量很大,组表的列存优势较大。
SPL脚本如下:
| A | |
| 1 | =1 |
| 2 | =now() |
| 3 | >date=date("1995-04-01") |
| 4 | =elapse@m(date,1) |
| 5 | =file(path+"part.ctx").create().cursor@m(P_PARTKEY,P_TYPE;;A1).fetch().keys@i(P_PARTKEY) |
| 6 | =file(path+"lineitem.ctx").create().cursor@m(L_PARTKEY,L_EXTENDEDPRICE,L_DISCOUNT;L_SHIPDATE>=date &&L_SHIPDATE< A4,L_PARTKEY:A5;A1) |
| 7 | =A6.new(if(like(L_PARTKEY.P_TYPE,"PROMO*"),L_EXTENDEDPRICE * (1 - L_DISCOUNT),0):v1, L_EXTENDEDPRICE * (1 - L_DISCOUNT):v2) |
| 8 | =A7.groups(; sum(v1):s1,sum(v2):s2) |
| 9 | =100.00 * A8(1).s1/A8(1).s2 |
| 10 | =now() |
| 11 | =interval@s(A2,A10) |
脚本执行时间,单位:秒
| 并行数 | 1 | 2 | 4 | 8 | 12 |
| Oracle | 351 | 275 | 218 | 176 | 157 |
| SPL组表 | 101 | 58 | 34 | 24 | 22 |
博客分析了TPCH测试中的Q14查询,该查询旨在评估促销零件对月收入的贡献比例。文章对比了Oracle执行的SQL语句,包括其并行查询语法,并提出了SPL优化方案,强调了大型数据集下利用并行计算和列存的优势。
686

被折叠的 条评论
为什么被折叠?



