【问题】
sql maximum record per group question
CREATE
TABLEDBO.TEST
(
IDINT,RECTYPEINT,SEQINT,MAX0INT,MAX1INT,MAX2INT)
INSERT
INTOdbo.TEST
SELECT
1,1,1,3,2,3
UNION
ALL
SELECT
1,2,2,3,2,3
UNION
ALL
SELECT
1,2,3,3,2,3
UNION
ALL
SELECT
1,1,2,3,2,3
--SELECT * FROM dbo.TEST
how
tofindMAXseqforeach IDandRectype
My result should be
MAX0
ismaximumofseqgroupbyID
MAX1
ismaximumofseqgroupbyIDwhererectype=1
MAX2 id maximum
ofseqgroupbyIDwhererectype=2
ID Rectype SEQ MAX0 MAX1 MAX2
1 1 1 3 2 3
1 2 2 3 2 3
1 2 3 3 2 3
1 1 2 3 2 3
别人的回答:
CREATETABLEDBO.TEST
(
ID INT,
RECTYPE INT,
SEQ INT,
MAX0 INT,
MAX1 INT,
MAX2 INT
)
INSERTINTOdbo.TEST
SELECT1,1,1,NULL,NULL,NULL
UNIONALL
SELECT1,2,2,NULL,NULL,NULL
UNIONALL
SELECT1,2,3,NULL,NULL,NULL
UNIONALL
SELECT1,1,2,NULL,NULL,NULL
--select * from test
;WITHmycte
AS(SELECTID,
RECTYPE,
Max(seq)
OVER(partition BYID)m0,
CASE
WHENrectype =1THENMax(SEQ)OVER(PARTITION BYid,rectype)
ELSENULL
ENDm1,
CASE
WHENrectype =2THENMax(SEQ)OVER(PARTITION BYid,rectype)
ELSENULL
ENDm2
FROMdbo.TEST)
SELECTID,
RECTYPE,
M0,
Max(m1)OVER(partition BYID)m1,
Max(m2)
OVER(partition BYID)m2
FROMmycte
droptabletest
【回答】
这是个比较典型的组内计算,解决思路很清晰:
1. 将数据按 ID 分成多个组,每个组是一个 ID 的全部数据。
2. 进行组内运算,求得本组内 SEQ 的最大值,赋给 MAX0。
3. 组内运算,过滤出本组内 Rectype=1 的记录,再求 SEQ 的最大值,赋给 MAX1。
4. 组内运算,过滤出本组内 Rectype=2 的记录,再求 SEQ 的最大值,赋给 MAX2。
上述思路虽然清晰,但用 SQL 却很难表达组内运算,只能转化成 N 个窗口函数嵌套多级关联。这样的代码复杂难懂,下次遇到类似的问题恐怕还是不会写。如果数据量不是非常大时,建议采用 SPL 来辅助。SPL 可以方便地表达组内运算,可以很容易解决你的问题,代码如下:
| A | |
| 1 | =tbData.group(ID) |
| 2 | =A1.run(~.run(MAX0=A1.~.max(SEQ))) |
| 3 | =A1.run(~.run(MAX1= A1.~.select(Rectype==1).max(SEQ))) |
| 4 | =A1. run(~.run(MAX2= A1.~.select(Rectype==2).max(SEQ))) |
代码中的“~”就表示每个分组,类似于循环变量。另外,步骤 2,3,4 可以合为一步:
=A1.run(~.run(MAX0=A1.~.max(SEQ)),
~.run(MAX1=A1.~.select(Rectype==1).max(SEQ)),
~.run(MAX2=A1.~.select(Rectype==2).max(SEQ)) )
上述计算结果是 ResultSet 类型,和 JAVA 或报表都很容易集成,可以参看:
686

被折叠的 条评论
为什么被折叠?



