关于SQLServer2005的学习笔记——CTE递归和模拟测试数据

本文对比了Oracle和SQL Server两种数据库系统中模拟大量随机数据的方法。Oracle利用DUAL表、Connect By语句和DBMS_RANDOM包轻松生成随机数据;而SQL Server则需借助CTE递归和随机函数RAND,存在构建物理表、递归限制等问题。

Oracle 中模拟测试 数据是非常简单的一件事情。

Oracle 首先提供了一个 dual 的虚表

其次提供了一个 Connect by 语句,实现了虚表数据列的模拟

最后 Oracle 提供了强大的 DBMS_RANDOM 包进行相关随机数的产生。

SELECT

  TRUNC(DBMS_RANDOM.VALUE(1,101)),

  DBMS_RANDOM.string('~',5),

  DBMS_RANDOM.string('l',5),

  DBMS_RANDOM.string('L',5),

  DBMS_RANDOM.string('a',5),

  DBMS_RANDOM.string('A',5),

  DBMS_RANDOM.string('u',5),

  DBMS_RANDOM.string('U',5),

  DBMS_RANDOM.string('x',5),

  DBMS_RANDOM.string('X',5),

  DBMS_RANDOM.string('p',5),

  DBMS_RANDOM.string('P',5)  

from

(

SELECT level,ROWNUM rn

  FROM DUAL

CONNECT BY ROWNUM<=1001

)

 

相比而言, SQLServer 则没那么幸运了,首先没有虚拟的概念,则需要构建一个物理表以存储需要模拟的次数,再次需要使用 CTE 递归来模拟一个虚表数据,最后才通过相关随机函数进行构建数据。

-- 创建一个物理表,并插入要模拟的次数,最大不能超过 32767

CREATE TABLE RandTable

(

  MaxNumber INT CHECK (MaxNumber >= 0 AND MaxNumber<=32767),

)

INSERT INTO RandTable values(32767);

-- 使用 CTE 递归构建列数据

WITH AutoSequence(MaxNumber,Identiy)

AS

(

SELECT e.MaxNumber,1 AS Identiy FROM RandTable AS e

UNION ALL

SELECT e.MaxNumber,Identiy+1 c FROM RandTable AS e,AutoSequence d

WHERE d.Identiy<e.MaxNumber AND d.Identiy<500

)

-- 用时间 + 递增值做种子进行 RAND

SELECT LEFT(NEWID(),4),

       RAND((DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),

       RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),

       CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT),

       CAST(RIGHT(CAST(RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())) AS VARCHAR(100)),2) AS INT)

  FROM AutoSequence

OPTION (MAXRECURSION 32767);

SELECT LEFT(NEWID(),4),

       CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT)

  FROM AutoSequence

OPTION (MAXRECURSION 32767);

 

小结:

使用 CTE 递归和 SQLServer 随机函数还是存在很多问题的。

1 、一定需要构建一种物理表

2 CTE 递归限制在 0 32,767 之间

3 RAND 产生的随机数比较集中,通过时间 + 递增值的方式来实现的话,只能截取后几位,导致无法控制随机值的区域。

4 NEWID() 产生的随机数为字符和数字混杂,也不能得到预期的效果

 

附,经测试不需要物理表也可

WITH RandTable(MaxNumber)
AS
(
SELECT 500 MaxNumber
),
AutoSequence(MaxNumber,Identiy)
AS
(
SELECT e.MaxNumber,1 AS Identiy FROM  RandTable AS e
UNION ALL
SELECT e.MaxNumber,Identiy+1 c FROM  RandTable AS e,AutoSequence d
WHERE d.Identiy<e.MaxNumber AND  d.Identiy<500
)
SELECT LEFT(NEWID(),4),
RAND((DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS  VARCHAR(100)),2) AS INT),
CAST(RIGHT(CAST(RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE()))  AS VARCHAR(100)),2) AS INT)
FROM AutoSequence
OPTION (MAXRECURSION 32767);


评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

python与大数据分析

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值