大概介绍下思路,细节根据需求具体情况酌情修改。
需求,根据数据的权重值来随机读取数据,权重值越大,被读到的几率越大。
根据这个需求,基本思路就是将生成的随机数按照权重值得多少来划分数据范围,每个值所占全部数据范围的比重和权重值匹配。
例如,有5个权重值:1,2,3,4,5那么将整个数据范围分为5个区域,每个数据所占的范围分别是10%,20%,30%,40%和50%
简单的模型为:
case when @num between 0 and 9 then 1 --0
when @num between 10 and 29 then 2 --1
when @num between 30 and 59 then 3 --3
when @num between 60 and 99 then 4 --6
when @num between 100 and 149 then 5 --10
END
所设置的数据范围值为1+2+3+4...的级数求和,也就是n*(n-1)/2,反向计算所得数值对应的权重值,即使求解一元二次方程式:n(n-1)/2=a
n=(1+SQRT(1+8a))
测试:
SELECT sv.number,CONVERT(INT,(1+SQRT(1+8*sv.number))/2) AS weighting FROM MASTER..spt_values AS sv WHERE sv.type='p'
number weighting
0 1
1 2
2 2
3 3
4 3
5 3
6 4
7 4
8 4
9 4
10 5
11 5
12 5
13 5
14 5
15 6
16 6
17 6
18 6
19 6
20