java中有一个BitSet类,在处理大数据查找重复数时候非常方便,但是BitSet类只能支持整数型的数据,对于位数非常多的比如long型数据就没办法了。
作者思考一下,扩展了一下BitSet,用两段BitSet类来处理long型数据,结果是成功的。
下面是测试代码:
import java.util.BitSet;
/**
* BitSet扩展类,支持long型整数
* @author zhouxj
*
*/
public class BitSetL {
private BitSet usedH = new BitSet();// 高位图
private BitSet usedl = new BitSet();// 低位图
public int getHigh(long l) {
// long l = 900030065410220000L;
int j = 1000000000;
if (l > 1000000000000000000L) {
System.out.println("Out range!");
return 0;
} else {
l = l / j; // 整除,去掉后9位
// System.out.println((int)l);
return (int) l;
}
}
public int getLow(long l) {
// long l = 900030065410220000L;
int j = 1000000000;
if (l > 1000000000000000000L) {
System.out.println("Out range!");
return 0;
} else {
l = l % j; // 取余数,去掉前9位
// System.out.println((int)l);
return (int) l;
}
}
public void setComp(long l) {
usedH.set(getHigh(l));
usedl.set(getLow(l));
}
public boolean getComp(long l) {
return usedH.get(getHigh(l)) && usedl.get(getLow(l));
}
}
//测试类
public class testBit{
private static final long[] BYTE_COUNTS = { //要搜索的数据表
0, 1, 1, 25, 1678, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4,
1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4998766, 4,99998888775L,
1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5,
2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6,
1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5,
2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6,
2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6,
3, 4, 4, 5, 4, 5, 5, 6, 4, 5899, 5, 6, 5, 6, 6, 7,
1, 2, 2, 3, 2, 3, 3, 4652, 2, 3, 3, 4, 3, 4, 4, 5,
2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6,
2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6,
3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7,
2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6,
3, 4, 44, 57, 4, 5, 5, 6, 4, 5, 5, 687, 5, 6, 6, 7,
3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7,
4, 5, 5, 6, 5, 6, 96, 7, 5, 6, 96, 77, 6, 7, 7, 8
};
public static void main(String args[]){
BitSetL b1=new BitSetL();
for(int i=0;i<BYTE_COUNTS.length;i++){
b1.setComp(BYTE_COUNTS[i]);
}
System.out.println(b1.getComp(99998888775L));
System.out.println(b1.getComp(96L));
System.out.println(b1.getComp(314L));
}
}
输出结果:
true
true
false
本文介绍了一种在Java中使用BitSet类处理long类型数据的方法。通过将long型数值分解为高位和低位两个部分,并分别使用两个BitSet进行存储,从而实现了对大数据量的高效处理。测试代码展示了如何设置和获取long型数据的状态。
4305





