《算法通关村——位运算在查找重复元素中的妙用》

文章介绍了如何在只有4KB内存的情况下,利用位运算和位向量技术来查找重复元素,通过创建32000比特的位向量存储整数,遍历数组并检测重复元素。

《算法通关村——位运算在查找重复元素中的妙用》

在海量数据中,此时普通的数组、链表、Hash、树等等结构有无效了 ,因为内存空间放不下了。而常规的递归、排序,回溯、贪心和动态规划等思想也无效了,因为执行都会超时,必须另外想办法。这类问题该如何下手呢?这里介绍三种非常典型的思路:

  1. 使用位存储,使用位存储最大的好处是占用的空间是简单存整数的1/8。例如一个40亿的整数数组,如果用整数存储需要16GB左右的空间,而如果使用位存储,就可以用0.5GB的空间,这样很多问题就能够解决了。
  2. 如果文件实在太大 ,无法在内存中放下,则需要考虑将大文件分成若干小块,先处理每个块,最后再逐步得到想要的结果,这种方式也叫做外部排序。这样需要遍历全部序列至少两次,是典型的用时间换空间的方法。
  3. 堆,如果在超大数据中找第K大、第K小,K个最大、K个最小,则特别适合使用堆来做。而且将超大数据换成流数据也可以,而且几乎是唯一的方式,口诀就是“查小用大堆,查大用小堆”。

用 4KB 内存寻找重复元素

分析:本身是一道海量数据问题的热身题,如果去掉“只有4KB”的要求,我们可以先创建一个大小为N的数组,然后将这些数据放进来,但是整数最大为32000。如果直接采用数组存,则应该需要32000*4B=128KB的空间,而题目有4KB的内存限制,我们就必须先解决该如何存放的问题。

如果只有4KB的空间,那么只能寻址8*4*2^10个比特,这个值比32000要大的,因此我们可以创建32000比特的位向量(比特数组),其中一个比特位置就代表一个整数。

利用这个位向量,就可以遍历访问整个数组。如果发现数组元素是v,那么就将位置为v的设置为1,碰到重复元素,就输出一下。

package Algorithm15;

public class FindRepeatedNum {
    static class BitSet {
        private int[] bitSet;
        BitSet(int size){
            bitSet = new int[size >> 5];
        }
        public int get(int position){
            int wordNum = position >> 5; // 计算数据在数组中的哪一个位置
            int bitNum = position % 32; // 计算数据在某个位置的那个比特位,这两个操作就能够满足把某一个数据进行存在与否的设定。
            return bitSet[wordNum] & (1<<bitNum);
        }
        public void set(int position){
            int wordNum = position >> 5;
            int bitNum = position % 32;
            bitSet[wordNum] |= (1<<bitNum);
        }
    }
    public static void findRepeatedNum(int[] nums){
        BitSet bitSet = new BitSet(32000);
        for(int num :nums){
            int position = num - 1;
            if(bitSet.get(position) != 0){
                System.out.println(num);
            }else{
                bitSet.set(position);
            }
        }
    }

    public static void main(String[] args) {
        findRepeatedNum(new int[]{1,1,5,6,8,3,23,6,23,8});
    }
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xwhking

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值