算法:数组中重复数字

问题A:
数组值范围0~N,找出一个即可:

位置交换,时间O(N),空间O(1)


问题B:
数组值范围0~N,使用辅助空间

二分范围,时间O(NlogN),空间O(1)


问题C:
数组值范围不限

哈希,时间O(N),空间O(N)


问题D:
数组值不限,对空间要求严格

排序,时间O(NlogN),空间O(1)


问题E:
对空间要求严格
数组巨大
例如上百亿url链接黑名单过滤

绝对优秀的哈希函数,上百亿大小比特表
缺点,找不到如此优秀哈希函数,且扩展不容易

布隆过滤器,容忍一定程度失误率
k个哈希函数,m长度比特表,m通常大于N


问题F:
20亿个数字中,找出现次数最多的数:

将20亿个数,拆分成多个批次处理,每次保留上个批次最多的数字,参与下个批次的计算。


问题G:
40亿个非负数,找到未出现过的数:

bitmap方法,一个位表示对应数字是否出现。
分桶,将40亿区间划分几个,统计每个桶内的数字,若数字数量小于区间宽度,则一定有未出现数。


问题H:
100亿个url找出所有重复url:

哈希分流,用哈希函数将所有url分配至不同服务器,利用哈希函数特性,不同服务器url一定不同。

100亿个url找重复topK:

哈希分流后,每个服务器保持一个小根堆,然后所有服务器统一计算,生成唯一一个K大小的小根堆,这里可以使用外排序。


问题I:
40亿个非负正数中找到出现2次的数:

bitmap,每两个bit统计一个数出现的次数。


问题J:
40亿个数找中位数:

分桶计数,找到最中间区间,递归处理。

问题K:
找数组中重复次数大于N/K的数:

哈希,时间O(N*K),空间O(K)

哈希维护k-1个数(num,times),保存k-1个不同的数,当第k个不同的数找到时,所有k个数times-1,然后继续找k个不同的数,遍历完毕后,哈希表里即为所求。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值