Hash应用

本文探讨了位图在海量数据存储中的应用,包括快速查找、去重和排序,以及布隆过滤器的概念、优点和误判特性,以及如何在内存受限情况下找到文件交集。还介绍了哈希切割技术在大文件分析中的应用,如找出出现次数最多的IP地址。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

1.位图

1.1 位图概念

1.2 位图的应用场景

2.布隆过滤器

2.1 布隆过滤器概念

2.2 布隆过滤器的应用

3.哈希切割


1.位图

1.1 位图概念

数据是否在给定的整形数据中,结果是在或者不在,刚好是两种状态,那么可以使用一个二进制比特位来代表数据是否存在的信息,如果二进制比特位为1,代表存在,为0代表不存在。比如:

所谓位图,就是用每一位来存放某种状态,适用于海量数据,数据无重复的场景。通常是用来判断某个数据存不存在的。

优点:处理海量数据,占用内存小,速度快

缺点:只能映射整形,其他类型,比如浮点数,string等等不能储存映射

1.2 位图的应用场景

1. 快速查找某个数据是否在一个集合中

例题:

给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在 这40亿个数中。【腾讯】

用位图40亿个不重

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值