一种千万级别文件查找思路

将千万级别的文件按照名称排序,

每5000条记录提取一个关键id。

按照关键id新建文件夹

将前5000个文件放入第一个关键文件夹中,5001-10000放入第二个文件夹中。

生成一个python字典,键为所有关键点,值为关键点对应的文件。

将python字典转换为json文件。


提取时的步骤:
1:将json文件转换为python的字典格式。

2:获取字典的键

3:将键排序后放入一个列表中。

4:待查找的文件与列表中的元素做大小比较,获取对应的元素,即关键点。

5:判断该关键点列表中是否存在待查找的文件。

6:存在则拼接出路径,不存在则返回不存在。完成查找。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值