PYTHON查找和删除重复文件

最新推荐文章于 2025-01-03 15:31:15 发布

22岁的老11年老码农

最新推荐文章于 2025-01-03 15:31:15 发布

阅读量592

点赞数 10

文章标签： python 哈希算法开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/LK1014104648/article/details/135662151

版权

# coding=gbk
# -*- coding: utf-8 -*- 
import os
import hashlib
from collections import defaultdict

def file_hash(file_path, block_size=65536):
    # 计算文件的MD5哈希值
    hasher = hashlib.md5()
    with open(file_path, 'rb') as f:
        for block in iter(lambda: f.read(block_size), b''):
            hasher.update(block)
    return hasher.hexdigest()

def find_duplicates(directory):
    file_sizes = defaultdict(list)
    duplicates = []

    # 遍历目录及其子目录，查找相同大小的文件
    for root, dirs, files in os.walk(directory):
        for filename in files:
            file_path = os.path.join(root, filename)
            size = os.path.getsize(file_path)
            file_sizes[size].append(file_path)

    # 对相同大小的文件进行进一步检查，使用MD5哈希值
    for size, paths in file_sizes.items():
        if len(paths) > 1:
            hash_dict = defaultdict(list)

            for file_path in paths:
                file_hash_val

最低0.47元/天解锁文章

22岁的老11年老码农

博客等级

码龄14年

11
原创

42
点赞

106
收藏

25
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: steam重装，导入之前的游戏方法

最新评论

关于pyautogui在游戏窗口不工作解决办法
m0_61783907: Apex legends使用pydirectinput这种会直接瞄地怎么解决
PYTHON查找和删除重复文件
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
apex画面卡顿，帧数延迟都正常。解决办法总结
优快云-Ada助手: 恭喜您写了第10篇博客！标题很吸引人，我很期待阅读您的解决办法总结。您能够发现并解决apex画面卡顿问题，这对于我们这些游戏爱好者来说确实是个令人困扰的问题。帧数延迟正常，这更加令人感到困惑，所以我非常期待您的解决办法。在下一步的创作中，我建议您可以考虑分享一些关于优化游戏性能的技巧和经验。毕竟，大家都希望能够在游戏中享受到流畅的画面和良好的体验。再次恭喜您的持续创作，希望您能够继续为我们带来更多有价值的内容！
关于pyautogui在游戏窗口不工作解决办法
jc131: 雷电模拟器可以了，感谢
steam重装，导入之前的游戏方法
优快云-Ada助手: 恭喜您写了第11篇博客！标题看起来很有趣，我对“steam重装，导入之前的游戏方法”这个主题非常感兴趣。您的博客内容一定对很多人有帮助。在下一篇博客中，或许您可以分享一些关于steam游戏备份和恢复的技巧，或者推荐一些适合导入的游戏。我期待着您的下一篇创作，谢谢您的努力！

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。