AllDup 重复文件清理工具使用及技术猜想

前言

一个高效的查找重复文件的免费软件工具。

今天整理照片的时候用 Windows 文件资源管理器里自带的查找,感觉一坨。根本查不到带有关键词的文件,也不清楚那个查找到底是按什么查的。

以前我用的是 Wox + Everything 的组合,可以快速查找电脑特定文件。不过这个方案不适用于我今天需要的批量删除场景,比如我想快速查找清理一个文件夹里的所有重复文件,总不能手动查找所有类似 aaa.mp4 和 aaa(1).mp4 的文件组合再删掉其中一个吧。百度网盘倒是自带了清理功能,但是在网盘上操作实在太慢了。

AI 给我的建议是用微软电脑管家,或者 AllDup 免费软件。

安装

直接搜索 AllDup 就能找到官网:alldup.info.

image-20251206004349181

该软件由德国小型软件公司 Michael Thummerer Software Design (MTSD) 发行,制作备份、同步这类管理软件,重点在于长期专注的开发和维护 AllDup 这款最知名的软件。

回到正文,上图中就可以点击下载。

下载完成后界面如图:

image-20251206005150673

如何检索

首先,选中图中的文件夹来选定要搜索的路径。

然后在“搜索条件”中设定如何搜索。如下图,支持的搜索方式包括:按一定规则查找重复文件;按一定规则查找相似的文件名;按匹配度查找视频,图片,音频文件。

image-20251206005314952

比如我想要查找重复文件,我的判别依据是文件的内容,大小是否完全一致,如果一致则视为重复。

image-20251206005455945

在“文件筛选器”中,还可以限制其中的查找范围,比如我只想查找重复图片,就可以选定 jpg 或者 png 格式而忽略其他文件。也可以自行限定要匹配的文件名。

image-20251206005628092

设定完成后,点击“开始查找”即可。如下图。

image-20251206005812875

然后可以统一按照一定的规则去重。在顶部菜单的“选择”中指定规则,如下图所示可以按照名称长短,查找出现的顺序,创建和修改日期,特定文件夹进行保留,基本涵盖了所有场景。我之前直接使用“保留最旧的文件”,批量选择清理了100多个视频。

image-20251206010301865

接着点击带有红叉号的文档按钮,还可以设定清理方式,比如直接强行删除;放入回收站;转移到指定文件夹等。为了保险起见,我就选择移动到回收站,这样如果发现误删还可以挽回。

image-20251206010551913

技术猜测

我之前在装有200GB的视频文件夹中使用此工具查找出几百个重复视频,只花了3分钟不到。所以我对其实现技术也比较好奇(反正不会是像我写的O(N^2)一样屎山)。搜索没有搜到其相关原理,不过 DeepSeek 的推测原理如下(按照查找文件大小和内容查找逻辑):

flowchart TD
    A[开始扫描所有文件] --> B

    subgraph B [第一步:快速索引]
        B1[按文件大小分组]
    end

    B --> C{文件大小是否唯一?}
    C -- 是 --> D[✅ 直接排除<br>不可能重复]
    C -- 否 --> E[进入“候选组”]

    E --> F

    subgraph F [第二步:精确比对]
        F1[计算并比对“文件指纹”<br>(如哈希值)]
    end

    F --> G{“指纹”是否一致?}
    G -- 是 --> H[🔗 标记为重复文件]
    G -- 否 --> I[❌ 排除]

在 Leetcode 中也能找到类似的问题。Leetcode 609 号题也是查找指定目录下所有重复文件,不过该题目中出现的重复文件是根据文件名相同即可判断,题目的难点在于该目录下可能有很多子目录,两个子目录中出现的同名文件也被视作重复文件。该题目解法是利用 HashMap 数据结构,key 是提取出的文件名(如 a.txt),值是其路径(如 root/),这样不同目录下的重复文件名都会被尝试放到同一个 key 中,当然第二次及以后的插入 Map 会失败,这样就可以高效判断重复。

随笔

很久没有写博客了!前段时间找工作,感觉非常迷茫。之前自己主要的学习方式就是记录博客记笔记,也收获了很多关注(最近 优快云 被访问量破50w了,可喜可贺)。但是这段个人经历在面试的时候被很多 HR 吐槽:“搞个人博客这种兴趣爱好,算不上什么技术经历,我建议你就不要拿出来丢人。”进而质疑我是不是一个只会纸笔抄代码,没有实际敲过什么项目的”物联网转计算机“学生。再加上电脑报废,原来的博客文件找不到之类的风波,我停更了很久。

自己大学以来一直坚持的事情被否定,给我的打击还是挺大的。我理解个人价值并非由他人三两句话而定义,但是对于找工作这件事情,HR 不就是那个有权利定义我的人,我需要博得认可的人吗?所以我也不禁相信他的话是对的。

但是说实话这段时间找下来,我觉得这些也没有那么重要了。也许现在看来,一次次找工作,面试在漫长的人生中也只是一个个小小的无关紧要的节点,并没有现在想象的那么致命。再者,就算我没有找到什么技术开发的工作,大学所学没有投入实践,未必是什么坏事。我相信,过一段自己认可的好的人生,仍然不需要任何人的认可。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

灰海宽松

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值