python删除文件夹下相同文件和无法打开的图片

前天不小心把硬盘格式化了,丢了好多照片,后来用Recuva这款软件成功把文件恢复过来,可是恢复的文件中有好多重复的文件和无法打开的图片,所以写了两个python的小程序用来解决这个问题


删除相同文件:

#coding=utf-8

import os
import os.path
import Image
import hashlib

def get_md5(filename):
    m = hashlib.md5()
    mfile = open(filename, "rb")
    m.update(mfile.read())
    mfile.close()
    md5_value = m.hexdigest()
    return md5_value

if __name__ == '__main__':
    ipath = "E:\\20161019_photo"
    uipath = unicode(ipath, "utf8")

    for parent, dirnames, filenames in os.walk(uipath):
        md5_list = []
        #for dirname in dirnames:  # 输出文件夹信息
            #print "parent is:" + parent
            #print "dirname is: " + dirname
        for filename in filenames:
            #print "parent is :" + parent
            #print "filename is:" + filename
            #print "md5_list is : "

            if(get_md5(os.path.join(parent, filename)) in md5_list):
                os.remove(os.path.join(parent, filename))
            else:
                md5_list.append(get_md5(os.path.join(parent, filename)))
            #print md5_list
            #md5 = []



删除无法打开文件:

#coding=utf-8

import os
import os.path
import Image
import hashlib

def get_md5(filename):
    m = hashlib.md5()
    mfile = open(filename, "rb")
    m.update(mfile.read())
    mfile.close()
    md5_value = m.hexdigest()
    return md5_value

if __name__ == '__main__':
    ipath = "E:\\20161019_photo"
    uipath = unicode(ipath, "utf8")
    for parent, dirnames, filenames in os.walk(uipath):
        for filename in filenames:
            name ,ext = os.path.splitext(filename)
            if((ext == ".png") or (ext == ".tif") or (ext == ".gif")):
                os.remove(os.path.join(parent, filename))
            else:
                if(ext == ".jpg"):
                    try:
                        fp = open(os.path.join(parent, filename), 'rb')
                        img = Image.open(fp)
                    except:
                        fp.close()
                        os.remove(os.path.join(parent, filename))
                    else:
                        continue




<think>嗯,用户这次的需求很明确:要用Python脚本递归遍历多个文件夹,替换所有同名的PNG图片。看来用户正在处理大量分散的图片文件,可能需要统一更新某些图标或素材。用户给出的参考信息其实挺有意思:引用[1]展示了基本的文件重命名操作,引用[2]则涉及批量处理时的后缀名判断逻辑。不过用户的实际需求比这两个引用更复杂——需要处理嵌套文件夹结构,还要考虑同名文件的覆盖替换。我注意到几个关键点需要帮用户解决:首先是递归遍历的实现,os.walk肯定比os.listdir更合适;其次要处理文件覆盖时的异常,特别是权限问题同名冲突;最后还要考虑备份机制,避免误操作丢失原始文件。用户可能正在做游戏素材更新或者网站图片批量替换的工作。考虑到PNG图片的特性,或许还要提醒alpha通道的问题?不过这个需求里没提到图片处理,暂时不用展开。技术上难点主要在路径计算部分:当目标文件夹存在同名文件时,不能简单删除再移动,否则可能中断整个递归流程。用shutil.move配合覆盖参数更安全,但要注意WindowsLinux系统的权限差异。啊,差点忘了用户上次问过递归目录操作(查看历史对话)。这次给出更完整的异常处理是必要的,特别是针对"文件被占用"的情况——比如在Windows系统里打开图片无法覆盖的问题。</think> 以下是一个实现递归遍历多个文件夹、覆盖同名PNG图片Python脚本: ```python import os import shutil from pathlib import Path def replace_pngs(source_dir, target_root): """ 递归替换目标目录中与源目录同名的PNG文件 参数: source_dir: 包含新版PNG的源目录 target_root: 需要被替换的目标根目录 """ # 获取源目录所有PNG文件 {文件名: 完整路径} source_files = {f.name: f for f in Path(source_dir).glob("*.png")} for root, _, files in os.walk(target_root): for file in files: if file in source_files and file.lower().endswith(".png"): target_path = Path(root) / file try: # 覆盖目标文件 shutil.copy2(source_files[file], target_path) print(f"✅ 已覆盖: {target_path}") except Exception as e: print(f"❌ 覆盖失败: {target_path} | 错误: {str(e)}") if __name__ == "__main__": # 配置路径 (示例) SOURCE_DIR = "D:/new_pngs" # 新版PNG所在目录 TARGET_ROOT = "D:/projects" # 需要替换的目标根目录 replace_pngs(SOURCE_DIR, TARGET_ROOT) print("\n🌟 PNG替换操作已完成!") ``` ### 功能说明 1. **递归遍历**:使用 `os.walk()` 深度搜索目标目录 2. **同名覆盖**: - 仅处理文件名完全相同的PNG文件 - 保留原文件路径(如 `D:/projects/logo.png` → `D:/assets/logo.png`) 3. **健壮性处理**: - 异常捕获保证程序不中断 - 使用 `shutil.copy2()` 保留文件元数据 4. **路径兼容**:`pathlib` 确保跨平台路径兼容性 ### 使用步骤 1. 将新版PNG放入**独立目录**(如 `D:/new_pngs`) 2. 修改脚本末尾的路径常量: ```python SOURCE_DIR = "你的新版PNG目录路径" TARGET_ROOT = "需要替换的目标根目录路径" ``` 3. 运行脚本,日志将显示替换详情 > ⚠️ 注意事项: > 1. **备份数据**:操作前备份目标目录 > 2. **权限要求**:脚本需要目标目录写入权限 > 3. **名称规范**:文件全名匹配(含扩展名) > 4. **大小写敏感**:Linux/MacOS系统区分大小写[^1]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值