zipfile 中文乱码的解决

本文介绍了如何在使用Python的`zipfile`模块时,遇到GBK编码文件导致的乱码问题。通过定义检查编码错误的函数和修复方法,作者展示了如何将文件名从GBK编码转换为cp437编码以解决乱码问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

乱码产生的原因是zipfile在解码时,处理非ascii编码,只在Unicode和cp437之中选一个,采用gbk编码的文件就会没采用gbk解码而乱码

乱码检测:

def checkEncodeError(string):
    try:
        string.encode('gb2312')
    except UnicodeEncodeError:
        return True
    return False

乱码修复:

zipPath	=	'demo.zip'
 if (zipfile.is_zipfile(zipPath)):
 	outdir	=	zipPath.replace('.zip', '')
     f = zipfile.ZipFile(zipPath)
     for file in f.namelist():
         f.extract(file, outdir	)
         if (self.checkEncodeError(file)):
             os.rename(os.path.join(outdir,file), os.path.join(outdir,file.encode('cp437').decode('gbk')))
     f.close()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值