如果待解压文件路径中带有中文时会在解压文件路径中出现乱码,通过查找质料知道其主要原因是:在zip标准中,对文件名的 encoding 用的不是 unicode,而可能是各种软件根据系统的默认字符集来采用(此为猜测)而zipfile中根据文件flag 检测的时候,只支持 cp437 和 utf-8,而Windows系统使用的是gbk。处理的办法:一更改源码:像我这个版本python3.10.8的具体解决方法是在python安装目录下找到lib文件夹下的zipfile.py然后将该文件的第1374行的 filename=filename.decode('cp437')
改为filename = filename.decode('GBK')
第1533行的filename = filename.decode('cp437')
改为filename = filename.decode('GBK')
二解压后更改文件名。
当zip文件包含中文路径且在Windows系统上解压时,由于编码不兼容导致乱码。文章指出zip标准可能使用非unicode编码,Python的zipfile模块仅支持cp437和utf-8。为解决此问题,可以修改python的zipfile.py源码,将解码方式从cp437改为GBK,或者解压后手动更改文件名。
3925

被折叠的 条评论
为什么被折叠?



