python3 zipfile.BadZipFile: File is not a zip file

今天在安装python-Levenshtein的时候出现了下面的问题:

 File "/usr/lib/python3/dist-packages/pip/commands/install.py", line 353, in run
    wb.build(autobuilding=True)
  File "/usr/lib/python3/dist-packages/pip/wheel.py", line 749, in build
    self.requirement_set.prepare_files(self.finder)
  File "/usr/lib/python3/dist-packages/pip/req/req_set.py", line 380, in prepare_files
    ignore_dependencies=self.ignore_dependencies))
  File "/usr/lib/python3/dist-packages/pip/req/req_set.py", line 620, in _prepare_file
    session=self.session, hashes=hashes)
  File "/usr/lib/python3/dist-packages/pip/download.py", line 809, in unpack_url
    unpack_file_url(link, location, download_dir, hashes=hashes)
  File "/usr/lib/python3/dist-packages/pip/download.py", line 715, in unpack_file_url
    unpack_file(from_path, location, content_type, link)
  File "/usr/lib/python3/dist-packages/pip/utils/__init__.py", line 617, in unpack_file
    flatten=not filename.endswith('.whl')
  File "/usr/lib/python3/dist-packages/pip/utils/__init__.py", line 502, in unzip_file
    zip = zipfile.ZipFile(zipfp, allowZip64=True)
  File "/usr/lib/python3.6/zipfile.py", line 1131, in __init__
    self._RealGetContents()
  File "/usr/lib/python3.6/zipfile.py", line 1198, in _RealGetContents
    raise BadZipFile("File is not a zip file")
zipfile.BadZipFile: File is not a zip file

解决方法

pip3 install --upgrade pip

参考文献

[1]. pip install xxxx报错(一大堆红色exception)【解决】. https://www.cnblogs.com/4wheel/p/8193255.html

### Python 中读取 DOCX 文件时遇到 `zipfile.BadZipFile` 错误的解决方案 DOCX 文件本质上是一个 ZIP 压缩包,其中包含了多个 XML 文件和其他资源。因此,在使用 Python 的 `python-docx` 库或其他库操作 DOCX 文件时,如果文件损坏或不兼容可能会引发 `zipfile.BadZipFile: File is not a zip file` 错误。 #### 检查文件完整性 确保目标 `.docx` 文件未被破坏,并且确实是以 `.docx` 扩展名保存的 Office Open XML 文档[^1]。 #### 验证文件扩展名 确认文件具有正确的 `.docx` 后缀而不是其他格式如 `.doc` 或者临时文件形式(例如以 `.~` 开头)。可以通过操作系统自带的方式尝试打开该文档来初步验证其有效性[^4]。 #### 使用可靠的第三方软件测试 利用像 WinRAR 或 7-Zip 这样的压缩工具试着解压 `.docx` 文件,以此检验它是否能作为一个正常的 ZIP 存档被识别并正常工作。 #### 处理编码问题 有时当涉及到不同字符集之间的转换时会出现乱码现象进而导致解析失败。对于这种情况可以在加载文档之前调整默认编码设置: ```python import zipfile try: with zipfile.ZipFile('example.docx', 'r') as zp: # 此处可加入更多逻辑用于处理 .docx 文件的内容 except zipfile.BadZipFile: print("The provided document could not be read because it appears to be corrupted or improperly formatted.") ``` 为了更稳健地应对可能存在的编码差异,可以考虑自定义 `_EndRecData64` 方法中的字符串解码部分,但这通常不需要普通开发者自行更改标准库源代码除非有特殊需求[^3]。 #### 安全性建议 始终从可信渠道获取和分享 Microsoft Word 文档,避免因恶意篡改而引起的潜在风险。此外定期备份重要数据以防意外丢失。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

农民小飞侠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值