linux解压分文件(multipart)的 .zip 文件

本文讲述了作者在处理NUS-WIDE-TC10数据时遇到的压缩文件问题,通过将IAll.z0*文件重命名并使用7z命令成功合并,解决了CRC错误。重点在于处理多部分ZIP文件的方法和适用的命令。

[1] 中提供的 NUS-WIDE-TC10 和 NUS-WIDE-TC21,是压缩成多个 IAll.z0* 文件的。以前解压 NUS-WIDE-TC21 时,所记的笔记是用:

cat IAll.z0* >> IAll.zip
zip -FF IAll.zip --out all-image.zip
unzip all-image.zip

解压的,而且备注了需要大内存。注意第一条是 >> 而不是 >

然而今天用这个套路解压 NUS-WIDE-TC10 的时候发现不行了,会报错说 CRC 错误(不知道之前解压 NUS-WIDE-TC21 时是不是其实也报错了,忘了)。后来是跟 [3] 用 7z 命令搞掂的。先把 IAll.z0* 重命名成 IAll.zip00*(或用软链接[4]),然后用:

7z x IAll.zip

注意,[2] 中是对 *.zip001 用命令,我不知道是不是随便哪个都行。[1,2] 都有提到叫 *.zip 的是 last part,要对 last part 操作。

[5] 的实验有用到 NUS-WIDE-TC10 的数据,用本文解压出来的 images 可以基本复现其文章的结果,应该是解压成功了的。

References

  1. jiangqy/DCMH-CVPR2017
  2. How to extract and join files xxx.zip, xxx.z01 and xxx.z02
  3. How to unzip a multipart (spanned) ZIP on Linux?
  4. linux创建、删除文件夹的软链接
  5. Joint-modal Distribution-based Similarity Hashing for Large-scale Unsupervised Deep Cross-modal Retrieval
  6. Combine the split zip files downloading from Google Drive [closed]
  7. How to unzip multiple zip files into a single directory structure (e.g. Google Drive folder export)
  8. How to extract and join files xxx.zip, xxx.z01 and xxx.z02
  9. Can’t download large file from Google Drive as one single folder, always splits into multiple parts
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值