Pentaho - Kettle - Unzip解压报错

博客围绕Pentaho Unzip解压展开,介绍了报错信息,指出kettle用Java解压zip文件默认UTF8编码,若文件在Windows生成(默认GBK编码)会解压出错,Linux生成则无此问题。还给出变通方案,Windows用unzip命令,Linux用unzip -O CP939解压GBK编码包。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Pentaho Unzip 解压

报错信息

2018/08/14 10:13:23 - Unzip Survey package - ERROR (version 7.1.0.0-12, build 1 from 2017-05-16 17.18.02 by buildguy) : 不能解压缩文件 [file:///D:/kettle/demo/stagingarea/compression/Data_20180808102339.zip]. 异常: [MALFORMED] 2018/08/14 10:13:23 - Unzip Demo package - ERROR (version 7.1.0.0-12, build 1 from 2017-05-16 17.18.02 by buildguy) : java.lang.IllegalArgumentException: MALFORMED

原因分析

kettle里使用java来解压zip文件,默认使用utf8编码,但是没有提供指定编码的地方。如果Zip文件是在Windows上生成的,那么默认的编码是GBK,所以以UTF8编码去解压时,会导致解压文件出错。当然,如果Zip文件是在Linux上生成的,就不会出现这个问题。

变通方案

  • Windows 如果在windows平台上,直接使用unzip命令来解压。
  • Linux 如果在Linux平台上,需要使用unzip -O CP939 来解压GBK编码的Zip包就可以了。

转载于:https://my.oschina.net/swuly302/blog/1938985

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值