如题:
我只选择最关键的语句:iconv -f gb18030 -t utf-8 $1 > $2
这样会出现“未知xxx处的非法输入序列”,我想可能是有些汉字字符识别不出来
于是,我把它改为iconv -c -f gb18030 -t utf-8 $1 > $2,多加了一个-c,忽略无效的字符
发现转化过来基本正确(起码汉字的翻译全对了,也没有丢失数据),但是有个小地方出错了,如下图

而且转化过来的大小也不一样,如下图

这个有办法解决吗?假如代码量比较大的话,转过来又要去核对是否正确,那也是相当麻烦,而且一点都不可靠
在使用iconv进行字符集转换时,遇到非法输入序列的问题。通过添加-c选项忽略无效字符后,大部分汉字能正确转换,但存在细节错误及文件大小不一致的情况。
427

被折叠的 条评论
为什么被折叠?



