在shell中,用sort进行排序时,如果排序中含有中文时,需要注意一下。
sort之前, 我的 LANG=zh_CN
我的数据中有中文,在进行排序时,我想按照行进行排序,如果行数据有一样的,就只显示一行。现在的结果是,即使行数据是一样的,它可能也会显示多行。
最终还是因为LANG的问题,因为在zh_CN时,有的编码不能识别,导致它会比较错误
所以在sort之前,把 LANG=GBK就将这个问题解决了
本文介绍了解决在Shell脚本中使用sort命令对含有中文的数据进行排序时遇到的问题。当使用特定的语言环境设置(如LANG=zh_CN)时,可能会因为编码问题导致相同的行数据被误认为不同而重复显示。通过调整语言环境变量LANG为GBK,可以有效解决这一问题。
在shell中,用sort进行排序时,如果排序中含有中文时,需要注意一下。
sort之前, 我的 LANG=zh_CN
我的数据中有中文,在进行排序时,我想按照行进行排序,如果行数据有一样的,就只显示一行。现在的结果是,即使行数据是一样的,它可能也会显示多行。
最终还是因为LANG的问题,因为在zh_CN时,有的编码不能识别,导致它会比较错误
所以在sort之前,把 LANG=GBK就将这个问题解决了

被折叠的 条评论
为什么被折叠?