Linux中,要截取中文,有时候会出乱码,请看正确操作:
正常用-c就可以实现,如果用-b,中文就有乱码,除非你截取的数量刚好等于中文字符的字节数。

cut命令的-n 就是搭配-b来用的,不会拆分多字节的字符 。
cut的常用方式
-d 定义行中的分隔符,默认是空格,可以-d后面跟着写:-d":"
-f 搭配-d,制定分割后的第几段:
cut -d":" -f1 #得 : 分割的第一段
cut -d":" -f 1-3 #得 : 分割的前三段
选某个段的方式,有4种
1、 单数字 就是-f 的第几段,-c 的第几个字符 ,-b 的第几个字节;
2、数字1-数字2 就是选一个区间了,好理解 ;
3、-数字 从n开始之前的都要,n也算,相当于前n个段,-c -3 就是前3个字符;
4、数字- 从n开始之后的都显示,n也算,-f 3- 就是第三段及以后都显示。
本文介绍了Linux下使用cut命令处理文本文件的方法,特别是如何正确截取包含中文字符的内容,避免出现乱码。文中详细解释了使用-b、-c和-n选项的区别,并提供了多种实用的示例。
1228

被折叠的 条评论
为什么被折叠?



