大家常用的分割文本的方法都是通过sed -n 命令来操作,
sed 的优点是可以指定具体的行,缺点每次分割要重新读取整个文本,效率低了点。
在高人指点下发现split这个方法好用些,也参考了其他的资料总结一下split用法。
split [参数] 需要分割的文件
-b size :对file进行切分,每个小文件大小为SIZE。可以指定单位b,k,m。
-C size :与-b选项类似,但是切割时尽量维持每行的完整性。
-l lines : 按行分割,每个文件有 lines行
-a num : 以num个数字或字母做尾数
-d : 添加数字后缀
prefix : 分割后产生的文件名前缀。
举个栗子:按行分隔,每1000行切割test.txt文件,添加数字后缀,以3位数数字做尾数,test_:分割后的文件的前缀
split -l 1000 -d -a 3 test.txt test_
结果文件:
test_000
test_001
test_002
...
基本用法,不指定生成文件名前缀:
split -l 100 300line_file
结果文件:
xaa
xab
xac
split 就是不能将结果一次放在指定的文件夹,此时可以已区别其他文件名的格式命名然后mv就行
参考链接:https://www.jianshu.com/p/f4a16185c65f
https://blog.youkuaiyun.com/llogitech/article/details/44959485
本文介绍了如何利用split命令高效地分割大型文本文件。详细解释了split命令的各种参数,包括按大小、行数分割文件的方法,并提供了实际的例子,如按1000行分割文件并以数字后缀命名。

10万+

被折叠的 条评论
为什么被折叠?



