大家常用的分割文本的方法都是通过sed -n 命令来操作,
sed 的优点是可以指定具体的行,缺点每次分割要重新读取整个文本,效率低了点。
在高人指点下发现split这个方法好用些,也参考了其他的资料总结一下split用法。
split [参数] 需要分割的文件
-b size :对file进行切分,每个小文件大小为SIZE。可以指定单位b,k,m。
-C size :与-b选项类似,但是切割时尽量维持每行的完整性。
-l lines : 按行分割,每个文件有 lines行
-a num : 以num个数字或字母做尾数
-d : 添加数字后缀
prefix : 分割后产生的文件名前缀。
举个栗子:按行分隔,每1000行切割test.txt文件,添加数字后缀,以3位数数字做尾数,test_:分割后的文件的前缀
split -l 1000 -d -a 3 test.txt test_
结果文件:
test_000
test_001
test_002
...
基本用法,不指定生成文件名前缀:
split -l 100 300line_file
结果文件:
xaa
xab
xac
split 就是不能将结果一次放在指定的文件夹,此时可以已区别其他文件名的格式命名然后mv就行
参考链接:https://www.jianshu.com/p/f4a16185c65f
https://blog.youkuaiyun.com/llogitech/article/details/44959485