大文件读取、分割、合并

文章介绍了在Linux环境下处理大文件的方法,包括避免使用vim和cat来读取大文件以防止系统资源耗尽,推荐使用more和less。同时,详细阐述了使用split命令进行文件分割,如指定大小、后缀和行数,并展示了合并文本文件和压缩文件的cat命令及重定向操作。

大文件读取、分割、合并

一、读取

文件的读取可参考:Linux文本查看命令
vim和cat 会消耗比较多的内存和cpu资源,导致系统死机或者卡顿,因此读取大文件不建议使用;
more和less 不会消耗特别多的内存和cpu资源。

二、分割

语法:split [选项] [文件名] [前缀]

-b: 指定每个分割文件的大小,单位有K、M、G、P等
-d: 指定分割文件的后缀为数字
-a: 指定分割文件数字后缀的长度,如果是1,后缀为0,1,2…;如果是2,则为00,01,02…默认是2
-C: 指定每行最大的字节数
-l: 指定每个文件最大的行数

# 把bigfile.txt分割为内存大小为1G,分割文件数字后缀长度是1的小文件bigfile.txt.0	bigfile.txt.1 ...
split  -b 1G -a 1 -d bigfile.txt bigfile.txt.
# 把a.txt文件分割为每个文件最大行数是100000,分割文件数字后缀长度为4的小文件c.txt.0000		c.0001	...
split  -l 100000  -a 4 -d a.txt c.txt.

三、合并

压缩文件和非压缩文件的合并都是使用cat 结合重定向 合并成一个大文件:

文本文件的合并

# 把sanchuang.txt.0001~sanchuang.txt.0005的5个文件合并为chen.txt
cat   sanchuang.txt.000{1..5} >chen.txt

压缩文件的合并

# 把压缩文件sc.tar.gz.开头的所有文件合并为sc.tar.gz
cat sc.tar.gz.*   >sc.tar.gz
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值