抽取文本的工具
文件查看一般选择cat命令,直接在命令框中查看文件中内容,不打开文件
cat [OPTION]…[FILE]…
-E 显示行结束符$
-n 对显示的每一行进行编号
-A 显示所有的空字符
-b 对非空字符进行显示
-s 压缩连续的空行成一行
查看文本前几行
head 命令
head [OPTION]…[FILE]…
-c# 显示获取前#字节
-n# 显示获取前#行内容
-# 指定行数
在文件内容末尾开始查看
tail[OPTION]…[FILE]…
-c# 显示获取后#字节
-n#显示获取后#行
-# 显示获取后#行
-f 跟踪显示文件新追加的内容,常用于监控日志,相当于–follow=descriptor
-F 跟踪文件名,相当于——follow=name --retry
按列抽取文本cut和合并文件paste
cut [OPTION]…[FILE]…
cut -d分隔符 -f#,# :
cut -d分隔符 为以分隔符为基准取数据
-f#,#为所取字段的范围。 -d -f 一般合起来使用
以1和2字段
以1和4字段
cut和head和tail 可以一起使用
截取出ens33中的IP地址
首先用head命令截取ifconfig命令的前两行,用tail截取两行中的后面一行,使用tr -s “ ”将重复的空格合并成一个方便显示,最后用cut 命令的-d -f命令截取IP地址
解析文本的工具
文本数据统计:wc
整理文本:sort
wc会对文中中单词的总数,行数,字节总数和字符总数进行统计
36 ,,,81 ,, 1955 ,, f5
行数 ,, 字数 , 字节数 , 文件名
-l 只对行计数
-w 对单词总数计数
-c 只对字节数计数
-m 只对字符数计数
-L 显示文件中最长行长度
文本排序
sort [OPTION]…[FILE]…
-r 执行反方向整理
-u 删除输出中的重复行
uniq命令:在输出中直接删除前后相接重复的行
-c 显示每行中重复的次数
-d 仅显示重复的行
- u 仅显示不重复的行
重复的是上下行,所以-d 中没有重复显示