一、前言
在日常工作中,我们通常需要对文本内容进行一些列的处理,以下来总结以下,linux对文本处理的几个工具和用法。
二、文本处理工具
1.cut
简介:cut的工作就是"剪",具体的说就是在文件中负责剪切数据用的。cut命令从文件的每一行剪切字节、字符和字段,并将这些字节,字符和字段输出。
(1)基本用法
cut [选项参数] filename
说明:默认分隔符是制表符
(2)选项参数说明
选项参数 | 功能 |
---|---|
-f | 列号,取第几列 |
-d | 分隔符,按照指定的分隔符分隔列,默认是制表符"\t" |
-c | 按字符进行切割,后加n,表示取第n列,比如:-c 1 |
(3)案例实操
切割ifconfig后,打印IP地址
2.sed
简介:sed是一种流编辑器,它一次处理一行内容。处理时,把它处理的行存储在临时缓冲区中,称为”模式空间“,接着用sed命令处理缓冲区间中的内容,处理完后,把缓冲区中的内容送往屏幕。接着处理下一行,这样不断重复直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。
(1)基本用法
sed [选项参数] filename
(2)选项参数说明
选项参数 | 功能 |
---|---|
-e | 直接在命令行模式上进行sed的动作编辑 |
(3)命令功能描述
命令 | 功能描述 |
---|---|
a | a的后面可以接字符串,在下一行出现 |
d | 删除 |
s | 查找并替换 |
(4)实例操作
在第二行下面插入banana
删除apple
将pear替换成oranger
将第三行删除,并将pear变成oranger
3.awk
一个强大的文本分析工具,把文件逐行读入,以空格为默认分隔符将每行切片,切开的部分再进行分析处理。
(1)基本用法
awk [选项参数] “pattern1{action1} pattern2{action2}…” filename
pattern:表示awk数据中要查找的数据内容,就是匹配模式
action:在查找匹配内容时,所执行的一系列命令
(2)选项参数
选项参数 | 功能 |
---|---|
-F | 指定输入文件拆分隔符 |
-v | 赋值一个用户定义变量 |
(3)awk的内置变量
变量 | 说明 |
---|---|
FILENAME | 文件名 |
NR | 已读的记录数 |
NF | 浏览记录的域的个数(切割后,列的个数) |
(4)按理实操
截取以root开头,冒号分隔的第7列数据(这里只展示一个基本的用法)
用awk切主机ip地址(用cut也行):
其它例子:
用户定义变量,如:awk -F : -v i=1 ‘{print $3+i}’ passwd
统计passwd文件名,每行的行号,每行的列数,如:awk -F : ‘{print FILENAME “,” NR “,” NF}’ passwd
4.sort
将文件进行排序,并将结果标准输出
(1)基本用法
sort(选项)(参数)
选项 | 说明 |
---|---|
-n | 依照数值大小排序 |
-r | 以相反的顺序来排序 |
-t | 设置排序时所用的分隔字符 |
-k | 指定需要排序的列 |
(实例待补充。。。)