Linux基本命令《五,文本分析1》

本文详细介绍Linux下cut、sort和wc三个基本命令的使用方法,包括如何通过cut进行数据切割,利用sort进行行排序,以及用wc统计文本文件的行数、单词数和字节数。这些命令是Linux文本分析的基础,适用于初学者和有经验的用户。

Linux基本命令《五,文本分析》

一,cut:显示切割的行数据
f:选择显示的列
s:不显示没有分隔符的行
d:自定义分隔符

[root@node01 ~]# cat grep.txt 
oxx12121212ooxx
ooxx 12121212
oox 12121212
1212 ooxx 1212
oo3xx
oo4xx
ooWxx
oomxx
$ooxx
oo1234xx
ooxyzxx
[root@node01 ~]# cut -d' ' -f1 grep.txt
oxx12121212ooxx
ooxx
oox
1212
oo3xx
oo4xx
ooWxx
oomxx
$ooxx
oo1234xx
ooxyzxx
[root@node01 ~]# cut -d' ' -f1,2 grep.txt
oxx12121212ooxx
ooxx 12121212
oox 12121212
1212 ooxx
oo3xx
oo4xx
ooWxx
oomxx
$ooxx
oo1234xx
ooxyzxx
[root@node01 ~]# cut -d' ' -f1,2,3 grep.txt
oxx12121212ooxx
ooxx 12121212
oox 12121212
1212 ooxx 1212
oo3xx
oo4xx
ooWxx
oomxx
$ooxx
oo1234xx
ooxyzxx
[root@node01 ~]# cut -d' ' -f1-3 grep.txt
oxx12121212ooxx
ooxx 12121212
oox 12121212
1212 ooxx 1212
oo3xx
oo4xx
ooWxx
oomxx
$ooxx
oo1234xx
ooxyzxx
[root@node01 ~]# cut -d' ' -s -f1-3 grep.txt
ooxx 12121212
oox 12121212
1212 ooxx 1212
[root@node01 ~]# cut -d' ' -s -f3 grep.txt


1212

[root@node01 ~]# cp /etc/passwd ./
[root@node01 ~]# ls
123.bak  abc  anaconda-ks.cfg  grep.txt  install.log  install.log.syslog  passwd  profile  wangle  x  y
[root@node01 ~]# cat passwd 
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
gopher:x:13:30:gopher:/var/gopher:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
vcsa:x:69:69:virtual console memory owner:/dev:/sbin/nologin
saslauth:x:499:76:"Saslauthd user":/var/empty/saslauth:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
[root@node01 ~]# cut -d':' -f1 passwd 
root
bin
daemon
adm
lp
sync
shutdown
halt
mail
uucp
operator
games
gopher
ftp
nobody
vcsa
saslauth
postfix
sshd

二,sort:排序文件的行
n:按数值排序
r:倒序
t:自定义分隔符
k:选择排序列
u:合并相同行
f:忽略大小写

[root@node01 ~]# vi sort.txt
[root@node01 ~]# cat sort.txt
nana 12
apple 1
orange 8
[root@node01 ~]# sort sort.txt
apple 1
nana 12
orange 8
[root@node01 ~]# sort -t' ' -n -k2 sort.txt
apple 1
orange 8
nana 12
[root@node01 ~]# sort -t' ' -n -r -k2 sort.txt
nana 12
orange 8
apple 1

三,wc

[root@node01 ~]# wc sort.txt
 3  6 25 sort.txt
# 3行6个单词25字节
[root@node01 ~]# cat -A sort.txt
nana 12$
apple 1$
orange 8$
# 美元符号也占用
[root@node01 ~]# wc -l sort.txt
3 sort.txt

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值