《wc》-linux命令五分钟系列之十七

本文详细介绍了Linux系统中的wc命令,包括其基本功能、参数及其在不同场景下的使用方法,通过具体示例展示了如何计算文件的字节数、字符数、行数、最长行长度及字数。同时解释了不同选项对处理文本文件时的差异,特别关注了对中文字符处理的特性,以及制表符在不同参数下的表现。
《wc》-linux命令五分钟系列之十七

本原创文章属于《Linux大棚》博客,博客地址为http://roclinux.cn。文章作者为rocrocket。
为了防止某些网站的恶性转载,特在每篇文章前加入此信息,还望读者体谅。

===

[正文开始]

今天的内容是Linux的wc命令,这个名字很好记,因为什么,你也知道。

这个命令的功能也很好记,因为它功能很有限:

wc -c filename:显示一个文件的字节数

 

wc -m filename:显示一个文件的字符数

wc -l filename:显示一个文件的行数

wc -L filename:显示一个文件中的最长行的长度

wc -w filename:显示一个文件的字数

[rocrocket@rocrocket programming]$ cat wc1.txt
1 2 34 5 你好 [rocrocket@rocrocket programming]$ wc -c wc1.txt 16 wc1.txt [rocrocket@rocrocket programming]$ wc -m wc1.txt 12 wc1.txt [rocrocket@rocrocket programming]$ wc -l wc1.txt 3 wc1.txt [rocrocket@rocrocket programming]$ wc -L wc1.txt 4 wc1.txt [rocrocket@rocrocket programming]$ wc -w wc1.txt 5 wc1.txt

每行结尾的换行符也算一个字符,空格也算一个字符。

由于采用UTF-8编码,所以一个汉字在这里被转换为3字节,所以wc -c显示的结果是16,即“第一行的4个字节+第二行的5个字节+第三行的7个字节”=4+5+7=16。

而当使用-m选项时,一个汉字就作为一个字符计算,所以是4+5+3=12。

当使用-L时,是给出最长行的长度,第二行最长,有4个字符长。(显然是不把换行符计算在内)

使用-w是计算字数,一个字是一个word,所以“34”表示一个word,一个“你好”表示一个word,因此2+2+1=5。

插孔说说tab制表符,这个符号比较特殊,当使用-L时,制表符算7个字符(这要依据一个制表符的长度而定,在我的系统中一个制表符算7个空格长 度,)。而当使用-w时,制表符和空格没有两样,都作为字的间隔来看待。当用-c时,一个制表符也就算一个字符(我认为这里应该写字节而不是字符,-c求得是字节数),因为它的确就只是一个字符而已。

如果你直接执行wc wc1.txt,则显示:

[rocrocket@rocrocket programming]$ wc wc1.txt
5 16 wc1.txt

输出信息依次是:行数 字数 字节数 文件名称。

转载于:https://www.cnblogs.com/qionghua520/p/4383013.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值