Linux下cut命令用法详解

本文详细介绍了 Linux 下 cut 命令的使用方法,包括如何从文本中提取特定的字节、字符或字段。通过多个实际案例,展示了如何灵活运用 cut 命令进行文本处理。
 

Linuxcut命令用法详解

                                                           原创:frozen_sucker(冰棍)

有时我们经常会遇到这样一些问题:有一页电话号码薄,上面按顺序规则地写着人名、家庭住址、电话、备注等,此时我们只想取出所有人的名字和其对应的电话号码,你有几种方法可以实现呢?

以下内容欢迎转载,但请保留作者名号及出处,谢谢!

原创:frozen_sucker

链接:http://blog.youkuaiyun.com/Frozen_fish/archive/2008/04/08/2260804.aspx

 

确实这种纵向定位的方式用常规办法难以实现,这时,cut就可以大显身手了。

 

 

What’s cut?

子曰:cut命令可以从一个文本文件或者文本流中提取文本列。

 

 

命令用法:

       cut -b list [-n] [file ...]

       cut -c list [file ...]

       cut -f list [-d delim][-s][file ...]

 

 

l      上面的-b-c-f分别表示字节、字符、字段(即bytecharacterfield);

l      list表示-b-c-f操作范围,-n常常表示具体数字;

l      file表示的自然是要操作的文本文件的名称;

l      delim(英文全写:delimiter)表示分隔符,默认情况下为TAB

l      -s表示不包括那些不含分隔符的行(这样有利于去掉注释和标题)

 

 

上面三种方式中,表示从指定的范围中提取字节(-b)、或字符(-c)、或字段(-f)。

 

 

范围的表示方法:

N

只有第N项

N-

从第N项一直到行尾

N-M

从第N项到第M项(包括M)

-M

从一行的开始到第M项(包括M)

-

从一行的开始到结束的所有项

 

 

下面是实例,先以较简单的“命令用法”中提及的第二条开始讲起:

interrupts文件中的字符排列非常齐整,正适合我们切豆腐。

 

 

但这里我们只对两个数字列感兴趣,用法如下:

 

 

里面还有一些不需要的内容,精减一下:

关于正则表达式的使用,请自行查阅相关资料。

 

 

合到一起:

哇,果然够帅!!

 

 

不相邻列的截选又应该如何做呢?

这种方式需要事先确定占多少个字符位置,不仅麻烦,而且容易出错。

 

 

下面的问题该怎么去做?

 

 

这就是第二讲:使用cut –f提取文本中的字段。

 

cut –c主要是用来在固定字符位置或个数的文本文件中提取,对于上面的例子就显得无能为力了。仔细观察,发现passwd文件有个规律,就是以冒号来区分不同的段的文本,于是。。。

怎么样,好玩吧~!

 

 

继续,创建一个文本文件,名为a.txt,名字有点土,凑合着用吧。

A1B1C1所代表的行字符之间均以TAB分隔,D1却是以空格来分开的。

 

 

看到-s的作用了吗?(因为第一行不含有任何TAB字符,所以直接被剔除了),而最后一行(D1),是以空格区分间距,所以也不合要求。

 

 

多了个参数,这个我没讲,只要你的智商比范伟高一点点,就肯定能猜出来啦。^_^

 

 

好了,下面是最后一个用法的讲解了:

 

 

因为虚拟终端下无法显示汉字,所以我只好回到图形下,截图就成这个白不垃圾的样子啦,忍忍吧,就快讲完了。

   

在这个文件中,每个汉字都是用半角空格分隔的。

 

 

 

 

cut –c已经成功了,下面试试cut –b怎么样?

没有反应,why

   

原因在于汉字本身是双字节的,cut –c把汉字“我”当成一个字符来处理,而cut –b是以字节来处理,把“我”拆成了两个字节,结果是字符被“切成两半”,因此无法正常显示。

 

 

原因找到了,要怎么办才好呢?

 

 

!!!搞定。

 

 

OKall is done。就到这里吧,休息,休息。。。

### Linux 中 `cut` 命令的详细用法 `cut` 是一种强大的文本处理工具,主要用于从文件或标准输入中提取特定部分的内容。它可以按字节、字符或字段进行切割,并将结果输出到标准输出设备。以下是关于 `cut` 命令的功能、基本语法及其选项的详细介绍。 #### 功能概述 `cut` 命令的主要功能是从每一行中提取指定的部分。它适用于各种结构化数据的处理,例如 CSV 文件、日志文件以及其他格式化的文本文件[^1]。 --- #### 基本语法 ```bash cut [选项] [文件...] ``` --- #### 常见选项及示例 ##### 1. `-b, --bytes=LIST` 按照字节范围提取内容。 - **说明**: 提取指定字节位置上的内容。 - **示例**: ```bash echo "abcdef" | cut -b 1-3 # 输出: abc ``` ##### 2. `-c, --characters=LIST` 按照字符范围提取内容。 - **说明**: 提取指定字符位置上的内容。对于包含多字节字符(如中文)的数据,推荐使用此选项[^3]。 - **示例**: ```bash echo "星号测试" | cut -c 1-3 # 输出: 星号测 ``` ##### 3. `-d, --delimiter=DELIM` 指定字段分隔符。 - **说明**: 定义字段之间的分隔符,默认为空格。 - **示例**: ```bash echo "one:two:three" | cut -d ':' -f 2 # 输出: two ``` ##### 4. `-f, --fields=LIST` 按照字段提取内容。 - **说明**: 结合 `-d` 选项一起使用,提取指定字段的内容。 - **示例**: ```bash echo "one:two:three" | cut -d ':' -f 1,3 # 输出: one:three ``` ##### 5. `--complement` 选择除指定范围之外的所有内容。 - **说明**: 反选操作,提取不在指定范围内的一部分。 - **示例**: ```bash echo "abcdef" | cut -c 1,2 --complement # 输出: cdef ``` ##### 6. `-s, --only-delimited` 仅显示包含分隔符的行。 - **说明**: 如果某一行不包含指定的分隔符,则不会被输出。 - **示例**: ```bash echo -e "one\ntwo:two" | cut -d ':' -f 2 -s # 输出: two ``` ##### 7. `--output-delimiter=STRING` 指定输出分隔符。 - **说明**: 修改默认的输出分隔符。 - **示例**: ```bash echo "one:two:three" | cut -d ':' -f 1,2 --output-delimiter=',' # 输出: one,two ``` --- #### 实际应用案例 ##### 示例 1: 提取系统 PATH 环境变量中的部分内容 假设需要获取 `$PATH` 环境变量中第一个冒号之后的所有路径: ```bash echo $PATH | cut -d':' -f 2- # 输出: /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin (假设计算机环境如此) ``` ##### 示例 2: 处理包含中文的文本 当文本中含有中文时,建议使用 `-c` 而非 `-b` 进行切割,因为中文属于多字节字符[^3]。 ```bash cat file_with_chinese.txt | cut -c 1-10 # 正确提取前十个字符 ``` ##### 示例 3: 组合多个命令筛选目标信息 假如有一个记录用户名年龄的日志文件 `log.txt`,其格式为 `name age`,现在想提取所有名字为 “guan” 的用户的姓名: ```bash cat log.txt | grep "guan" | cut -d ' ' -f 1 # 输出: guan ``` --- #### 缺陷与不足 尽管 `cut` 是一个非常实用的工具,但它也存在一些局限性: 1. 对复杂数据结构的支持有限,尤其是嵌套或多层结构的数据。 2. 在处理超大文件时可能效率较低。 3. 需要明确知道数据的分隔符或固定宽度,否则难以正确解析[^3]。 --- ### 总结 `cut` 命令提供了灵活的方式用于提取文本的不同部分,无论是简单的字符串还是复杂的结构化数据都能胜任。掌握它的常用选项能够显著提高日常工作中对文本数据的操作能力。 ---
评论 15
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值