linux --- shell --- cut 妙用

本文详细介绍了Linux下cut命令的使用方法,包括如何通过字节、字符和字段进行文本内容的提取,提供了丰富的实例帮助理解。
1. cut命令用法如下:  (转)

cut -b list [-n] [file ...]

cut -c list [file ...]

cut -f list [-d delim][-s][file ...]


 

     上面的-b、-c、-f分别表示字节、字符、字段(即byte、character、field);

     list表示-b、-c、-f操作范围,-n常常表示具体数字;

     file表示的自然是要操作的文本文件的名称;

     delim(英文全写:delimiter)表示分隔符,默认情况下为TAB;

     -s表示不包括那些不含分隔符的行(这样有利于去掉注释和标题)


上面三种方式中,表示从指定的范围中提取字节(-b)、或字符(-c)、或字段(-f)。


范围的表示方法:

 

N

只有第N项

N-

从第N项一直到行尾

N-M

从第N项到第M项(包括M)

-M

从一行的开始到第M项(包括M)

-

从一行的开始到结束的所有项



 

下面是实例,先以较简单的“命令用法”中提及的第二条开始讲起:

 

 

interrupts文件中的字符排列非常齐整,正适合我们切豆腐。

 

 

 

但这里我们只对两个数字列感兴趣,用法如下:

 

 

 

 

里面还有一些不需要的内容,精减一下:

关于正则表达式的使用,请自行查阅相关资料。

 

 

 

 

合到一起:

cut -c1-15  从第1列到15列

哇,果然够帅!!

 

 

不相邻列的截选又应该如何做呢?

cut -c1-4,34-    从1-4, 34到结束

 

这种方式需要事先确定占多少个字符位置,不仅麻烦,而且容易出错。

 

 

下面的问题该怎么去做?

 

 

 

 

这就是第二讲:使用cut –f提取文本中的字段。

 

cut –c主要是用来在固定字符位置或个数的文本文件中提取,对于上面的例子就显得无能为力了。仔细观察,发现passwd文件有个规律,就是以冒号来区分不同的段的文本,于是。。。


cut -f1 -d':' 

 

 

怎么样,好玩吧~!

 

 

继续,创建一个文本文件,名为a.txt,名字有点土,凑合着用吧。

 

A1、B1、C1所代表的行字符之间均以TAB分隔,D1却是以空格来分开的。

 

 

 

 

 

看到-s的作用了吗?(因为第一行不含有任何TAB字符,所以直接被剔除了),而最后一行(即D1行),是以空格区分间距,所以也不合要求。

 

 

 

 

多了个参数,这个我没讲,只要你的智商比范伟高一点点,就肯定能猜出来啦。^_^

 

 

 

好了,下面是最后一个用法的讲解了:

 

 

 

因为虚拟终端下无法显示汉字,所以我只好回到图形下,截图就成这个白不垃圾的样子啦,忍忍吧,就快讲完了。

  

在这个文件中,每个汉字都是用半角空格分隔的。

 

 

 

 

 

 

用cut –c已经成功了,下面试试cut –b怎么样?

没有反应,why?

 

   

原因在于汉字本身是双字节的,cut –c把汉字“我”当成一个字符来处理,而cut –b是以字节来处理,把“我”拆成了两个字节,结果是字符被“切成两半”,因此无法正常显示。

 

 

原因找到了,要怎么办才好呢?

 

 

 

耶!!!搞定。

 

<think> 我们正在讨论的是C Shell中的`cut`命令,特别是`-d`选项的用法。虽然用户的问题提到了C Shell,但需要注意的是,`cut`命令本身是一个独立的Unix/Linux工具,它在不同的shell(如bash, csh, zsh)中用法相同。因此,在C Shell中使用`cut -d`与其他shell没有区别。 根据引用[2]中的例子: ``` # cut -d: -f1 1.txt 以:冒号分割,截取第1列内容 # cut -d: -f1,6,7 1.txt 以:冒号分割,截取第1,6,7列内容 ``` `-d`选项用于指定字段分隔符(delimiter),后面紧跟分隔符(注意:在csh中,如果分隔符是特殊字符,可能需要用引号括起来)。然后使用`-f`选项指定要提取的字段(列)。 在引用[3]中,有一个例子: ``` echo "CPU: busy 14% (system=10% user=3% nice=0% idle=85%)" | cut -d \% -f 1 ``` 这里,`-d \%`指定分隔符为百分号(%),注意在csh中,%是特殊字符(表示作业控制),所以这里用反斜杠转义。但实际上,在csh中,为了避免歧义,我们通常将分隔符用单引号或双引号括起来。 因此,在C Shell中使用`cut -d`的一般语法为: ```bash cut -d'分隔符' -f 字段列表 [文件] ``` 注意事项: 1. 分隔符可以是单个字符,不能是多个字符(即不支持多字符分隔符)。 2. 如果分隔符是空白(空格或制表符),则可以使用`-d' '`,但注意,默认情况下,连续空白被视为一个分隔符?实际上,`cut`命令不会将连续的分隔符合并为一个,而是会产生空字段。如果需要处理连续空白,考虑使用`awk`。 3. 如果字段列表中指定了多个字段,用逗号分隔,如`-f1,2,5`。 示例: 假设我们有一个文件`data.txt`,内容如下: ``` apple:10:fruit banana:20:fruit carrot:5:vegetable ``` - 提取第一列: ```bash cut -d':' -f1 data.txt ``` 输出: ``` apple banana carrot ``` - 提取第二列和第三列: ```bash cut -d':' -f2,3 data.txt ``` 输出: ``` 10:fruit 20:fruit 5:vegetable ``` - 如果分隔符是空格,比如文件内容为: ``` apple 10 fruit banana 20 fruit carrot 5 vegetable ``` 则命令为: ```bash cut -d' ' -f1,3 data.txt ``` 注意:这里每个空格都是一个分隔符,所以第二列是数字,第三列是类型。但是,如果字段之间有多个空格,那么可能会提取到空字段。所以,对于空格分隔的文件,使用`awk`可能更合适。 在C Shell中执行这些命令时,需要注意转义特殊字符。例如,如果要使用`%`作为分隔符(如引用[3]中的例子),可以这样写: ```bash echo "CPU: busy 14% (system=10% user=3% nice=0% idle=85%)" | cut -d'%' -f1 ``` 输出: ``` CPU: busy 14 ``` 另外,引用[1]提到,`cut`命令的`-b`选项(按字节截取)会先将所有的定位进行从小到大的排序,然后再提取。但对于`-d`和`-f`选项,则没有这样的重新排序,因为字段顺序由`-f`参数给出的顺序决定,且输出顺序就是字段在行中出现的顺序。 总结: 在C Shell中,`cut -d`的用法与其他shell一致,但要注意C Shell的特殊字符转义。建议对于分隔符使用引号(单引号或双引号)括起来,以避免shell解释。 最后,生成相关问题: 1. 在C Shell中,如何处理分隔符是空格且字段间有多个空格的情况? 2. 如何使用`cut`命令提取多个不连续的字段? 3. `cut`命令和`awk`在字段提取上有什么主要区别? </think> ### 📌 C Shell 中 `cut -d` 的用法详解 在 C Shell (csh) 中,`cut -d` 用于按指定分隔符切割文本行并提取字段,其核心语法为: ```bash cut -d'分隔符' -f 字段编号 文件名 ``` #### 核心用法示例: 1. **提取单个字段** ```bash # 提取 /etc/passwd 中第 1 列(用户名) cut -d':' -f1 /etc/passwd ``` ```text root bin daemon ... ``` 2. **提取多个字段** ```bash # 提取用户名和家目录(第 1 列和第 6 列) cut -d':' -f1,6 /etc/passwd ``` ```text root:/root bin:/bin ... ``` 3. **提取字段范围** ```bash # 提取第 3 到第 5 列 cut -d':' -f3-5 /etc/passwd ``` #### 💡 关键特性: 1. **分隔符指定 (`-d`)** - 必须用引号包裹分隔符:`-d':'`、`-d';'` - 特殊字符需转义:`-d'\%'`(处理百分比符号)[^3] 2. **字段标识 (`-f`)** | 表达式 | 说明 | 示例 | |------------|----------------------|--------------------| | `-fN` | 提取第 N 列 | `-f3` | | `-fN,M` | 提取多列 | `-f1,5` | | `-fN-M` | 提取连续列范围 | `-f2-4` | | `-f-M` | 从第 1 列到 M 列 | `-f-3` | | `-fN-` | 从第 N 列到最后 | `-f7-` | 3. **管道结合使用** ```bash # 提取进程列表中第 11-14 字节的用户名 ps aux | cut -c11-14 | cut -d'\%' -f1 ``` #### ⚠️ 注意事项: 1. **字段编号从 1 开始** `-f1` 表示第一列,而非 0 2. **分隔符一致性** 若某行缺少分隔符,整行会被视为第 1 列 3. **与字节截取 (`-b`) 区别** `-d` 按分隔符分列,`-b` 按字节位置截取(字节位置会自动排序)[^1] --- ### 📝 综合示例 ```bash # 提取 CSV 文件的第 2 列和第 4 列 (分隔符为逗号) cut -d',' -f2,4 data.csv # 提取日志中的时间戳和状态码 (空格分隔) grep "ERROR" server.log | cut -d' ' -f1,8 ``` --- ### ❓ 相关问题 1. 当分隔符是空格时,如何处理连续多个空格? > 建议先用 `tr -s ' '` 压缩空格: ```bash echo "a b c" | tr -s ' ' | cut -d' ' -f2 ``` 2. 如何提取最后一列? > 使用 `rev` 反转文本配合 `cut`: ```bash echo "1:2:3:4" | rev | cut -d':' -f1 | rev ``` 3. `cut` 和 `awk` 在字段提取上有何区别? > `awk` 支持正则分隔符和条件过滤,功能更强大: ```bash awk -F':' '{print $1,$3}' file ``` 4. 如何用 `cut` 处理含空字段的数据? > 使用 `--output-delimiter` 指定输出分隔符: ```bash cut -d',' -f2 --output-delimiter="|" file.csv ``` > 引用说明: > [^1]: `-b` 选项对字节位置自动排序的特性 > [^2]: `cut -d` 基础字段提取语法 > [^3]: 特殊分隔符的转义处理
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值