cut命令用法

涂涂大魔王

于 2025-04-06 23:59:11 发布

阅读量354

点赞数 4

分类专栏： Linux基础文章标签：前端服务器 javascript

本文链接：https://blog.youkuaiyun.com/qq_68736843/article/details/147032718

版权

29 篇文章

订阅专栏

cut 是 Linux/Unix 系统中一个用于按列提取文本内容的命令，常用于处理结构化文本（如 CSV、日志、配置文件等）。它通过分隔符、字符位置或字节位置来切割文本，提取指定部分。

假设文件 data.csv 内容为：

Name,Age,City
Alice,25,Beijing
Bob,30,Shanghai

提取第 2 和 3 列（年龄和城市）：

cut -d ',' -f 2,3 data.csv

输出：

Age,City
25,Beijing
30,Shanghai

假设文件 text.txt 内容为：

ABCDEFGHIJKLMN

提取 /etc/passwd 中的用户名（第 1 列，冒号分隔）：
```
cut -d ':' -f 1 /etc/passwd
```
输出：
```
root
daemon
bin
...（系统用户列表）
```

分隔符与字段：
- 默认分隔符是制表符，需用 -d 指定其他字符（如 -d ':'）。
- 如果字段包含分隔符本身（如 "Hello,World"），cut 无法直接处理，需改用 awk 或手动处理。
多字节字符问题：
- -c 按字符位置切割，适用于 UTF-8 文本。
- -b 按字节切割，处理非 ASCII 字符（如中文）时可能截断乱码。
与 awk 的区别：
- cut 更简单高效，适合固定分隔符的简单场景。
- awk 支持正则表达式分隔符、复杂逻辑，适合灵活处理文本。

提取日志中的时间戳（假设时间在第 1-15 个字符）：
```
cat app.log | cut -c 1-15
```
提取 IP 地址（假设 IP 是第 2 列，空格分隔）：
```
echo "192.168.1.1 404 GET /api" | cut -d ' ' -f 1
```
反向提取（排除第 2 列）：
```
cut -d ',' -f 2 --complement data.csv
```