[AWK]使用AWK进行分割字符串以及截取字符串

本文介绍如何利用awk与cut命令来实现字符串的分割、截取等操作,包括使用split函数处理复杂字符串结构,以及通过cut命令指定字符范围。这些技巧对于日常的数据处理和脚本编写非常实用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如何split当前的字符串,用$0,例如:

cat num.2012032911 | awk '{print $2}' | awk '{split($0,b,".");print b[2]}' | cut -c 3-
获取第二列,例如第二列是com.sb3456.you那么在split当前的这个字符串获得sb3456,最后截取sb3456字符串从第3个字符到最后的字符结果为456


b="c,d,e,f,g"
echo | awk '{split("'${b}'", array, ",");print array[1]}'
c

echo $b | cut -d "," -f2
d

其中-d代表用什么进行分割,-f2代表要第2个结果

另外还有一个常用的参数是-c,用法为 -cx-y 这个意思是取得第x至第y个字符串
echo “abcdefg” | cut -c3-6 输出为 def


格式化列

column –t 不过似乎对tab 和空格混合的情况无法处理



string=/home/bozo/daily-journal.txt



截取指定字符串

echo | awk '{print substr("'${string}'",2,4)}'

// 从第2个字符开始获取4个字符 结果为:home



计算字符串长度

echo | awk '{print length("'${string}'")}'

// 结果为: 29



字符串大小写转换

echo | awk '{ print toupper("test"), tolower("TEST") }'

结果为: TEST test
在 Linux 的 `awk` 命令中,`print` 可以用于截取字符串并输出。`awk` 提供了强大的文本处理功能,可以通过正则表达式、字段分割等方式实现字符串截取。 以下是一个详细的解决方案和代码示例。 --- ### 示例 1:按字段截取字符串 假设我们有一个文件 `data.txt`,内容如下: ``` Alice:25:New York Bob:30:Los Angeles Charlie:35:Chicago ``` #### 需求: 从每一行中提取名字(第一个字段)和年龄(第二个字段)。 #### 代码示例: ```bash awk -F &#39;:&#39; &#39;{print $1, $2}&#39; data.txt ``` #### 解释: - `-F &#39;:&#39;`:指定字段分隔符为 `:`。 - `$1` 和 `$2`:分别表示第一列和第二列。 - `print $1, $2`:输出第一列和第二列,中间用空格分隔。 #### 输出结果: ``` Alice 25 Bob 30 Charlie 35 ``` --- ### 示例 2:使用正则表达式截取字符串 假设我们有一行字符串: ``` The quick brown fox jumps over the lazy dog. ``` #### 需求: 提取单词 `fox`。 #### 代码示例: ```bash echo "The quick brown fox jumps over the lazy dog." | awk &#39;{for(i=1;i<=NF;i++) if($i ~ /fox/) print $i}&#39; ``` #### 解释: - `NF`:表示当前行的字段总数。 - `for(i=1;i<=NF;i++)`:遍历每一列。 - `$i ~ /fox/`:检查当前列是否匹配正则表达式 `fox`。 - `print $i`:输出匹配的字段。 #### 输出结果: ``` fox ``` --- ### 示例 3截取固定位置的子字符串 假设我们有一行字符串: ``` HelloWorld123 ``` #### 需求: 提取从第6个字符开始的5个字符(即 `World`)。 #### 代码示例: ```bash echo "HelloWorld123" | awk &#39;{print substr($0, 6, 5)}&#39; ``` #### 解释: - `substr($0, 6, 5)`:从第6个字符开始提取长度为5的子字符串。 - `$0`:表示整行内容。 - `6`:起始位置(从1开始计数)。 - `5`:提取的字符长度。 #### 输出结果: ``` World ``` --- ### 示例 4:结合条件过滤并截取字符串 假设我们有一个文件 `log.txt`,内容如下: ``` INFO:2023-10-01:User logged in ERROR:2023-10-01:Failed to connect database WARNING:2023-10-01:Disk space low ``` #### 需求: 仅提取包含 `ERROR` 的行,并输出错误信息部分。 #### 代码示例: ```bash awk -F &#39;:&#39; &#39;/ERROR/ {print $3}&#39; log.txt ``` #### 解释: - `/ERROR/`:匹配包含 `ERROR` 的行。 - `$3`:提取第三列(错误信息部分)。 #### 输出结果: ``` Failed to connect database ``` --- ### 总结 通过 `awk` 的 `print` 命令,可以灵活地截取字符串。无论是按字段分割使用正则表达式匹配,还是提取固定位置的子字符串,都可以轻松实现。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值