解析sed -n '/^AAAA/{:a;N;${s/\(.BBBB[^\n]\).*/\1/p};Ta}'

原创于 2015-01-24 14:30:00 发布 · 1.7w 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#sed #解析 #高级

Linux 专栏收录该内容

67 篇文章

订阅专栏

本文详细解析了sed命令在指定文件中查找从'AAAA'到'BBBB'字符串能匹配到的最后一行的所有内容的实现过程，并通过实例演示了命令的执行流程。

个人理解，求真相。

先来看看这个命令吧
sed -n '/^AAAA/{:a;N;${s/\(.*BBBB[^\n]*\).*/\1/p};Ta}' a.txt
他实现的结果是查找一个文件中 AAAA到BBBB字符串能匹配到的最后一行的所有内容

sed -n '/AAAA/{:a;N;${s/\(.*BBBB\)[\n]*.*/\1/p};Ta}'

a.txt 如下：

2012 aaaa

2012 bbbb

2013 cccc

2013 cccc

2014 1111

2014 2222

2014 3333

2015 5555

2015 xxxx

分解如下：

sed -n '/^2012/{

:a

N

${

s/\(.*2014[^\n]*\).*/

\1/p

}

Ta

}

1.首先第一个^2012是要匹配到以2012开头的行（如果字符串有在行中间的情况下^是可以去掉的）我个人觉得去掉效果会更好，已测第一步的作用是让我们后面的命令知道我们已经从哪里开始来执行，当我们第一步找到第一个2012的时候，我后面就可以执行了

2.第一步我们显然匹配到了第一行：2012 aaaa 匹配到之后，我们先跳过:a，最后再说

匹配之后，我们执行了N命令。现在来看N命令的意思

N：追加下一个输入行到读取行的末尾兵加入一个\n 存入缓冲区（pattern apace）

那么现在我们的缓冲区的内容是 2012 aaaa\n2012 bbbb

然后接着往后匹配匹配的是 ${s/\(.*2014[^\n]*\).*/\1/p}

现在来解析这个首先${}是匹配最后一行的内容，也就是说如果缓冲区里最后一行的内容是

${s/\(.*2014[^\n]*\).*/\1/p} 那么这个命令的状态是yes的否则是no 那么这个状态要配合后面的Ta来使用了 $最后一行是不是后面匹配的内容

现在再来说:a Ta 这是一个组合意思是：

先建立一个标签a 如果Ta前面的命令状态是no，也是没匹配到，就返回到标签a处，如果是yes 这个命令就结束打印出缓冲区

继续执行后面的命令,这样就达到了循环的目的。

现在我们来看，刚刚我们的缓冲区是2012 aaaa\n2012 bbbb后面的匹配当然就是匹配我们的缓冲区的最后一行数据，现在最后一行为2012 bbbb 的 ${s/\(.*2014[^\n]*\).*/\1/p} 显然不是那么他的状态就是no

我们就又跳到了a 接着执行N，现在我们的缓冲区是2012 aaaa\n2012 bbbb 执行N后先加上\n然后加上了下一行 2012 aaaa\n2012 bbbb\n\2013 cccc

现在我们的缓冲区就是 2012 aaaa\n2012 bbbb\n\2013 cccc 然后执行后面这一行是否匹配到了 ${s/\(.*2014[^\n]*\).*/\1/p} 显然没有一直往下

我们最后到了2014 1111 行在这一行我们的缓冲区是2012 aaaa\n2012 bbbb\n\2013

cccc\n....2014 1111

这时我们缓冲区的最后一行是2014 1111

他的前面是任意多的任意字符 ——符合

后面是任意多的非换行符 —— 符合

命令状态 yes

Ta循环结束输出缓冲区内容清空缓冲区

2012 aaaa

2012 bbbb

2013 cccc

2013 cccc

2014 1111

虽然循环结束但是匹配没有结束，seb依然要对下面的内容进行遍历

现在我们到了2014 2222 先执行了N 现在缓冲区为2014 2222\n2014 3333

然后匹配 ${s/\(.*2014[^\n]*\).*/\1/p} 符合状态yes 循环结束

输出缓冲区2014 2222\n2014 3333

为什么我们匹配到2013 cccc的时候就跳过了2014 1111 直接到了2014 2222

因为我们的2014 1111 已经被N所改变了结构成为了上一行的内容行号也跟着改变这是一点比较抽象

然后我们接着匹配到了2015 5555 执行N 缓冲区为2015 5555\n2015 xxxx

匹配${s/\(.*2014[^\n]*\).*/\1/p} 不成立状态no 执行Ta循环到a 继续执行N... 后面已经没有2014了所以命令状态一直为no 知道结束都不会输出缓冲区了
其实这个命令的^AAAA可以用AAAA来代替更加好用已测

大致就是这么个意思不知道我的理解是否正确，如有错误，求指正。真心佩服原创的人。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。