贪心与懒惰量词重复操作问题

最新推荐文章于 2023-05-15 14:58:54 发布

Kaiwii

最新推荐文章于 2023-05-15 14:58:54 发布

阅读量1.4k

点赞数

分类专栏：正则表达式（regular expression）文章标签： regex

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Kaiwii/article/details/6734367

版权

正则表达式（regular expression）专栏收录该内容

7 篇文章

订阅专栏

默认情况下，所有量词都是贪心（greddy）的：就是说会尽可能多地匹配。而懒惰就刚刚相反。但是，可以通过在量词后面添加一个“？”，那么新组合成的量词将使懒惰的。

比如说，量词“*”是贪心的，但是量词组合“*？”却是懒惰的。

效用上他们的区别在于：惰性的量词"*"，每次只会前进一个字符，并且每次都会检查是否匹配下一个标记。

举个经典的例子，说一下吧：

regex_1:<a>.*?</a> 与regex_2:<a>.*</a>

test文本：

<a>who r u?</a><a>I am Kaiwii</a>

regex_1匹配的内容为：

regex_2匹配的内容为：

分析：

两个regex的共同部分在于：“.*”。“.”匹配单个字符，而量词“*”就表示前面的部分-“.”可以出现任意多次，既可以匹配任意长的内容。

两个regex的区别在于：最后有否量词“？”。

因为，量词“？”是懒惰的。所谓的懒惰就是说，在识别过程中，每次用“.*”向前推进一个字符匹配新的内容的时候，就马上使用懒惰量词“？”后面的字符“<”匹配下一位的内容，如果成功的话，就继续使用“<”之后的字符"/"来识别；如果不成功就反过来使用“.*?”来匹配新的内容。就好像，时刻有一个哨兵指针指向下一位，并尝试匹配下一位的字符！！！！

而，如果没有“？”就变成“.*”。量词“*”是贪心的，只要它开始，就会一条黑路走到尾。最后才用它后一个字符“<”进行识别。很明显这样做是徒然的。必然需要不断回溯（吐出“.*”已经匹配的内容），来用"<"识别直到可以完全使用“</a>”才结束。所以易见得不到第一个"</a>",就已经结束回溯了！

博客等级

码龄17年

94
原创

441
点赞

485
收藏

616
粉丝

关注

私信

热门文章

分类专栏

最新评论

补码综合理解
做而论道_CS: －－－－－－－－－－－－－－　求补码，是极其简单的事！－－－－－－－－－－－－－－真值机器数符号位原码反码取反加一符号位不变模同余 ... 这些，都是毫无用处的。即使，你把专家编造的这些谎话，都背下来了，你也不会理解：“减法怎么就变成加法啦？”。专家写的这些，明显就是【拿个鞋拔子当做玉如意】。假货，不仅仅在古董行业才有啊！
补码综合理解
做而论道_CS: －－【划重点】－－－－－－－－－－实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。 0 ＋ X，不就是 X 吗？即，正数的补码，就是 X 本身！－－－－－－－－－－－－－－－－－
补码综合理解
做而论道_CS: 学习计算机，千万不要学习原码和反码呀！原码反码，都是虚构的。实际上，它们，都是不存在的。学习计算机，首先，要认识到两个概念： 1. 计算机每次计算，位数，是固定的。　八位机，每次，就计算机八个位。 2. 计算机中，只有加法器。　减法（或负数），都必须用加法实现。那么，45－45 = 0，计算机怎么算呢？八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！
补码综合理解
做而论道_CS: 在计算机系统中，数值，一律采用补码表示和存储。数值和补码，直接转换就行了。根本就用不着原码和反码。
补码综合理解
做而论道_CS: 在计算机系统中，数值，一律采用补码表示和存储。在计算机中，并没有原码和反码。没有原码反码，怎么做 “取反加一”？取反加一，怎么就 “把减法变成加法” 了？理论何在？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。