http.*

这样匹配到的就是我们要的内容
取反正则:^((?!要取反的正则表达式).)*$
取反:^((?!http.).)$

这样匹配到的就是我们不要的内容
提取域名
/[(http|ftp|https):\/\/]?([\w_-]+(?:(?:\.[\w_-]+)+))([\w.,@?^=%&:\/~+#-]*[\w@?^=%&\/~+#-])/i

这个效果不行
目前比较好的如下:
提取http和https的域名(注意以下虽然写着http的,但是http和https都可以提取到)
(?<=http://).+?(?=/)

发现一点问题

可以看到漏掉了一部分域名,是因为后面没有斜杠结尾,那么我们使用时候先全部后面加上/在进行正则匹配
本文讨论了在IT技术背景下,如何改进正则表达式来更有效地从URL中提取http和https的域名,特别提到处理漏掉的结尾斜杠问题的方法。
4037

被折叠的 条评论
为什么被折叠?



