
正则表达式
jiangtaigong
这个作者很懒,什么都没留下…
展开
-
提取html中的超链接地址
正则表达式不易调试,写起来有趣,读起来烦。就像perl一样! 没怎么测试,不过应该凑合能用。 主角登场: <a.*?\s+href=\s*"?([^\s">]+)[\s">] 其中[^\s">]最好替换成url字符集,可以防止意外情况出现。 使用的时候要忽略大小写...2008-11-03 18:57:38 · 384 阅读 · 0 评论 -
lookahead和positive lookbehind
下了一本txt格式的小说,发现里面很多不是段落结束的地方竟然用了回车,看着很不爽,立刻祭起Python,想把里面所有的不该出现的回车消除掉。读取文件内容后,顺手写下re.sub(r'[^\n]\n[^\n]', '', content),很简单的一个正则,就是找出单个的换行符并且替换掉。用Java习惯了,因为Java的正则表达式没有lookahead等功能,我也很少时候。做完了想起python是支...2009-05-18 21:54:45 · 235 阅读 · 0 评论 -
各种工具之正则表达式语法比较
转自http://blog.chinaunix.net/u/634/showart.php?id=2466,觉得太好,情不自禁的转过来了 以perl的正则为基准,不同的用法以粉红色标出。 grep 2.5.1 egrep 2.5.1 sed 3.02sed 4.07 awk 3.1.1 perl 5.8.0 vim 6.1 JavaScript ?? 转义 \ \...原创 2010-05-24 19:18:56 · 137 阅读 · 0 评论