用扒站工具teleport扒下来的网站会带有很多的没用的标签,手动删除很麻烦,用正则表达式可以很快的进行删除。
操作如下
如图:输入
href="javascript:if\([^"]*" 匹配上然后replace all 图中Regex 必须要勾选上
tppabs 操作同上:
输入 tppabs="h[^"]*"
这个比手动删除快很多,我用的是Idea编辑器
本文介绍了一种利用正则表达式快速清除HTML中无用标签的方法,通过具体示例展示了如何设置匹配规则并使用替换功能来提高效率。
用扒站工具teleport扒下来的网站会带有很多的没用的标签,手动删除很麻烦,用正则表达式可以很快的进行删除。
操作如下
如图:输入
tppabs 操作同上:
输入 tppabs="h[^"]*"
这个比手动删除快很多,我用的是Idea编辑器

被折叠的 条评论
为什么被折叠?