网络安全技术:HTML解析与Burp扩展实战
1. HTML解析基础
在某些情况下,可能无法安装 requests 和 lxml 包,此时可以使用Python标准库中的 urllib 进行HTTP请求,并使用 html.parser.HTMLParser 来解析内容。使用 HTMLParser 类时,有三个主要方法可以实现:
- handle_starttag :遇到HTML开始标签时调用。
- handle_endtag :遇到HTML结束标签时调用。
- handle_data :遇到标签之间的原始文本时调用。
这些方法的函数原型如下:
handle_starttag(self, tag, attributes)
handle_endttag(self, tag)
handle_data(self, data)
示例:
<title>Python rocks!</title>
-
handle_starttag:tag变量为"title"
超级会员免费看
订阅专栏 解锁全文
1514

被折叠的 条评论
为什么被折叠?



