SGMLparser处理过程:
so simple
begin, like unknown_starttag(self,tag,attrs),then handle_data(self,text)
then cursive
需要注意:网页只解析一遍,标签有许多,所以会出现比较多的同类结果
本文介绍了SGMLparser的处理过程,包括未知起始标签的处理方法及文本数据的解析流程。需要注意的是,网页只被解析一次,因此同一类结果可能会出现多次。
SGMLparser处理过程:
so simple
begin, like unknown_starttag(self,tag,attrs),then handle_data(self,text)
then cursive
需要注意:网页只解析一遍,标签有许多,所以会出现比较多的同类结果

被折叠的 条评论
为什么被折叠?