这一系列分享我在写爬虫过程中遇到的奇葩事
这次遇到的是在爬html文件时,发现爬下来的标签内容变了,举个例子
<a class='f1 ersw'>
有可能变成:
<a class='f1'>
再看实际的,比如站长之家的whois查询
爬下来,却是这样的
后面的clearfix没有了!
这可能是网络商的策略,以后遇到clearfix的标签要小心了
<a class='f1 ersw'>
有可能变成:
<a class='f1'>