以前涉及到python定向蜘蛛均是针对网页版,前天有一版需要与手机上访问一致(注:同一url地址在手机上和PC上搜索是不一样的内容),所以需要将蜘蛛的改成手机的
其实只是设置user-agent即可,也没那么麻烦的
import sys, urllib2
import urllib
from urllib2 import Request, urlopen,URLError, HTTPError
from urllib import quote
def fetchurl(url):
req=urllib2.Request(url,None)
req.add_header("User-Agent","Mozilla/5.0 (Linux;U;Android 2.3;en-us;Nexus One Build/FRF91)AppleWebKit/999+(KHTML, like Gecko)Version/4.0 Mobile Safari/999.9")
f=urllib2.urlopen(req)
return f.read()
def test():
try:
print fetch("http://blog.youkuaiyun.com/timegoesby001")
except Exception,e:
print e
if __name__=="__main__":
test()

本文介绍了一种针对手机端网页进行爬取的方法。通过设置特定的User-Agent,使爬虫能够获取到与手机浏览器相同的页面内容。文章提供了一个Python脚本示例,展示了如何实现这一过程。
839

被折叠的 条评论
为什么被折叠?



