
网络爬虫
A洛
每一个承诺的背后都意味着实力与责任
。微信:AluoRick
展开
-
Python 抓取网页数据乱码时, 设置编码
Python 抓取网页数据乱码时, 设置编码 headers = {'referer': referer, 'user-agent': user_agent} r = requests.get(url, headers=headers, proxies=proxies) # print(r.encoding) # gb2312 r.encoding = 'GBK'...原创 2019-11-05 11:21:52 · 431 阅读 · 0 评论 -
Python 解析html BeautifulSoup
Python 解析html BeautifulSoup ,使用选择器根据class获取数据 rand_ip = 'rand ip' proxies = {"https": rand_ip, } referer = "https://sz.meituan.com/xuexipeixun/" + category_id + "/" url = "https://sz...原创 2019-11-05 11:17:20 · 178 阅读 · 0 评论 -
手机app数据抓取之fiddler配置
1 配置fiddlerFiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的“进出”Fiddler的数据(指cookie,html,js,css等文件)。 Fiddler 要比其他的网络调试器要更加简单,因为它不仅仅暴露http通讯还提供了一个用户友好的格式。由于手机app的通讯请求基本都是https的, 所以我们现在先在fi...原创 2019-09-29 11:06:04 · 216 阅读 · 0 评论