python3爬虫系列24之重庆微博地铁客运量爬取和可视化
1.前言
在python3爬虫系列23之selenium+腾讯OCR识别验证码登录微博且抓取数据里面,我们既是又搞selenium自动化,又搞腾讯OCR识别,又搞图片验证码位置截取等等。
接下来,让你看看啥叫吐血。。。。
这里给大家透露小诀窍:
一般做爬虫爬取网站时,首选的都是m站,其次是wap站,最后考虑PC站,因为PC站的各种验证最多。
M站一般是指手机网页端的页面,也就是mobile移动端,移动网页端。电商专业,网络营销推广或移动营销课程中所说的M站,指的是HTML5制作的网页,开发门槛低、兼容性强,占存小,无需安装。
比如 http://m.jd.com 一般来说,一般m站都以m开头后接域名
所以!!!
你看看这个:
https://m.weibo.cn/
2.重庆微博地铁客运量爬虫
m站微博主页,这种大大的摆着。。。<