
urllib
文章平均质量分 68
matrix_neo_nku
这个作者很懒,什么都没留下…
展开
-
【项目实战】利用urllib实现多线程爬取糗事百科段子
import threadingimport urllib.requestimport reimport ssl#把ssl设置为未验证,ssl._create_default_https_context = ssl._create_unverified_context#给opener添加header,伪装成浏览器header = ("User-Agent","Mozilla/5.原创 2018-01-24 20:02:37 · 517 阅读 · 0 评论 -
【项目实战】使用urllib下载淘宝搜索到的图片
下载搜索的图片,主要难点在与淘宝页面中复杂的图片地址,在源码中查找图片地址时,建议使用火狐浏览器。import urllib.requestimport reimport ssl#全局取消证书验证ssl._create_default_https_context = ssl._create_unverified_context#设置淘宝搜索的关键词keyword = url原创 2018-01-21 21:43:56 · 307 阅读 · 0 评论 -
【项目实战】使用urllib爬取虎扑首页的所有新闻
虎扑是我从高中就开始关注的网站,学习了网络爬虫后,写一个小程序来爬取虎扑首页的所有新闻,其中使用了urllib,正则表达式。防止爬虫被识别出来,将爬虫伪装成浏览器,下面直接上代码。 import urllib.requestimport reimport ssl#全局取消证书验证,避免SSL: CERTIFICATE_VERIFY_FAILEDssl._create_defau原创 2018-01-21 17:35:27 · 424 阅读 · 0 评论