Python 版本为2.7.13 IDE工具Pycharm 爬取网站:腾牛网
腾牛网属于一个比较简单的网站,就是单纯的查看网站源码,再根据网站的基本信息,提取gif表情包的下载地址,然后按各个主体分类保存
以下为效果图


1.首先,打开腾牛网站
http://www.qqtn.com/bq/dtbq_1.html
爬取内容为动态表情列表里面的表情包
2.右键查看网页源码
很明显要爬取的内容在一个<div class="g-list-left m-fl">中,直接用geta()函数,利用正则表达式获取,然后再获取每一条url