- 博客(4)
- 收藏
- 关注
原创 CSS知识点
路径分 绝对目录和相对目录路径分 网络目录和硬盘物理路径我们普通网站在做链接都是相对的网络路径 同级别,直接写文件名 上级别,用../文件名 下级别,用目录名/文件名...
2018-05-08 22:43:16
145
原创 协程爬取整站豆瓣网络
爬取豆瓣网络思路:从标签页进入,提取所有标签URL进入每个标签页,提取所有列表URL进入每个列表页,提取每一页的详情URL和下一页列表URL进入每个详情页,拿到书名如此往复循环,直到数据抓取完毕# coding: utf8from gevent import monkeymonkey.patch_all()#用于随机获取请求头,用法random.choice(list),会从列表中随机取出...
2018-04-16 00:20:10
347
1
原创 使用selenium爬取当当网图书
1.目标利用Selenium抓取当当网图书并用正则表达式获取到得到商品的图片、名称、价格、评论人数信息。2.开发环境python2.7 +windows10 +pycharm3.页面分析如图,其中包含商品的图片、名称、价格、评论人数信息。抓取入口就是当当网主页,主页链接可以通过直接构造参数访问。然后在搜索框中输入“日语”,呈现的就是第一页的搜索结果。在页面下方,有一个分页导航,其中既包括前6页的链...
2018-02-26 17:30:01
2102
1
原创 自学爬虫获取照片(零基础)
新手,初级尝试。爬取简单网站的MM照片。写博留念。步骤如下:第一步:分析网站 网址:http://www.7160.com/xingganmeinv/list_3_1.html打开网页元素,找到图片地址位置,地址在img标签下的src键中,获取每张照片的地址(http://img.7160.com/uploads/180130/12-1P1301A92Bc.jp
2018-01-31 23:52:38
762
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人