
Python简单爬虫
「已注销」
这个作者很懒,什么都没留下…
展开
-
PythonRun
urllib2库的基本使用所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网页,我们先学习urllib2。urllib2 是 Python2.7 自带的模块(不需要下载,导入即可使用)urllib2 官方文档:https://docs.python.org/2/library/urllib2.htmlurllib2 源码:...原创 2019-06-15 13:51:25 · 967 阅读 · 0 评论 -
xiecheng_spider
xiecheng_spider携程民宿爬虫获取URL由于携程网页由CSS编写,因此我们需要使用浏览器去跳转页面,这里我需要做一些准备工作1.安装谷歌浏览器驱动,连接如下。安装成功后要放在PATH路径下http://npm.taobao.org/mirrors/chromedriver/2.安装环境,这里我用的Python3.7# 我们需要使用其中的模块pip install s...原创 2019-06-16 20:43:14 · 285 阅读 · 0 评论