
scrapy
jun_军
这个作者很懒,什么都没留下…
展开
-
一周搞定scrapy之3,将爬取到的起点中文网信息保存到mysql
安装mysql去mysql官网下载https://dev.mysql.com/downloads/installer/(除了这步要改一下,其余的都是默认继续)然后安装路径默认设置密码,最后完成该之前的代码(以下是github全部源码)https://github.com/junasir/qidianhot/tree/master第一步改pipelines》py...原创 2020-07-02 16:11:48 · 278 阅读 · 0 评论 -
一周搞定scrapy之2,伪装成浏览器及用css提取数据
实现爬虫的过程request对象参数及含义参数说明urlHTTP请求的网站methodHTTP请求的方法,如“GET”bodyHTTP的请求体,类型为str或unicodeheadersHTTP的请求体,字典型cookies请求的cookie值,字典型或列表型,可以实现自动登录的效果encoding请求的编码方式,默认为utf-8callback指定回调函数,即确定页面解析函数,默认为parse()meta字典类型,用于数据原创 2020-06-08 20:36:33 · 690 阅读 · 0 评论 -
一周搞定scrapy之第一天--爬取起点中文小说网
快速安装scrapypip install -i https://pypi.tuna.tsinghua.edu.cn/simple scrapy安装完成之后在cmd里面输入scrapy如果出现以上的情况,说明已经安装成功了新建scrapy项目,我们不能直接在pycharm里面新建,我们要在cmd新建scrapy startproject +名字 ## 前提进入该文件夹下面的这个代表我的项目文件夹,然后我们再进去下面这个文件夹代表了scrapy的框架接着我们找要爬取的网站,按f原创 2020-06-07 11:58:39 · 990 阅读 · 0 评论