
爬虫
哇咔咔2018
这个作者很懒,什么都没留下…
展开
-
python3 爬取豆瓣8.0以上的信息
打开F12 开发着工具 会发现这个是加载的数据。所以不能普通请求。这是我们打开networ 会发现一个这样的链接这里返回了我们想要的数据我们发现tag属性就是类型 page_limit就是每页显示多少,page_start 是每页从哪开始。所以我们只要请求这个网站获得 他的返回的json数据就可以了根据json数据提取自己所需要的东西 就可以了下面是代码import requestsimport...原创 2018-06-26 21:43:07 · 462 阅读 · 0 评论 -
scrapy 在python3下报错ImportError: cannot import name '_win32stdio'
_win32stdio.py和_pollingfile.py手动拷贝到Python3的Lib–>site-packages–>twisted–>internet目录下。 _pollingfile.py# -*- test-case-name: twisted.internet.test.test_pollingfile -*-# Copyright (c) Twis...原创 2018-07-23 11:18:26 · 2985 阅读 · 0 评论