
爬虫
文章平均质量分 91
林先生您好
这个作者很懒,什么都没留下…
展开
-
使用python爬取全国所有热门景点数据---去哪儿网
要爬取去哪儿上面的所有的热门景点的数据 可以先再 搜索出 搜索 热门景点 http://piao.qunar.com/ticket/list.htm?keyword=%E7%83%AD%E9%97%A8%E6%99%AF%E7%82%B9®ion=&from=mpl_search_suggest可以看到 有几千页 的景点数据,我们要爬取的就是这些数据;最好是从分类开原创 2017-02-08 16:45:59 · 20347 阅读 · 8 评论 -
使用python爬取12306上面所有车次数据
在爬取12306之前需要做的工作就是:1,分析请求过程2,分析是否需要处理cookie3,编写代码4,测试爬取网站是否有访问次数限制5,部署到正式服务器上这里重点写 如何分析请求过程:这是12306上面查询车次的界面,出发地和目的地 是我们需要输入的, 如果要爬取全国的所有的车次 那就需要找到全国所有的出发地到目的地的列表.找了 很久发现在 车次查询页面ht原创 2017-03-27 17:22:51 · 32319 阅读 · 12 评论 -
爬虫抓取糯米网上所有商家数据
前段时间写了 爬取美团商家信息的博客 爬虫抓取美团网上所有商家信息 ,这次说说爬取糯米网,由于某些原因无法提供源代码,但是,代码不是关键,最关键的是思想,懂了思想,代码是很容易写的.爬虫最重要的是分析请求过程,按照实际请求过程去请求数据.分析是否需要处理cookie,有些网站比较严格请求某些接口的数据时是需要cookie,获取cookie的链接一般是首页,一般的系统会有一个Jsessi原创 2017-04-04 16:09:13 · 6376 阅读 · 4 评论