
爬虫
打个大西瓜77
python大数据开发,致力于大数据知识图谱学习与研究
展开
-
爬取异步请求(XHR/JS)数据方法一人工分析异步请求
# !/usr/bin/env python # -*- encoding: utf-8 -*- # Created on 2018-07-06 12:30:04 # Project: test1 from pyspider.libs.base_handler import * class Handler(BaseHandler): crawl_config = { } ...原创 2018-07-06 13:16:23 · 5581 阅读 · 0 评论 -
爬取动态js html数据方法二 使用phantomjs
pyspider示例代码一:利用phantomjs解决js问题本系列文章主要记录和讲解pyspider的示例代码,希望能抛砖引玉。pyspider示例代码官方网站是http://demo.pyspider.org/。上面的示例代码太多,无从下手。因此本人找出一下比较经典的示例进行简单讲解,希望对新手有一些帮助。示例说明:如果页面中部分数据或文字由js生成,pyspider不能直接提取页面的数据。p...原创 2018-07-06 13:37:27 · 977 阅读 · 0 评论 -
pyspider打开url看不到内容
示例:未使用phantomjs前:数据部分为空白url列表:使用phantomjs:url列表:遇到这类动态js封装数据的情况,建议使用phantomjs原创 2018-07-06 13:45:12 · 760 阅读 · 0 评论