爬虫
atopx
一个真正热爱编程且具有极客精神的程序猿,python、golang、rust
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python生产者消费者案例 -- 多线程爬取智联招聘
核心思想:创建工厂类, 使用单利模式实现队列数据共享创建生产者类, 提取智联详情页url并存入工厂类队列创建消费者类, 从工厂类队列里取出url并抓取数据代码详情:使用方法说明: python zhilian_spider.py 城市 关键词 最大页码实例: python zhilian_spider.py 杭州 python 10完整代码:import sysimport ...原创 2018-12-29 08:44:02 · 460 阅读 · 0 评论 -
Node.js使用selenium
安装 Nodejs到Nodejs官方下载地址下载最新稳定版本Nodejs后安装。安装成功后在命令行模式使用以下命令查看是否成功。node -v项目初始化创建一个文件夹(用户存放项目文件)后命令行模式进入到该文件夹下执行命令:node init安装seleniumnpm install selenium-webdriver --save安装谷歌驱动npm install ch...原创 2019-01-23 15:55:03 · 1350 阅读 · 1 评论 -
Node.js 写爬虫
示例代码使用request配合cheerio实现简单爬虫let request = require('request'); // 需要先安装request库let cheerio = require('cheerio'); // 需要先安装cheeriolet url = "http://example.webscraping.com/places/default/view/china...原创 2019-01-23 16:24:58 · 207 阅读 · 0 评论 -
python调用js代码
安装代码转换工具pip install js2py转换和调用import js2pyjavascript_code1 = open('test.js', 'r', encoding='utf-8').read() # 读取本地js代码# 直接加载js字符串javascript_code2 = """function enString(data) { var key1 =...原创 2019-02-20 17:46:30 · 895 阅读 · 0 评论
分享