PhantomJS(爬取动态页面需要用到)
基于webkit的javaScript API。提供了css选择器,提供了处理文件的I/O操作,支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG。
mac安装配置:
1. http://phantomjs.org/download.html下载phantomjs-2.1.1-macosx;
2. 命令行输入:cd /usr/bin/;
3. 再执行:open ~/.bash_profile;
4. 在.bash_profile中添加(路径为你安装的phantomjs的路径):export PATH="$PATH:/Users/xxx/phantomjs-2.1.1-macosx/bin";
5. 在终端输入:echo $PATH,路径清单将显示如下内容:
sbin:/Users/xxx/phantomjs-2.1.1-macosx/bin;
6. 完成!
Selenium(浏览器自动化测试框架)
定义:Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。
功能:框架底层使用JavaScript模拟真实用户对浏览器进行操作。测试脚本进行时,浏览器自动按照脚本代码做出点击、输入、打开、验证等操作,就像真实用户所做的一样,从终端用户的角度测试应用程序。
Selenium(mac)安装:
1. 命令行输入:pip install selenium;
2. 完成!
Chrome驱动(mac)下载及配置:
1. http://docs.seleniumhq.org/download/下载地址;
2. 将解压的chromedriver移动到/usr/local/bin目录下;