身为一个Python小白,我对phantomjs并不是很了解,今天安装了一遍,于是写这篇博客记录下流程,首先是对phantomjs的介绍:
phantomjs介绍
(1)一个基于webkit内核的无头浏览器,即没有UI界面,即它就是一个浏览器,只是其内的点击、翻页等人为相关操作需要程序设计实现。
(2)提供javascript API接口,即通过编写js程序可以直接与webkit内核交互,在此之上可以结合java语言等,通过java调用js等相关操作,从而解决了以前c/c++才能比较好的基于webkit开发优质采集器的限制。
(3)提供windows、linux、mac等不同os的安装使用包,也就是说可以在不同平台上二次开发采集项目或是自动项目测试等工作。
phantomjs下载
(1)下载地址链接:http://phantomjs.org/download.html
找到后,根据自己电脑系统选择相应的版本下载。
(2)下载好后的文件解压后保存至安全的文件夹内
配置环境变量
找到phantomjs.exe文件所在的位置,然后把他的路径复制一下
通过在我的电脑属性中找高级选项或开始菜单栏搜索环境变量两种方式,都可以快速找到环境变量
我选择的是第二种方式,然后在系统变量中找path,进行编辑
点击编辑后,在输入栏先添加一个;,然后把之前复制的phantomjs粘贴进去,如图所示
环境变量配置好后,点击运行phantomjs.exe文件
如图所示,证明环境变量配置好了,然后,就需要运行测试一下了。
运行测试
我用的是pytharm,打算用搜狐滑动新闻测试一下获取动态数据,新建一个python文件,输入以下几行代码:
from selenium import webdriver
driver =webdriver.PhantomJS(executable_path=r'D:/Python/phantomjs-2.1.1-windows/bin/phantomjs.exe')
driver.get('http://news.sohu.com/scroll')
print(driver.find_element_by_class_name('title').text)
输出结果:
如上图所示,结果输出成功,红色代码是警告,不影响。
如果没有输出成功可以尝试重新配置一遍环境变量或者重启电脑。
希望我这篇博客对你能有所帮助!