
65爬虫(四)Selenium
48N6E
这个作者很懒,什么都没留下…
展开
-
2020/04/09 03-模拟登陆和页面等待
试试是否能模拟键盘 这个是登录要用到的地址 现在借助selenium和phantomjs来搞定,这里id肯定也是不可重复的 form表单里面根本不关心是div还是table,下回提交,只要控件有name就带上数据 send_keys就是找id这个元素然后往里面送入键盘key,也就是模拟键盘输入 先输入账号密码试一下 现在就看到输入的账号密码了 敲回车需要引入一个特殊键 特殊键E...原创 2020-04-10 17:31:16 · 714 阅读 · 0 评论 -
2020/04/09 02-异步请求处理和下拉框处理
web测试工具selenium,无头浏览器phantomjs,利用浏览器的功能读取到动态网页内容。这样做一些事情比较方便,(登录返回一个cookie,我们直接是直接复制cookie,往往是先登录拿到了cookie,再把cookie带上,然后request.session访问这个网页,网页看到这个session就放行了。但是登录过程模拟出来就很难,这样selenium+无头浏览器就可以做) pha...原创 2020-04-09 22:36:19 · 818 阅读 · 0 评论 -
2020/04/09 01-PhantomJS和Selenium简单应用
之前的豆瓣上的热门电影的这些数据是异步请求,所谓的保存的数据其实跟右键保存源代码是一样的 跟右键审查元素是两码事,这个审查元素其实是实时的DOM,DOM里有什么元素就能看到什么元素,跟源代码两码事,源代码是第一次拿来的数据。审查元素是当前浏览器提供的实时DOM的虚拟的东西,里面可以看到这些数据,因为浏览器就是玩DOM的,但是爬过来的时候没有。 怎么办?可以用google插件比如XHR调试是否有你需...原创 2020-04-09 16:12:51 · 404 阅读 · 0 评论