Lua脚本
function main(splash, args)
splash:go(args.url)
splash:wait(args.wait)
splash:runjs("iframe = function(){
var f = document.getElementById('g_iframe');
return f.contentDocument.getElementsByTagName('body')[0].innerHTML;
}")
local result = splash:evaljs("iframe()")
return result
end
配置好scrapy和splash后,就可以爬取到iframe标签里的内容了
本文介绍了一种使用Lua脚本和Splash浏览器自动化工具抓取网页中iframe内容的方法,通过定义Lua函数并利用Scrapy框架实现自动化爬取。
654

被折叠的 条评论
为什么被折叠?



