最近几天在爬一个网站,里面有frame标签。
今天有想获取frame标签下面#documents里面的内容,查了一晚上的资料,幸好找到,明天可以交差了。。。
一个有frame标签的网站,http://www.lmtw.com/search.php?show=title%2Ckeyboard%2Cwriter&searchget=1&keyboard=%E7%94%B5%E8%A7%86

获取# documents里面HTML之类的内容,好多时候关键数据都在# documents里面
直接上程序,亲测有效
from selenium import webdriver
browser = webdriver.Chrome('/home/worker/Desktop/driver/chromedriver')
browser.get('http://www.lmtw.com/search.php?show=title%2Ckeyboard%2Cwriter&searchget=1&keyboard=%E7%94%B5%E8%A7%86')
# 将frame切到要获取的标签,参数是,frame标签里面的id,或者name
browser.switch_to.frame('iframepage')
print(browser.page_source)
browser.close()

这样就获取到id是iframepage,frame标签下面#documents里面的内容了
完美解决

本文介绍使用Selenium自动化测试工具获取包含Frame标签的网页中特定数据的方法。通过切换至目标Frame并抓取其内部HTML内容,成功解决了数据抓取难题。

被折叠的 条评论
为什么被折叠?



