如何获取页面数据

大头大头下雨不愁~

已于 2024-04-28 14:00:36 修改

阅读量592

点赞数 4

文章标签： beautifulsoup

于 2024-04-28 13:49:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_51997580/article/details/138275250

版权

获取页面数据之BeautifulSoup()方法

自动化中经常需要从页面获取数据，然后将数据用在测试代码中。那么如何从页面拿到想要的数据呢？此处介绍两种我比较习惯的方法：

1、常规方法：根据标签属性获取数据。

通过F12定位元素，查看数据在标签规律，从属性、text等获取数据。

def get_title_num_list(self):
    title_num = []
    length = len(self.driver.find_elements(By.XPATH, '//div[@role="tab"]'))
    for x in range(1, length + 1):
        num = self.driver.find_element(By.XPATH, '(//div[@role="tab"][' + str(x) + ']//span)[1]').text
        title_num.append(num)
    return title_num

2、用BeautifulSoup从源码查找需要的数据。

从BeautifulSoup可以用来解析HTML和XML页面数据，把网页数据变成树状结构的标签元素，再从找查找需要的数据。BeautifulSoup（）需要两个参数，一个是文件名（可以是直接从网页读取，也可以是保存好的文件），另外一个是解析器，从web网页读取数据，直接使用html.parser即可。find_all是返回你查找的标签信息，只要不报错，可以一直使用find_all直至查到你需要的信息为止。

from bs4 import BeautifulSoup

def get_bpm_page_item_list(self, item):
    all_list = {}
    pattern = re.compile(r'[\u4e00-\u9fa5]+')
    soup = BeautifulSoup(self.driver.page_source, 'html.parser')
    input_list = soup.find_all("div", {'class': 'el-card__body'})[0].find_all("input")
    button_list = soup.find_all("div", {'class': 'el-card__body'})[0].find_all("button")
    for i in range(0, len(input_list)):
        input_list[i] = pattern.findall(str(input_list[i]))[0]... ...

大头大头下雨不愁~

博客等级

码龄5年

25
原创

67
点赞

43
收藏

57
粉丝

关注

私信

热门文章

下一篇：: 删除readonly属性

最新评论

文件导出/下载功能测试点
优快云-Ada助手: 恭喜您发布了第15篇博客“文件导出功能测试点”，内容相当丰富和实用。继续保持创作的热情和努力，对您的付出表示敬佩。同时，建议在下一篇博客中可以深入探讨文件导出功能的实际应用场景和解决方案，以便读者更好地理解和应用。期待您更多精彩的作品，加油！
数据中列表A与B的大小关系/包含关系
优快云-Ada助手: 恭喜您撰写了第14篇博客，标题为“数据中列表A与B的大小关系/包含关系”，内容看起来非常有趣和实用。希望您能继续保持创作热情，分享更多有价值的内容给读者。接下来，您可以考虑深入探讨列表A与B之间大小关系的具体案例，或者结合实际应用场景给出更多的实用建议。期待您的下一篇作品！
数据中列表A与B的大小关系/包含关系
优快云-Ada助手: 恭喜用户发布了关于数据中列表A与B大小关系/包含关系的新博客！不断分享知识和经验是非常值得赞赏的，希望您能继续保持创作的热情和耐心。接下来，或许可以考虑探讨一些具体的案例或实际应用，让读者更加深入地理解这一主题。期待您的下一篇博客！祝您创作顺利！
脚本链接Oracle数据库时，报错找不到32位Oracle客户端
优快云-Ada助手: 恭喜用户写了第12篇博客！对于脚本链接Oracle数据库时出现的报错，你的经验分享对大家非常有帮助。建议你在下一篇博客中可以详细介绍如何解决这个问题，或者分享一些常见的数据库链接错误及解决方法，这样能够让读者受益更多。期待你的下一篇作品！愿你创作越来越精彩！
python数据类型之数值
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。