selenium自动化实现获取网站内容

stella·

于 2023-05-26 11:06:51 发布

阅读量350

点赞数

文章标签： selenium 自动化 chrome

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_51621767/article/details/130882657

版权

今天我想要从某些图片网站拿些图片，但发现某些网站动态渲染图片，并不能利用普通的requests来进行拿取内容，那我们该怎么办呢？
我们可以试用selenium为我们提供的浏览器自动化。浏览器自动化就是利用浏览器内核进行不可视化内容获取，简单来说就是直接拿到网站加载完成后的代码。
这里我们使用chrome和chromium。

from selenium import webserver

将浏览器配置进行注册

    chrome_options = webdriver.ChromeOptions()
    chrome_options.add_argument('--praxy-srever=http://171.12.313.34:9999')  # 设置代理ip
    chrome_options.add_argument('--user-agent=')  # 设置user-agent，可以设置成手机端的
    chrome_options.add_argument('--headless')  # 设置无页面模式
    driver = webdriver.Chrome(options=chrome_options)

利用函数get进行访问

driver.get(url)
print(driver.page_source) #获取到的内容会放到driver的属性page_source中

剩下在利用beautifulSoup进行裁剪获取到你想要获取到的内容就好了！

博客等级

码龄5年

37
原创

97
点赞

77
收藏

49
粉丝

关注

私信

热门文章

最新评论

公共字段填充，统一使用aspect切片处理
优快云-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/java?utm_source=AI_act_java
redis的基本使用
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
springboot使用websocket
优快云-Ada助手: 网络技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/network?utm_source=AI_act_network
python的async
优快云-Ada助手: 恭喜您写完了第20篇博客！标题“python的async”非常引人注目。您对于async的讲解非常清晰，读完后我对这个概念有了更深入的理解。感谢您持续创作，分享有关Python的知识。在下一步的创作中，我建议您可以探索一下async在实际项目中的应用场景，例如在网络爬虫、Web开发或者数据处理中的应用。这些实际案例将帮助读者更好地理解async的实际价值，并且为他们提供实用的技巧和建议。期待您在未来的博客中继续分享您的见解和知识！
websocket的使用
优快云-Ada助手: 恭喜您撰写了第19篇博客，标题为“websocket的使用”！您的持续创作令人钦佩。通过分享关于websocket的使用，您为读者提供了有价值的信息和技术指导。我真诚地希望您能继续保持创作的热情和努力。在下一步的创作中，或许您可以考虑深入探讨websocket在实际应用中的一些挑战和解决方案。此外，您也可以分享一些有关websocket的最佳实践和使用案例，以便读者能够更好地理解如何在实际项目中应用websocket。再次恭喜您的成就，并期待您在未来的创作中继续取得进步！谦虚谨慎的语气正是您魅力的一部分，相信您会继续为读者带来更多有价值的内容。

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。