爬虫
文章平均质量分 69
愿热爱常在
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python网络爬虫
运行环境:python3 BeautifulSoup4解析库 中文文档: https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html BeautifulSoup4 是 HTML/XML 的解析器,主要的功能便是解析和提取 HTML/XML 中的数据。 Python中用于爬取静态网页的基本方法/模块有三种:正则表达式、BeautifulSoup和Lxml。三种方法的特点大致如下: beautifulSoup 的功能和 lxml 一样原创 2021-11-12 20:05:46 · 3885 阅读 · 0 评论 -
selenium
python+selenuim webdriver 页面跳转后如何定位元素 页面跳转之后,selenuim webdriver 无法定位继续定位新页面的页面元素。 其实,只需要将handle定位到当前页面就可以了 举个栗子: 打开百度搜索 输入selenuim 点击搜索 根据xpath找到新页面的第三个链接 点击跳转 #coding=utf-8 from selenium import webdriver import time browser=webdriver.Firefox原创 2021-11-12 19:51:06 · 873 阅读 · 0 评论
分享