
爬虫
文章平均质量分 78
一口木桶饭
意气风发,挥斥方遒!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python爬虫之selenium的常用用法(一)
selenium是一个自动化的测试工具,简单来说就是模拟人的操作来打开浏览器去进行翻页,点击,下滑等操作安装过程依旧pip install selenium若是pycharm的安装可以参考这篇pycharm如何安装第三方库对于selenium的使用我们用chrome浏览器为例,我们需要一个chromedriver驱动才可以使用,可以点击此网址下载对应的浏览器版本的驱动点此下载下面开始介绍基...原创 2020-02-12 14:22:54 · 375 阅读 · 0 评论 -
python爬虫之PyQuery的常用用法
安装依旧很简单pip install pyquery,对于pycharm的安装看这篇pycharm安装第三方库首先我们定义一个HTML文本段作为下边的例子<html> <head> <title>this is a title</title> </head> <body> <p class="first...原创 2020-02-12 12:28:07 · 540 阅读 · 0 评论 -
python爬虫之BeautifulSoup4库的简单用法
BeautifulSoup4库是一个用来解析网页的库,多用于对网页数据的分析,整合,下面介绍一下他的安装依旧很简单pip insyall bs4就可以,若使用pycharm的话,可以点击settings然后搜索Project Interpreter,然后点击加号搜索bs4,点击install即可以下是一些BeautifulSoup4的常用解析库解析器使用方法优势劣势P...原创 2020-02-11 23:08:53 · 606 阅读 · 0 评论 -
python正则表达式的常用用法
先来一个正则表达式的表格,内容很多,但是用熟了就好了,下面是python3有关正则表达式的使用方法符号表示表达意义\w匹配字母数字以及下划线 [A-Za-z0-9_]\W匹配除了字母数字和下划线之外的符号 [^A-Za-z0-9_]\d匹配任意数字,就是[0-9]\D匹配任意非数字的字符 ,就是[^0-9]\s匹配任意空白字符,如空格 换行 ...原创 2020-02-09 17:39:44 · 253 阅读 · 0 评论