
Python爬虫
python爬虫学习笔记
small-white
面向百度编程(⊙ˍ⊙)
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
BeautifulSoup库-标签解析遍历
目录 BeautifulSoup库的介绍 BeautifulSoup类的基本元素 html的内容遍历 BeautifulSoup库的介绍 安装:pip install BeautifulSoup4 <html> <body>标签树</body> ... </html> BeautifulSoup库是解析...原创 2020-09-22 11:46:10 · 4174 阅读 · 0 评论 -
正则表达式
目录 正则表达式的概念 正则表达式的语法 常用的正则表达式 python中Re库 正则表达式的概念 正则表达式是用来简洁表达一组字符串的表达式,正则表达式是一种通用的字符串表达框架,正则表达式是具有某一类特征的一组字符串,不依赖具体的语言,很多语言都支持正则表达式。 'PY' 'PYY' ------>正则表达式:PY+ 'PYYY.....原创 2020-05-07 11:43:27 · 364 阅读 · 0 评论 -
Request库的使用
Request库:封装了自动爬取HTML页面,自动网络请求提交的方法的库 Request库的7个主要方法: requests.request():构造一个请求,是一下个方法的基础 requests.get():获取HTML网页的主要方法,对应于HTTP的GET requests.head():获取HTML网页头部信息的方法,对应HTML的HEAD requests.post():向HTM...原创 2020-05-07 11:16:07 · 696 阅读 · 0 评论