自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 【无标题】

错误截图。

2023-06-03 23:53:26 155 1

原创 2021-01-22

2021-01-22 发布 网络爬虫基础(通用爬虫) 网络爬虫简介 网络爬虫是通过网页的链接地址来寻找网页的。网页的某一个网站开始,读取网页的内容,找到网页中的其他链接地址,然后通过链接地址找寻下个网页,将信息爬去下来。 爬虫使用 书写爬虫的精力大于人眼观测的精力。 步骤 发起请求 即发送一个request请求。 request包含请求头,请求体。 在游览器中打开网页–右键检查–network–headers 获取响应内容 应用到requests第三方库中的get方法,是获取HTML网页的主要方法。 解析h

2021-01-22 17:08:13 802

原创 2021-01-22

网络爬虫基础(通用爬虫) 网络爬虫简介 网络爬虫是通过网页的链接地址来寻找网页的。网页的某一个网站开始,读取网页的内容,找到网页中的其他链接地址,然后通过链接地址找寻下个网页,将信息爬去下来。 爬虫使用 书写爬虫的精力大于人眼观测的精力。 步骤 发起请求 即发送一个request请求。 request包含请求头,请求体。 在游览器中打开网页–右键检查–network–headers 获取响应内容 应用到requests第三方库中的get方法,是获取HTML网页的主要方法。 解析html数据 使用xpath解

2021-01-22 16:54:50 128 1

原创 2020-10-20

** python正则表达式** 正则表达式是一个特殊的字符序列,利用事先定义好的一些特定字符以及它们的组合组成一个“规则”,检查一个字符串是否与这种规则匹配来实现对字符的过滤或匹配。 1.re模块中findall()方法以列表的形式返回所有能匹配的子串,如果没有找到匹配的,则返回空列表。 eg: import re s=r‘abc’ re.findall(s,'aabaab‘) 返回: [] ...

2020-10-20 22:29:03 99

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除