- 博客(3)
- 收藏
- 关注
原创 requests+bs4爬取网页内容——以爬取网页文章信息为例
一、引言 目标网址:https://gary666.com/learn 爬取方式:requests+bs4 难度:易 基本爬取的内容: 输出:页面中所有的文章的标题、内容、作者、文章分类、时间 对应上图(标题为win10python安装配置selenium 、作者是Gary、文章分类python、时间2020-7-9) 选做内容: 数据存储:txt、excel、数据库(mysql、sqlite等) 翻页:https://gary666.com/learn?page=2,url
2020-08-17 16:46:15
9210
原创 requests+bs4使用(post方式)
这里写自定义目录标题requests+bs4使用(post方式)一、介绍二、参考代码 requests+bs4使用(post方式) 参看文献: 关于json格式的介绍:https://blog.youkuaiyun.com/woay2008/article/details/94366000 使用chrom浏览器Network查看前后台数据传输请求:https://blog.youkuaiyun.com/museions/article/details/75144263 不同浏览器前端调试查看返回页面的json数据:https:
2020-08-08 09:21:06
742
原创 使用post方式模拟登录作业管理系统
一、介绍 1.登录的路由 https://homewk.cn/login 主要是模拟登录 2.需要post的参数 username(你的学号) password(你的学号对应的系统密码【采用了md5加密,后面会给加密函数】) identity_id(身份:固定为Student) 3.输入 用户的账号和密码 4.输出 怎么判断是否登录成功:可以查看特定内容是否加载出来,比如登录成功后会有你的姓名信息,登录失败则没有;或者通过特定的标签(或者特殊的属性),比如登录失败有id为msg的错误提示,登录成功
2020-08-08 09:19:42
1218
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅