前几天写了一个爬虫程序,经历了一个从无到有的过程,现在将过程写下来,希望供大家学习交流,如有错误欢迎指正。
一、程序的功能:爬取公司内部网站上的图片,网站需要用户名密码登录
二、程序流程
1、先用request.post获取token
2、再用request.get获取订单号
3、最后用订单号查找图片
三、基础知识
1、get和post的区别
一般查询服务的时候用get,是从服务器上获取数据;向后台提交数据时用post,如注册登陆。post安全点,提交的数据多点,数据是放在http头信息里面的,get的参数是在URL后面的,另外,

本文详述了使用Python爬虫抓取公司内部网站图片的完整过程,涉及登录验证、GET/POST请求及HTTP基础知识。首先通过request.post获取token,再通过request.get获取订单号,最后依据订单号查找并下载图片。同时介绍了GET和POST的区别,HTTP请求的组成部分,以及如何处理需要认证的请求。推荐使用Postman工具进行前期测试,以提高开发效率。
最低0.47元/天 解锁文章
1343

被折叠的 条评论
为什么被折叠?



