
爬取实例
途徒
talk is cheap,show me code!
展开
-
利用requests 模拟登陆csdn
坑一:登陆时请求的网址需要构造,数据在form标签属性里, 坑二:表单数据的提取 坑三:登陆后的跳转,不然无法访问个人主页import requestsfrom lxml import etree#设置sessions=requests.Session()#基础参数url='https://passport.youkuaiyun.com'headers={'Host':'passport原创 2017-09-26 19:40:14 · 320 阅读 · 0 评论 -
requests模拟登陆京东(2017-10-1)
requests模拟登陆京东 环境:python 3.6.1 | requests 2.18.4 | lxml 4.0.0 | pillow 4.2.1 时间:2017-10-1 可用- 以前在一次京东秒杀活动中使用selenium模拟登陆过京东,但最后没抢到,不知是运气不佳还是selenium太慢,这次用requests不知能否成功,以下只是模拟登陆的具体思路和代码。原创 2017-10-01 23:53:22 · 1946 阅读 · 0 评论 -
以知乎为例试探讨一种万能模拟登陆方式
以我们的日常上网的经验,有时我们好像不必登陆也能进入个人页面,原因大家都知道–cookies,根据这个思路,我们只要获取登陆之后的cookies我们就可以随意访问网站,但是要获取登陆后的cookies必须要先登陆,而现在的网站登陆时都有各种各样的验证码,一个网站一个验证原理(比如知乎的点击倒立文字就很特别),这就给我们登陆时带来了不少麻烦,解决了这个还有那个,遇到一个新的验证方式还需要重新研究,我今原创 2017-10-02 18:21:13 · 1571 阅读 · 0 评论 -
远程文件下载代本地保存
# 将远程文件下载代本地保存import urllib.request# 网络上图片的地址img_src = 'http://ugcws.video.gtimg.com/flv/169/29/m0312uzzuu7.p712.1.mp4?sdtfrom=v1001&type=mp4&vkey=6B8205AA3FFE008D16C550E1AC522D3C6E007548E0A6C11BD36原创 2017-12-13 21:59:47 · 749 阅读 · 0 评论