
爬虫
宁致乐水
目标找对象~学无止境~越努力越幸运~~~人生苦短~我用python
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用requests库爬取百度翻译
使用requests库爬取百度翻译首先查看pc端百度翻译接口发现有内部有签名机制(http://fanyi.baidu.com/v2transapi) 尝试切换到移动端看看结果 根据移动端接口爬取接口数据"""url http://fanyi.baidu.com/v2transapi请求方式 POST"from":"en","to":"zh","que原创 2018-07-11 20:01:38 · 2590 阅读 · 7 评论 -
利用requests模块中的session爬取登陆后的github页面
利用requests模块中的session爬取登陆后的github页面从登陆界面入手,找到登陆接口 尝试爬取登陆后的主页,并保存session用session保持登陆状态爬取其他页面 import requestslogin_url = 'https://github.com/session'login_name = input("请输入用户名:")login_pwd...原创 2018-07-11 20:11:45 · 1217 阅读 · 0 评论 -
使用requests爬取内涵8的内涵段子
使用requests爬取内涵8的内涵段子使用retrying模块进行超时重试处理使用随机User-Agent和随机代理服务器 进行简单的反反爬"""myreq.py 模块功能:parse_url 方法给 url 就返回 html简单反反爬1.随机 User-Agent2.随机代理服务器容错处理1.重试2.超时"""import requestsimp...原创 2018-07-11 20:24:14 · 5542 阅读 · 0 评论 -
爬取豆瓣电影数据
from pprint import pprintimport requestsimport json# 发送请求获取响应url = 'https://movie.douban.com/j/search_subjects'headers = { "User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 ...原创 2018-07-11 20:36:29 · 1999 阅读 · 0 评论