自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 【爬虫36例01】【已失效,订阅请谨慎】_signature参数分析

【声明:本文章仅供技术交流,请勿用于非法用途,如有其它非法用途造成损失,和作者无关】前情提要今日头条web版的请求主要参数是:as、cp、_signature。as、cp 比较简单,直接使用 js 源码,或者用 python 编译都可以。_signature比较复杂。依照经验来看,_signature 更新频率很频繁,有时半个月就更新。所以此篇文章代码不一定长期有效,但是解决方案通用。url 分析随便打开今日头条网页版一个界面,示例这里打开的是 “热点“ 分栏,https://www.touti

2020-07-06 16:30:46 7787 72

原创 【ubuntu】20.04下 Ctrl+Shift+E 无法使用 terminator 分屏问题解决

【原因】Ctrl+Shift+E 快捷键被占用【解决】cz@cz:~$ ibus-setup将 Emoji 标签中两个快捷键删除即可

2021-04-11 12:48:03 5184 6

原创 【scrapy爬虫】最新sogou搜狗搜索 机智操作绕过反爬验证码(搜狗微信公众号文章同理)

前情提要此代码使用scrapy框架爬取特定“关键词”下的搜狗常规搜索结果,保存到同级目录下csv文件。并非爬取微信公众号文章,但是绕过验证码的原理相同。如有错误,希望大家指正。URL结构https://www.sogou.com/web?query={关键词}&page={n}开始爬取scrapy常规操作就不唠叨了,上代码class SougouSearchSpider(scrapy.Spider): name = 'sogou_search' allowed_doma

2020-06-11 16:54:18 6338 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除