字体、svg反爬虫汇总

在这里插入图片描述
这几天做了一个爬虫的项目,里面包含了:大众点评字体解密、大众点评svg解密、猫眼动态字体解密,微博评论,博主、粉丝详细数据,博主主页所有的发文内容等,下面详细的说明解决几种字体加密和微博爬虫的思路与做法。
1、大众点评字体解密
爬过大众点评的朋友们想必都知道大众点评的反爬虫手段是非常高的,它的评分、地址等店铺信息大部分采用的字体加密的方式进行反爬虫,只需将对应的字体文件下载,进行字体匹配形成字典,再将请求返回的源码进行替换,形成正确字体,即网页中显示的信息。
2、大众点评svg解密
大众点评除了恶心的字体加密之外,它还有着svg的反爬虫手段,具体的解决方法就是将源代码中标签的位置与svg文件中的位置寻找规律,做进一步的匹配替换
3、猫眼动态字体解密
猫眼的反爬虫手段也是通过字体加密的方法呈现,不过与其他字体加密方式相比较,最大的不同是猫眼字体是动态的,它的更新速度很快,因此不可能做到一次匹配,一直使用,所以通过ocr的方法,自动将加密的字体与网页中的真实数据进行匹配,无需自己动手,就是自动匹配的时长略微长了几秒钟,不过也是一种很方便快捷的方法。
4、微博爬虫
一般选择微博的移动端进行爬取,网页端的爬取难度较高,不过无非也是抓包难度会高一些。移动端微博抓取,首先打开console,然后刷新网页进行抓包,对抓取的网址进行分析,发现只要更改网址末尾的页码,即可获取数据,难度不高,不做具体描述。

当然,上述只是自己的拙见,如果有大神有更好的方法可以在下方评论区进行探讨,感谢!

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值