前言
LOL的皮肤的爬取是我当年刚学习爬虫时就想爬的一个网站,课程设计做的也是这个,不过由于当时技术水平有限,爬取的数据很潦草,所以现在我有时间了就又重新去看看这个网站是怎么爬更好了。
目标
1.是获取到皮肤数据(我选择保存的皮肤格式是png)
2.是要获取到皮肤的名字,来为皮肤命名
示例如下:
网站分析
在网上我也看了一些别人爬的教程,不过他们爬到的数据会不全,有很多的皮肤会爬取不到,所以我就自己下手了。
1.打开LOL的官网,滑到最下面,随便点一个英雄
我直接就选择第一个英雄安妮
打开界面,按F12之后,F5刷新,在网站反回来的网络请求中我找到了这一个json文件请求文件,这个文件一看就很可疑,点击预览之后果然,所需要的数据都放在了这一个json文件里面。
可以看到在里面有我们需要的英雄的名字,进过我对这些图片链接的一个个访问,我也找到了我们需要的图片链接
1.1补充说明
在这里插一句,网上的一些获取图片的方式是通过组合图片的链接
这样的链接是可以访问,前面的1是英雄的id,最后的0是英雄的第几个皮肤,修改这两个参数可以获取到图片数据
但是有个问题,这个方法只对很老的皮肤生效,应该是自从某一时间点之后,腾讯修改了数据存放方式
例如:
安妮有16个皮肤,当我们把数字改成16时,组合成的链接并不能访问
2.数据链接
观察链接:
https://game.gtimg.cn/images/lol/act/img/js/hero/1.js?ts=2800033
?之后的都可以不用看,属于一些参数。链接后面的1就很可疑
当把1换成2之后,很明显的看出