爬虫尝试抓取动态网页

之前写过一篇使用爬虫抓取暗黑3玩家数据,由于凯恩之角数据总是不更新,那个爬虫意义不大

其实官方网站也是可以看到玩家数据的,我当时没有去爬的原因是...网页源代码和网页展示的数据不一样,知道最近我才知道那是动态网页敲打

百度了半天,感觉有一种方式比较简单,就是F12使用开发者工具,去找到加载网页的时候发送的request url

比如说我要爬取玩家‘可乐加冰-5750’的数据,他的个人数据页为:

http://d3.blizzard.cn/profile/可乐加冰-5750

我们使用开发者工具,点击其中一个人物,进入任务详细页面:


我们通过request url,可知这是一个数字id48423858的人物的数据,稍改一下,删去hero/48423858,可以看到


虽然网页上什么也看不到,但我们看下网页源代码,很惊喜的发现有‘可乐加冰-5750’的所有人物数据大笑

好了,大抓特抓吧


明天周三一天没课,打算用几天的时间,写一个爬取任何玩家的信息(前提要知道该玩家的BattleTag),包括人物主要属性,装备及其词缀,还有一些玩家的生涯数据。力求界面友好。工程量肯定要大于之前,希望一切顺利吧

终极目标,这学期要学数据库,希望能将爬虫获得的数据写入我的数据库,可以统计譬如全服各职业前1000名玩家的出装、萃取情况吐舌头


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值