python对英雄皮肤进行图片采集~

原创

已于 2023-01-02 13:13:40 修改 · 1.3w 阅读

113 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

于 2022-07-26 14:55:45 首次发布

前言

嗨喽~大家好呀，这里是魔王呐

环境使用:

Python 3.8
Pycharm

模块使用:

requests —> 数据请求模块需要安装 pip install requests
re 正则表达式内置模块不需要安装
os 文件操作模块内置模块不需要安装 --> 自动创建文件夹把每个英雄都自动创建对应文件

基本套路

一. 数据来源分析

确定需求, 确定采集目标
通过开发者工具抓包分析, 分析我们想要数据内容来自于那个url地址

F12 或者鼠标右键点击检查选择 network(网络) 刷新网页
去分析图片url地址是什么 —> 选择 Img 可以查找图片url地址

505 表示英雄ID

2 皮肤第几个 —> 通过皮肤名字对应他的皮肤链接

请添加图片描述

想要获取 yao 皮肤数据

向网址发送请求
获取response响应数据
提取皮肤名字
构建皮肤 url地址
保存数据

二. 代码实现步骤

发送请求, 模拟浏览器对于url地址发送请求
获取数据, 获取服务器返回响应数据
解析数据, 提取我们想要内容, 皮肤名字
保存数据, 数据保存本地

请添加图片描述

代码

# 导入数据请求模块  ---> 第三方模块 需要 在cmd里面进行安装 pip install requests
import requests
# 导入正则模块  ---> 内置模块 不需要安装
import re
# 导入文件操作模块  ---> 内置模块 不需要安装
import os

# 确定网址
link = 'https://pvp.**.com/web201605/js/herolist.json'
# 模拟伪装浏览器 ---> 请求头
headers = {
   
   
    # user-agent 用户代理 表示浏览器基本身份标识
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
# 发送请求
json_data

最低0.47元/天解锁文章