哔哩哔哩漫画-下载地址分析

本文讨论了图片使用Blob加密方式在网络传输中的应用,通过解析JSON数据获取图片的真实地址,并介绍了如何构造HTTP GET请求来下载这些图片。同时,文章提到了阿里云CDN和OSS在处理此类请求时可能存在的问题。
部署运行你感兴趣的模型镜像

举例

web请求

图片采取了blob 加密

图片真是地址在

{"code":0,"msg":"","data":[{"url":"https://is.hdslb.com/bfs/manga/075f3b41cd84dc892b04cdb1443d73b6d71adfe9.jpg","token":"73441250b03e3f16%3AMl6hWKE0Ld68N8W%2Bkc%2BciCfmz1c%3D%3A1566389603"}]}
解析json 拼接  https://is.hdslb.com/bfs/manga/ce79fc57e2b40be853cb957a79201e162163b57f.jpg@1100w.jpg?token=73441250b03e3f16%3A%2BoJHQUJFnWm0kqtjVTuMDXvvdVk%3D%3A1566391244

整个图片下载地址 ,http get 请求 没有任何web限制。阿里云cdn缺陷   阿里云对象存储oss

@1100w.jpg 是参数

官方文档 https://help.aliyun.com/document_detail/32217.html   

 


 

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

### 使用 Python 编写爬虫抓取漫画资源 尽管当前提供的引用主要涉及哩视频、弹幕以及UP主信息的抓取[^1][^2][^3],并未直接提及有关漫画的具体教程。然而,可以基于这些基础方法扩展到漫画领域。以下是实现这一目标的关键步骤和技术要点。 #### 依赖库安装 为了构建一个功能完善的爬虫程序,需先确保已安装必要的Python库。通常情况下,`requests`用于发送HTTP请求,而`BeautifulSoup`则负责HTML页面解析。如果需要处理更复杂的动态加载内容,则可能需要用到`selenium`或其他工具模拟浏览器行为。具体命令如下所示: ```bash pip install requests beautifulsoup4 selenium ``` #### 请求头设置与反爬机制规避 哩网站具有较强的反爬措施,因此在发起网络请求时应合理配置User-Agent等头部信息来模仿真实用户的访问习惯。此外还需注意频率控制以免触发封禁机制。 ```python import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)', } response = requests.get('https://manga.bilibili.com/', headers=headers) print(response.status_code) ``` #### 数据提取逻辑设计 针对漫画部分的数据结构分析表明,每部作品的相关属性如名称、作者、分类标签等均嵌套于特定JSON对象或者DOM节点之中。利用正则表达式匹配或是CSS选择器定位能够高效完成字段抽取工作。 ```python from bs4 import BeautifulSoup soup = BeautifulSoup(response.text, 'html.parser') comics = soup.find_all('div', class_='comic-item') for comic in comics: title = comic.a['title'] cover_url = comic.img['src'] print(f'{title}: {cover_url}') ``` #### 存储方式规划 最后一步便是考虑如何持久化所采集的信息。常见的做法有保存至本地CSV文件便于后续统计分析;亦或者是上传数据库以便长期维护查询效率更高。 ```python import csv with open('bilibili_comics.csv', mode='w') as f: writer = csv.writer(f) writer.writerow(['Title', 'Cover URL']) for comic in comics: row_data = [ comic.a['title'], comic.img['src'] ] writer.writerow(row_data) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值