Python采集某网站小sp内容, m3u8内容下载

本文介绍了如何使用Python进行网络数据采集,特别是针对m3u8视频内容的下载。作者讲解了所需的Python环境(如Python 3.8和Pycharm)、使用的模块(requests和re)以及关键知识点,包括基础语法、开发者工具、正则表达式和requests库的使用。通过抓包分析找到m3u8文件链接,并展示了如何将m3u8视频分割为多个ts文件进行下载。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

环境使用:

  • Python 3.8

  • Pycharm

模块使用:

  • import requests >>> pip install requests

  • import re 正则表达式 解析数据

  • import json

本次案例所用知识点:

python基础语法:

  • 字典创建/取值

  • print输出函数使用

  • 字符串创建

  • 列表取值

  • for循环遍历

  • open函数数据保存

  • 函数关键字传参

  • 数据类型转换 json

python爬:

  • 开发者工具使用

  • re正则简单使用 --> findall sub .*?

  • requests简单使用 --> get请求

数据来源分析

视频内容数据在什么地方

通过开发者工具进行抓包分析, 相应视频数据内容

普通视频: 完整视频数据 2:18

m3u8视频: 把 2:18 视频内容, 分割为N个视频片段 --> 每一个视频片段都有一个链接<ts结尾>
把整体视频内容, 分成N个ts文件 --> 包含在一个m3u8文件

找视频对应 m3u8文件链接 <所有视频片段都在这个文件链接>

代码展示

import requests
import re
import json
from pprint import pprint

link = 'https://****/u/29946310'
data = {
   
    'quickViewId': 'ac-space-video-list',
    'reqID': '8',
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值