python 爬取某站视频

原创已于 2023-06-03 15:30:31 修改 · 2.5k 阅读

50 ·

CC 4.0 BY-SA版权

文章标签：

#python #音视频 #开发语言

于 2023-06-03 14:46:56 首次发布

python编程专栏收录该内容

2 篇文章

订阅专栏

文章讲述了作者如何利用Python爬虫技术从B站获取视频的音频和视频流，然后进行下载并合并成完整的MP4文件，作为大学期末作业的一部分。代码中包含了获取响应、解析JSON、保存文件以及合并音视频的步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

也是感觉好久都没有写博客了，主要是因为学业繁忙（其实是想多摆烂一会儿。。。）

在这里插入图片描述
距离暑假还有一个月，各科老师也开始布置相关的期末考试内容了。。。。。。

最近英语老师给我们留了一个期末作业（大学牲又要忙起来了），内容是拍摄一个短视频，既然是视频那素材是少不了的（我还是负责剪辑），于是我们组员开始在某站上寻找素材，找到视频发现下载不了视频，本来是想着既然下载不了，那就直接录屏吧。But，我又觉得既然学了爬虫那就要把它利用起来，顺便就当复习一下相关知识（也是好久没有写爬虫了）。

接下来让我们可以如何爬取某站上的视频吧,
话不多说直接上代码：

import requests,json,pprint,re
import os
from moviepy.editor import *

""" 获取url响应体 """
def getResponse(url):
    # 设置请求头
    # referer：必须要设置，否则会返回403没有权限访问，加上这段就代表我们是从哪个网页请求过来的
    # User-Agent：设置浏览器标识
    headers = {
        'referer':'https://www.bilibili.com/',
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36'
    }
    """发起get请求"""
    response = requests.get(url=url,headers=headers)
    return response

""" 解析响应体 """
def parseResponse(url):
    # 获取url响应体
    response = getResponse(url)
    # 用正则表达式取出返回的视频数据
    html_data = re.findall('<script>window.__playinfo__=(.*?)</script>',response.text)[0]
    # 解析成json数据
    JsonData = json.loads(html_data)
    # 获取视频标题
    videoTitle= re.findall('<title data-vue-meta="true">(.*?)</title>',response.text)[0]
    # 获取音频
    audioUrl = JsonData['data']['dash']['audio'][0]['baseUrl']
    # 获取视频
    videoUrl = JsonData['data']['dash']['video'][0]['baseUrl']
    # 封装视频信息
    videoInfo = {
        'videoTitle':videoTitle,
        'audioUrl':audioUrl,
        'videoUrl':videoUrl,
    }
    print("获取Response信息成功！")
    return videoInfo

""" 保存视频 """
def videoSave(fileName,audioUrl,videoUrl):
    # 获取音频和视频的二进制内容
    audioResponse = getResponse(audioUrl).content
    videoResponse = getResponse(videoUrl).content
    # 写入文件
    with open('./video/'+fileName+'.mp3',mode='wb') as f:
        f.write(audioResponse)
        f.close()
    with open('./video/'+fileName+'.mp4',mode='wb') as f:
        f.write(videoResponse)
        f.close()
    print("保存视频成功！")

""" 合并音频和视频 """
def AvMerge(Mp3Name,Mp4Name,savePath):
    print("开始合并音频和视频.........")
    video = VideoFileClip(Mp4Name)
    audio = AudioFileClip(Mp3Name)
    video_merge = video.set_audio(audio)
    video_merge.write_videofile(savePath)
    os.remove(Mp3Name)
    os.remove(Mp4Name)
    print("合并成功！")
def main():
    url = input("请输入B站视频url地址:")
    videoBaseUrl = 'D:\\desktop\\Code\\pythonCode\\B站视频爬取\\'
    videoInfo = parseResponse(url)
    videoSave(videoInfo['videoTitle'],videoInfo['audioUrl'],videoInfo['videoUrl'])
    fileName = videoInfo['videoTitle']
    AvMerge(videoBaseUrl+'video\\'+fileName+'.mp3',videoBaseUrl+'video\\'+fileName+'.mp4',videoBaseUrl+'\\video\\'+'merge'+fileName+'.mp4')
if __name__ == '__main__':
    main()