Python爬取视频(其实是一篇福利)

程序员老华

于 2022-12-27 16:31:23 发布

阅读量941

点赞数

文章标签： python 开发语言爬虫音视频 Graphviz

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_72557783/article/details/128458048

版权

本文介绍了如何使用Python进行视频流式下载，通过requests库设置stream=True实现，并利用contextlib.closing确保连接释放。在下载过程中，通过控制文件写入避免占用过多内存，并通过创建类实现批量下载。最后，提出了多线程下载的思路，提示读者自行探索队列和url生产方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

下载流式文件，requests库中请求的stream设为True就可以啦。

先找一个视频地址试验一下：

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

# -*- coding: utf-8 -*-

import requests

def download_file(url, path):

with requests.get(url, stream=True) as r:

chunk_size = 1024

content_size = int(r.headers['content-length'])

print '下载开始'

with open(path, "wb") as f:

for chunk in r.iter_content(chunk_size=chunk_size):

f.write(chunk)

if __name__ == '__main__':

url = '就在原帖...'

path = '想存哪都行'

download_file(url, path)

遭遇当头一棒：

1	`AttributeError: __exit__`

这文档也会骗人的么！

看样子是没有实现上下文需要的__exit__方法。既然只是为了保证要让r最后close以释放连接池，那就使用contextlib的closing特性好了：

1

2

3

4

5

6

7

8

9

10

11

12

# -*- coding: utf-8 -*-

import requests

from contextlib import closing

def download_file(url, path):

with closing(requests.get(url, stream=True)) as r:

chunk_size = 1024

content_size = int(r.headers['content-length'])

print '下载开始'

with open(path, "wb") as f:

for chunk in r.iter_content(chunk_size=chunk_size):

f.write(chunk)

程序正常运行了，不过我盯着这文件，怎么大小不见变啊，到底是完成了多少了呢？还是要让下好的内容及时存进硬盘，还能省点内存是不是：

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

# -*- coding: utf-8 -*-

import requests

from contextlib import closing

import os

def download_file(url, path):

with closing(requests.get(url, stream=True)) as r:

chunk_size = 1024

content_size = int(r.headers['content-length'])

print '下载开始'

with

最低0.47元/天解锁文章

程序员老华

博客等级

码龄3年

237
原创

309
点赞

2203
收藏

255
粉丝

关注

私信

热门文章

上一篇：: python爬虫之PyQuery的基本使用

下一篇：: 浅尝辄止 Parallel Python

最新评论

Python中的循环结构
2401_89639220: Python中循环结构有哪些以及它们的基本特点是什么？
Python中的循环结构
2401_89639220: Python中循环结构有哪些以及特点是什么？
Python中logging日志模块详解
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
Graphviz 安装并使用 (Python)
DorisLuck: 请问解决了嘛，处理方案是什么呀
Graphviz 安装并使用 (Python)
m0_63197505: 在anaconda prompt 子环境conda install graphviz的步骤可能要改为conda install python-graphviz

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。