用 Python 轻松将懂车帝视频转换为文本

最新推荐文章于 2024-07-08 22:17:38 发布

Python 技术

最新推荐文章于 2024-07-08 22:17:38 发布

阅读量1.4k

点赞数 1

CC 4.0 BY-SA版权

文章标签： python 音视频 ffmpeg 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_48923393/article/details/128017169

本文介绍了如何使用Python结合FFmpeg和百度API将懂车帝的视频转换为文本。首先，通过moviepy和pydub模块提取并分割视频中的音频，然后利用百度的语音识别API将16k采样率、16bit位深、单声道的音频转换成文字。文中详细讲解了每个步骤，包括下载视频、音频转换、安装FFmpeg以及使用Python脚本调用百度接口的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文 | 派森酱

来源：Python 技术「ID: pythonall」

最近在懂车帝收藏了一些感兴趣的视频，希望能整理出文字稿

观看视频，做笔记时遇到一个问题，需要反复一段一段的去看视频，再手敲整理笔记。想着有没有可以免费的转换工具或者软件，结果很多在线网站都需要登录注册，甚至收费。

这些网站或免费工具都没听过，如果是病毒或不靠谱，就显得浪费时间。

借助api的方式可以尝试，我们画图，先讲一讲该方法的实现思路吧！

流程图

从视频中提取音频可以使用moviepy模块。

由于百度API最多只支持60秒长度的音频，所以还需要使用pydub对音频文件进行切割，然后分段进行文字转换。

所以从视频到文字的大概流程应该是这样的：

❝
在音频提取过程中还要对音频的采样率、声道数、码率进行设置，同时指定输出音频格式。语法格式：ffmpeg -y -i voice.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 voice.pcm

关于语音转文

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。