python系列&deep_study系列：【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能...

坦笑&&life

已于 2024-07-07 12:12:43 修改

阅读量1.2k

点赞数 26

CC 4.0 BY-SA版权

分类专栏： # python 文章标签：人工智能 whisper

于 2024-07-07 12:10:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_54626591/article/details/140243910

python 专栏收录该内容

333 篇文章 ¥99.90 ¥299.90

订阅专栏

【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能...

【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能.

【AI工具篇】使用OpenAI开源的Whisper模型，制作本地离线的视频或音频转文本功能.

有时候在看一些学习视频时候，难免感觉进度太慢，或者学习视频太枯燥，想自己根据视频关键信息做总结或快速浏览，想着如果有一个工具，我把视频丢进去，它自己给我生成里面语音的所有文本的信息，然后我自己根据文本来提炼关键的有用的信息，还可以节约看视频的时间，是不是会很Nice? 于是，前一天经过一位小伙伴的推荐，使用一款OpenAI开源的模型，也就是今天的主角——Whisper，来实现我们的上面这个偷懒的功能。

首先，去hugging face网上下载对应的模型，该模型分为几个不同的档次，可以根据自己的电脑配置要求来。例如，显卡显存、或者内存。如果使用CPU计算，可以使用内存，不过准确度会降低；如果使用显卡计算，就会提高很多准确度。同时，模型对显存需求越大，也代表精确越高。

模型下载地址：https://huggingface.co/ggerganov/whisper.cpp

在这里插入图片描述
选择模型版本，根据自己需要选择。我的电脑是

了解本专栏

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

坦笑&&life 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。