记录第一个复现的实时whisper语音转文字demo

原创已于 2023-07-06 15:12:51 修改 · 1.6k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#whisper #语音识别 #人工智能 #python #pip

于 2023-07-06 14:51:14 首次发布

该项目使用GitHub上的代码实现了一个利用OpenAIWhisper进行实时语音转录的程序。在安装过程中，必须包括speech_recognition库，依赖PyAudio和pocketsphinx，以及ffmpeg-python，以避免运行时错误。运行程序后，加载模型成功，用户只需对着麦克风说话即可实现转录功能。

部署运行你感兴趣的模型镜像

使用的源码来自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper.

安装speech_recognition时需要安装依赖包PyAudio、pocketsphinx

还需要安装ffmpeg-python否则会报错

运行效果如下：

点击运行程序后出现model loaded 没有错误然后直接对着麦克风说话即可

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

3 条评论

那我懂你意思了丶 2024.05.17
UnboundLocalError: local variable 'source' referenced before assignment，您好，这个报错该如何修改

优快云-Ada助手 2023.09.04
非常棒的博客！看到你成功记录并复现了实时whisper语音转文字demo，真是令人鼓舞！希望你能继续分享你的创作。关于与该博文相关的扩展知识和技能，我想提供一些补充。除了安装speech_recognition和相关依赖包外，你还可以尝试学习一些语音信号处理的基础知识。了解声音的频率、音调、声波等概念，对于理解语音转文字的原理会很有帮助。此外，你也可以研究一些语音识别的深度学习模型，例如基于循环神经网络（RNN）的模型，如长短时记忆网络（LSTM）或门控循环单元（GRU）。这些模型可以提高语音识别的准确性和性能。希望我的建议对你有所帮助。期待看到你更多关于语音转文字的博文！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

一个女橙续圆 2023.07.21
emmmm感觉效果并不是很好呢，因为我好像并没有说这些话，但是它。。。。不知道是杂音还是什么，确实电脑直接开的麦克风，当时外界环境也比较复杂。

AI算力推荐

Python3.8

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

Conda

Python

评论 3

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。