自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 利用Python与Whisper革新视频翻译:打造高精度字幕翻译流程。

比如添加GPT-SoVITS的声音克隆,文本转语音功能,让原本说英文的视频,让他直接说中文也是可以实现的,就是感觉会很麻烦。需要注意,分离出来的音频可能会存在背景音,没有背景音的可以直接识别音频。步骤二,处理好音频后就是直接使用Whisper来实现语音转文字的效果。其中的.srt就是视频字幕文件,它的格式是这样的,有编号,有时间。1.对于个人讲解的教程类视频翻译非常的完美,准确度非常高。这是无限的钱,下一个在我当地的沃尔玛买盛宴酒吧的人,上面只是实现了翻译的流程,并没有处理其他的问题。

2024-05-06 17:43:31 1548 2

原创 Whisper开源免费的语音识别:OpenAI如何用AI改变字幕制作与语音理解的未来!

OpenAI在2022年底至2023年初期间发布了Whisper这一项目,它是一个深度学习模型,专为语音识别和翻译任务设计。Whisper不仅支持多种语言(共98种),还声称其英语语音识别的准确性达到了人类水平,这使得它成为一个引人注目的技术突破。

2024-05-06 17:36:18 1488

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除