
FaceBook **(中文名:脸书)**近期发布了一个新的翻译模型 Seamless Communication,可实现跨语言实时"无缝"交流。
该模型可以保留跨语言的表达方式和复杂性(翻译时保留语音中的停顿和语速,以及声音风格和情绪基调),语音翻译延迟大概只有两秒。

项目介绍
Seamless Communication 是一款开源多语音、语言、翻译、转录大模型。其官方模型名称之为 SeamlessM4T。
Star:7k
项目地址:https://github.com/facebookresearch/seamless_communication

SeamlessM4T 模型支持以下任务:
-
语音到语音翻译 (S2ST)
-
语音到文本翻译 (S2TT)
-
文本到语音翻译 (T2ST)
-
文本到文本翻译 (T2TT)
-
自动语音识别 (ASR)
无缝表达
SeamlessExpressive

Facebook发布了SeamlessM4T,一款开源的多任务翻译模型,支持实时语音到语音和文本翻译,延迟低至两秒。该模型强调无缝交流体验,尤其在背景噪音和说话人变化的鲁棒性测试中表现出色。
最低0.47元/天 解锁文章
1226

被折叠的 条评论
为什么被折叠?



