【2025版】一文带你了解开源模型，从零基础到精通，精通收藏这篇就够了！

最新推荐文章于 2025-07-13 10:30:00 发布

原创最新推荐文章于 2025-07-13 10:30:00 发布 · 1.3k 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #大模型 #计算机 #开源模型推荐 #LLM #开源 #大模型应用

程序员同时被 3 个专栏收录

2049 篇文章

订阅专栏

大模型

408 篇文章

订阅专栏

开发语言

97 篇文章

订阅专栏

给大家分享一个效果很棒的文本转语音开源模型：MaskGCT！这是由港中大（深圳）联手趣丸科技联合推出了新一代大规模声音克隆。

与先有的文本转语音模型相比，MaskGCT 生成的语音更自然、更连贯。而且这个开源模型，支持控制生成的语音的总长度、语速、停顿、预期等特征。可以修改已经生成的语音或者支持声音克隆。

话不多少，直接点开下面视频看看效果。

01 音色模仿

可以点开如下视频听听声音模仿的效果，预期、停顿、音色还原的都非常好

PS：请忽略背景中 dangdang 的杂音，是我在录制的时候我家猫在扒柜子

02 模拟情绪

可以通过声音来辨别人目前处于何种情绪状态，比如愤怒、开心、恐惧等。MaskGCT 对此也实现了精准模拟，请看如下这个例子。

03 模仿说话风格

咖喱味儿、大舌头的发音，也能精确模拟。

04 MaskGCT 的架构

MaskGCT（Masked Generative Codec Transformer）的全新非自回归式（NAR）文本到语音（TTS）模型。MaskGCT 的设计旨在解决传统自回归（AR）和非自回归（NAR）TTS系统的不足之处。

MaskGCT采用了两阶段架构：第一阶段模型使用文本预测从语音自监督学习模型中提取的语义 tokens；第二阶段则在语义 tokens 的条件下生成声学 tokens。

MaskGCT 能够实现在没有对齐监督的情况下，可以直接合成出高质量的语音。

支持语音内容编辑，借助遮罩与预测机制，通过对语义tokens的部分遮罩，MaskGCT可以实现零样本语音内容编辑。

能够语音转换，MaskGCT支持零样本语音转换，能够根据参考音频将源语音转换为目标语音的音色，而保持语义内容不变。

05 相关地址

你可以通过如下链接访问论文、上方视频中的案例展示、下载模型、自己进行 Demo 展示。



Git：https://github.com/open\-mmlab/Amphion/tree/main/models/tts/maskgct  
项目主页：https://maskgct.github.io/  
论文链接：https://arxiv.org/abs/2409.00750  
Demo：https://huggingface.co/spaces/amphion/maskgct

模型下载：https://huggingface.co/amphion/maskgct

**历史盘点**

逛逛 GitHub 每天推荐一个好玩有趣的开源项目。历史推荐的开源项目已经收录到 GitHub 项目，欢迎 Star：

地址：https://github.com/Wechat-ggGitHub/Awesome-GitHub-Repo


![](https://mmbiz.qpic.cn/mmbiz_png/ePw3ZeGRruzicgHPfCeAsrkT2JZwiaOF05zRiaXr2dUukXKGk8CJwfrXALKJ5l0fLpV2abibCYKb7d8B7vNp2u3iccg/640?wx_fmt=other&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp)  

* * *

推荐阅读

_1._ [GitHub 上有什么好玩的项目？](http://mp.weixin.qq.com/s?__biz=MzUxNjg4NDEzNA==&mid=2247498662&idx=1&sn=0087c4f3b79ba3420e917e9b42d45eda&chksm=f9a2286fced5a1794eb9a73d0be7c2e16eaceabf3a0420647c40cb4202bd116d9a15dd57c008&scene=21#wechat_redirect)

_2._ [推荐 5 个本周很火的 GitHub 项目](http://mp.weixin.qq.com/s?__biz=MzUxNjg4NDEzNA==&mid=2247515984&idx=1&sn=25df81d1db8d41bbc6e25faa105d63ee&chksm=f9a26c99ced5e58fc0cf66d6a9f91d3a88da2baebbb3cb5cd4cd25a5fd79902e929ee7aa9455&scene=21#wechat_redirect)

_3._ [推荐 5 个近期火火火的 GitHub 项目](http://mp.weixin.qq.com/s?__biz=MzUxNjg4NDEzNA==&mid=2247515963&idx=1&sn=830b3604e4328273564e46f238b6543f&chksm=f9a26cf2ced5e5e4e630c23df70206103c18dda2c3813b5c190b0a3914ba8e947bfda1847275&scene=21#wechat_redirect)

_4._  [推荐 5 个令人惊艳的 GitHub 项目](http://mp.weixin.qq.com/s?__biz=MzUxNjg4NDEzNA==&mid=2247515918&idx=1&sn=42c6a11d315dbe7bd95fda37a6ffa8fc&chksm=f9a26cc7ced5e5d11ca1a79dfe785e4e88e6dc9bff5e4f8fcc00be6001861d151443f0eb1bdc&scene=21#wechat_redirect)

![](https://mmbiz.qpic.cn/mmbiz_png/ePw3ZeGRruxW7LMX2Iz5DfjRIbFTS7UROhxibBmicicT0HpjIh1yniaJJibSnLFuicMHRx5NEdiaOh2OOACfr6MvR38ibQ/640?wx_fmt=other&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp)