标星 65.4 万,3 个 yyds 的 GitHub 开源项目 !

部署运行你感兴趣的模型镜像

嗨喽!GitHub科技的各位小伙伴们,由于公众号做了乱序推送改版,为了保证公众号的推文能够第一时间及时送达到大家手上,大家记得将公众号 加星标置顶 ,公众号每天会送上几个GitHub开源项目给大家学习 !

2149856f1a44361399834825d7a1306d.jpeg

1

   

数字人开源项目Fay

Fay是一个集成了语言模型和数字字符的开源数字人类框架。它为不同的应用程序提供零售、助手和代理版本,如虚拟购物指南、广播、助手、服务员、教师和基于语音或文本的移动助手。

开发人员可以利用该项目简单地构建各种类型的数字人或数字助理。该项目各模块之间耦合度非常低,包括声音来源、语音识别、情绪分析、NLP处理、情绪语音合成、语音输出和表情动作输出等模块。每个模块都可以轻松地更换。

https://github.com/xszyou/Fay

b3182648855902ab8ab313a087c7d0f2.png

8de266594d33a50abf3fb2bccd10bfba.png

2

   

ChatTTS语音克隆

ChatTTS是一款神奇工具,能让你的文字像人一样说话,而且听起来自然真实。这个工具适合用在需要语音合成的场景,比如智能助手、客服机器人,甚至是让你的文章或故事开口说话。

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。

亮点:

  • 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。

  • 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。

  • 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。

https://github.com/2noise/ChatTTS

6d8c00047cba2cd192e762d702d87a1d.png

3

   

开源对话语言模型MOSS

MOSS是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。

https://github.com/OpenMOSS/MOSS

51c7c2d09a361365d47f5de0ab378780.png

7a7dcf190ce5f05ef6f9f6b8103bc0d4.png

--完--



读到这里说明你喜欢本公众号的文章,欢迎 置顶(标星)本公众号 GitHub科技,这样就可以第一时间获取推送了~
在本公众号,后台回复:666 ,领取一份国内最顶级的 GitHub 开源项目排行榜单 !
推荐阅读
1. 15 款 GitHub 开源项目,太强了 !
2. 9 个值得收藏的 GitHub 开源项目,给力!
3. 12 个 优质的 GitHub 开源项目,偷偷分享 !
4. 15 款大受欢迎的 GitHub 开源项目 ,必须推荐 !

觉得内容还不错的话,给我点个“在看”呗

您可能感兴趣的与本文相关的镜像

HunyuanVideo-Foley

HunyuanVideo-Foley

语音合成

HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值