嗨喽!GitHub科技的各位小伙伴们,由于公众号做了乱序推送改版,为了保证公众号的推文能够第一时间及时送达到大家手上,大家记得将公众号 加星标置顶 ,公众号每天会送上几个GitHub开源项目给大家学习 !

1
数字人开源项目Fay
Fay是一个集成了语言模型和数字字符的开源数字人类框架。它为不同的应用程序提供零售、助手和代理版本,如虚拟购物指南、广播、助手、服务员、教师和基于语音或文本的移动助手。
开发人员可以利用该项目简单地构建各种类型的数字人或数字助理。该项目各模块之间耦合度非常低,包括声音来源、语音识别、情绪分析、NLP处理、情绪语音合成、语音输出和表情动作输出等模块。每个模块都可以轻松地更换。
https://github.com/xszyou/Fay


2
ChatTTS语音克隆
ChatTTS是一款神奇工具,能让你的文字像人一样说话,而且听起来自然真实。这个工具适合用在需要语音合成的场景,比如智能助手、客服机器人,甚至是让你的文章或故事开口说话。
ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。
亮点:
对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
https://github.com/2noise/ChatTTS

3
开源对话语言模型MOSS
MOSS是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。
https://github.com/OpenMOSS/MOSS


--完--
读到这里说明你喜欢本公众号的文章,欢迎 置顶(标星)本公众号 GitHub科技,这样就可以第一时间获取推送了~
在本公众号,后台回复:666 ,领取一份国内最顶级的 GitHub 开源项目排行榜单 !
推荐阅读
1. 15 款 GitHub 开源项目,太强了 !
2. 9 个值得收藏的 GitHub 开源项目,给力!
3. 12 个 优质的 GitHub 开源项目,偷偷分享 !
4. 15 款大受欢迎的 GitHub 开源项目 ,必须推荐 !
觉得内容还不错的话,给我点个“在看”呗
20万+

被折叠的 条评论
为什么被折叠?



