
图片拍摄于2024年4月13日 18:56分,拍摄于林芝市布江达县上空飞机上
记录一下游玩的工具,有需要的朋友可以自取,玩的太多,主要为了留个痕~!
本周游玩项目
Hunyuan3D-2.1
网址:https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1
在线体验:https://huggingface.co/spaces/tencent/Hunyuan3D-2.1
这个模型能直接将图片的物品生成3D效果的,而且还可以导入其他的3D软件里面去用,虽然我不是这方面专业的,不过这个还是有很多使用场景的。生成出来的效果也很惊艳。


Hunyuan-A13B
网址:https://github.com/Tencent-Hunyuan/Hunyuan-A13B
腾讯新开源的这个模型确实不错的,整体的能力在一众模型勉强也都是够用的,而且他的尺寸还非常小,只有130亿参数,确实如腾讯所说:参数越大=AI越强?这个「常识」,被打破了。
不过这个模型想要商用,感觉在本地还是挺挑资源的,使用vllm部署,要求cuda12.8以上,其他的兼容性还不知道,等待在测试结果多一些吧。

CosyVoice2.0
网址:https://www.modelscope.cn/models/iic/CosyVoice2-0.5B
演示:https://funaudiollm.github.io/cosyvoice2
整合包:夸克网盘分享
之前1.0版本的时候其实这个项目就已经很强了,那天没事又看了一眼,这个模型已经更新到2.0版本了,听起来声音有小的变化,整体感觉不是特别的明显。官方说的是新版本提供了更准确、更稳定、更快和更好的语音生成能力。大家自己试试吧。
社区还有大佬做了整合包一键运行,大家可以自己下载然后在本地进行尝试。

695

被折叠的 条评论
为什么被折叠?



