1.简介
组织机构:复旦大学
模型:fnlp/moss-moon-003-sft-int4
下载:https://huggingface.co/fnlp/moss-moon-003-sft-int4
硬件环境:Jetson AGX Orin
根据:

所以显然只能选择int4量化了。
2.代码和模型下载
登录Orin:
cd /home1/zhanghui
git clone https://github.com/OpenLMLab/MOSS.git

量化int4的模型地址:https://huggingface.co/fnlp/moss-moon-003-sft-int4

打开链接下载:

本文介绍了如何在JetsonAGXOrin硬件上部署复旦大学的开源模型Moss,涉及代码下载、量化至int4、依赖安装及遇到的问题,如程序死机和GPU性能消耗。作者观察到Moss在处理速度上不如预期,但确认其具备一定能力。
最低0.47元/天 解锁文章
1072

被折叠的 条评论
为什么被折叠?



