大模型部署手记(4)MOSS+Jetson AGX Orin

本文介绍了如何在JetsonAGXOrin硬件上部署复旦大学的开源模型Moss,涉及代码下载、量化至int4、依赖安装及遇到的问题,如程序死机和GPU性能消耗。作者观察到Moss在处理速度上不如预期,但确认其具备一定能力。

1.简介

组织机构:复旦大学

代码仓:GitHub - OpenLMLab/MOSS: An open-source tool-augmented conversational language model from Fudan University

模型:fnlp/moss-moon-003-sft-int4

下载:https://huggingface.co/fnlp/moss-moon-003-sft-int4

硬件环境:Jetson AGX Orin

根据:

所以显然只能选择int4量化了。

2.代码和模型下载

登录Orin:

cd /home1/zhanghui

git clone https://github.com/OpenLMLab/MOSS.git

量化int4的模型地址:https://huggingface.co/fnlp/moss-moon-003-sft-int4

打开链接下载:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张小白TWO

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值