【阿尼亚探索大模型】书生大模型实战营-进阶岛第3关(L2G3000)LMDeploy 量化部署进阶实践

任务类型任务内容
基础任务使用结合W4A16量化与kv cache量化的internlm2_5-1_8b-chat模型封装本地API并与大模型进行一次对话
基础任务使用Function call功能让大模型完成一次简单的"加"与"乘"函数调用,作业截图需包括大模型回复的工具调用情况

一、配置LMDeploy环境

依然选择30%A100开发机进行实验。

使用conda创建虚拟环境。

启动对应虚拟环境,并安装所需依赖包,完成环境配置。

二、LMDeploy与InternLM2.5

1.设置最大kv cache缓存大小

2.设置在线 kv cache int4/int8 量化

3.W4A16 模型量化和部署

4.W4A16 量化+ KV cache+KV cache 量化

三、LMDeploy之FastAPI与Function call

1.FastAPI开发

2. Function call

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱波吉的阿尼亚

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值