基础作业
- 使用 OpenCompass 评测 InternLM2-Chat-7B 模型在 C-Eval 数据集上的性能
使用Opencompass评测,输出结果的csv文件截图如下
进阶作业
- 使用 OpenCompass 评测 InternLM2-Chat-7B 模型使用 LMDeploy 0.2.0 部署后在 C-Eval 数据集上的性能
在完成本作业时,发现lmdeploy0.2.0部署InternLM2-Chat-7B会报错。还是改用0.1.0版本。
我使用lmdeploy部署上一章节里的量化后的模型(w4a16+kvcache),结果如下:可以看到相比于上面的评测结果,部分数据集下降了,部分升高了。