课程内容
课程地址:GitHub - InternLM/tutorial
第6节 OpenCompass 大模型评测
课程笔记
课后作业
基础作业
- 使用 OpenCompass 评测 InternLM2-Chat-7B 模型在 C-Eval 数据集上的性能
①OpenCompassi评测InterLM2-Chat-7B
(1)启动评测任务
(2)评测结果
进阶作业
- 使用 OpenCompass 评测 InternLM2-Chat-7B 模型使用 LMDeploy 0.2.0 部署后在 C-Eval 数据集上的性能
(1)编写`eval_ internlm_turbomind.py`和启动脚本
(2)评测结果