第五课[lmdeploy]作业 +第六课[OpenCompass评测]作业

本文介绍了如何通过API_server进行基础部署,并演示了如何利用curl工具转发端口提交内容,以完成第六课的基础作业任务。

第五课基础作业

如下图,采用api_server部署,并转发端口通过curl提交内容。
在这里插入图片描述

在这里插入图片描述

第六课基础作业

在这里插入图片描述
完了捏?

### 使用 OpenCompass 评测自定义模型的性能 为了评估自定义模型在 OpenCompass 上的表现,可以通过以下方法实现完整的配置和测试流程: #### 环境搭建 首先需要创建并激活适合运行 OpenCompass 的 Python 虚拟环境。推荐使用 `conda` 工具来管理依赖项[^4]。 执行如下命令完成环境初始化: ```bash conda create -n opencompass python=3.10 conda activate opencompass git clone -b 0.3.3 https://github.com/open-compass/opencompass.git cd opencompass pip install -e . pip install -r requirements.txt ``` 如果计划集成特定后端(如 LMDeploy 或 VLLM),需额外安装对应的扩展包[^5]: ```bash pip install "opencompass[lmdeploy]" pip install "opencompass[vllm]" ``` 对于基于 API 接口的服务化模型,则应引入 `opencompass[api]` 扩展模块。 --- #### 配置自定义模型 OpenCompass 支持多种类型的模型接入方式,包括但不限于 Hugging Face Transformers 和其他框架下的预训练语言模型。 ##### 方法一:本地加载权重文件 当拥有目标模型的具体参数文件时,可将其路径指定给 OpenCompass 并设置相应的推理引擎。例如,在 YAML 文件中描述模型信息如下所示[^4]: ```yaml model: type: 'custom_model' # 替换为实际名称 path: '/path/to/your/model' peft_path: null # 如果适用 PEFT 技术,请填写对应适配器地址 tokenizer_name_or_path: '/path/to/tokenizer' max_seq_len: 2048 # 可调整最大序列长度以适应具体需求 ``` ##### 方法二:API 模式调用远程服务 若无法直接访问模型权重而仅能通过 RESTful API 获取预测结果,则按照官方文档说明启用 API 模式[^5]。此时需提供 URL 地址以及必要的认证令牌等附加选项。 --- #### 构建评测任务 根据待测能力范围选取合适的评测集合与度量标准。OpenCompass 内置丰富的公开基准库覆盖多个领域方向[^3],同时也允许导入私有数据源作为补充材料。 ###### 常见评估指标及其应用场景 | **Evaluator 类型** | **核心功能** | **典型关联数据集** | |-------------------|----------------------------------|----------------------------| | ACCEvaluator | 计算分类准确性 | AGIEval, ARC | | EMEvaluator | 统计完全匹配比例 | DROP, CLUE_CMRC | 用户可根据业务特点灵活组合不同维度形成综合性报告。 --- #### 启动评测过程 最终一步便是触发整个流水线操作。假设已准备好所有前置条件之后,只需简单运行脚本即可自动化完成全部环节: ```bash python run.py config.yaml ``` 此处 `config.yaml` 应包含前述提到的所有必要字段定义。 --- ### 注意事项 在整个过程中务必注意版本兼容性和资源分配合理性等问题以免引发异常状况发生。另外考虑到某些特殊情况下可能存在数据泄露风险因此建议审慎对待敏感素材处理逻辑设计。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

早上真好

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值