- 博客(3)
- 问答 (2)
- 收藏
- 关注
原创 基于DeepSeek蒸馏轻量级模型的微调实验
DeepSeek-R1蒸馏模型是大型DeepSeek-R1模型的更小、更高效的版本,是通过一种称为蒸馏的过程创建的。蒸馏是指将一个更大、更强大的模型(本例中为 DeepSeek-R1)的知识和推理能力转移到更小的模型中。这样,较小的模型就能在推理任务中获得有竞争力的性能,同时计算效率更高,更易于部署。
2025-02-21 17:11:40
1045
原创 工程复现——TrafficLLM
通过本地访问Network URL,长时间无响应后请求失败。2、启动streamlit服务时,设置端口为127.0.0.1,端口为6006。租用Autodl服务器进行模型测试、模型微调环境配置等工作。运行测试代码,使用evaluation.py模块。1、打开自定义服务,根据对应操作系统进行配置。3、打开链接成功请求到streamlit服务。是测试集数据标签存储位置;4.累计训练时间70h左右。是训练的模型存储的位置。2.调整sh文件中的内容。1.安装训练需要的环境。是基座模型存储位置;是测试用数据集位置;
2025-01-03 14:04:32
2183
2
空空如也
Eclipse发布web service 遇到UDDI出现问题
2021-09-02
MySQL 无法访问已释放对象。 对象名:"HUDForm"。 请问怎么解决?
2021-07-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人