自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 问答 (2)
  • 收藏
  • 关注

原创 基于DeepSeek蒸馏轻量级模型的微调实验

DeepSeek-R1蒸馏模型是大型DeepSeek-R1模型的更小、更高效的版本,是通过一种称为蒸馏的过程创建的。蒸馏是指将一个更大、更强大的模型(本例中为 DeepSeek-R1)的知识和推理能力转移到更小的模型中。这样,较小的模型就能在推理任务中获得有竞争力的性能,同时计算效率更高,更易于部署。

2025-02-21 17:11:40 1045

原创 arXiv行业论文文献跟踪

arXiv使用指南

2025-01-07 17:09:22 238

原创 工程复现——TrafficLLM

通过本地访问Network URL,长时间无响应后请求失败。2、启动streamlit服务时,设置端口为127.0.0.1,端口为6006。租用Autodl服务器进行模型测试、模型微调环境配置等工作。运行测试代码,使用evaluation.py模块。1、打开自定义服务,根据对应操作系统进行配置。3、打开链接成功请求到streamlit服务。是测试集数据标签存储位置;4.累计训练时间70h左右。是训练的模型存储的位置。2.调整sh文件中的内容。1.安装训练需要的环境。是基座模型存储位置;是测试用数据集位置;

2025-01-03 14:04:32 2183 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除