自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 opencompass简要使用说明

文件内容,指定评测模型和评测数据集。

2025-09-03 14:13:58 186

原创 lr_scheduler_type 学习率scheduler设置 退火

lr_scheduler_type 在llama factory和swift等大模型训练框架中都有这个参数,指定lr的变化方式。可以指定多种lr退火的训练策略。很多同学在llama factory和swift的包里找不到这个参数的详细设置。其实在transformers库里。

2025-05-20 09:44:20 870

原创 llamafactory lora_targets参数深入 可分别对vit、llm和llama pro进行lora

vlm模型都可以灵活指定VIT和LLM里的哪些模块进行lora,或者只对LLM或VIT的其一进行lora,以及对llama pro拓展的block里指定模块进行lora。通过以下patch_target_modules函数指定需要lora的模块名,设置LoraConfig,通过peft进行lora model初始化。lora_targets 参数挺灵活的,可以指定不同的模块进行lora,包括linear、conv和embedding。llama pro拓展的block同样可以指定模块进行lora。

2025-05-17 18:21:35 775

原创 vLLM 采样策略-top-k,top-p,temperature

看了网上很多帖子,感觉对采样策略的top-k,top-p,temperature的采样顺序讲的不太清楚,有的讲得还不太对。看了vLLM(0.7.3)的源码,做个记录。核心总结:先temperature scaling,再top-k,再top-p。top-p前后各进行了一次softmax。其中提醒下,temperature scaling的先后顺序其实对top-k没有影响,因为top-k只考虑相对顺序。

2025-05-16 11:41:57 1010

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除