自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

golfxiao的专栏

擅长设计高性能、可扩展、结构优良的软件，并致力于在编程领域宏扬工匠精神。

沉下心来学鲁班

优快云认证博客专家优快云认证企业博客

码龄17年

分布式系统下多条件分页查询方法专利发明者

141: 原创

1593: 周排名

1万+: 总排名

19万+: 访问

: 等级

3670: 积分

5184: 粉丝

2199: 获赞

43: 评论

2099: 收藏

私信

关注

热门文章

分类专栏

最新评论

vLLM&cuda安装笔记
DrChaoz: 可以试一下用docker
vLLM&cuda安装笔记
Starck.: 我现在用5070Ti，本地装的是2.7的torch和12.8的cuda，而vllm的文档支持是12.1版本，就用不了。
带你从零认识语言模型
沉下心来学鲁班: 需要计算的，应该当时写的时候给漏了，感谢指出。
欺诈文本分类微调（六）：Lora单卡训练
weixin_61275285: up主，在预处理函数preprocess中，有一处代码不明白： 1.为什么input_ids后面加[tokenizer.pad_token_id]，attention_mask + [1]；以及labels后面加+ [tokenizer.pad_token_id] 原代码如下： input_ids = instruction["input_ids"] + response["input_ids"] + [tokenizer.pad_token_id] attention_mask = instruction["attention_mask"] + response["attention_mask"] + [1] # -100是一个特殊的标记，用于指示指令部分的token不应参与损失计算 labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] + [tokenizer.pad_token_id]
欺诈文本分类微调（一）：基座模型选型
weixin_61275285: 谢谢博主

最新文章

微调实战项目

文章平均质量分 95

为了帮助更多初学者从零开始掌握模型微调这一关键技能，作者以实际工作中完整跑通的实战项目为基础，写成了这个微调系列教程，该教程附带数据集和可运行的jupyter notebook，适合想要通过项目实战来掌握微调技术的初学者。

文章数：21 文章阅读量：32766 文章收藏量：423

作者: 沉下心来学鲁班

擅长设计高性能、可扩展、结构优良的软件，并致力于在编程领域宏扬工匠精神。

展开