- 博客(5)
- 收藏
- 关注
转载 大模型微调实战(二):训练数据集准备的艺术与科学
在上一篇文章中,我们详细讲解了如何利用ModelScope Swift框架对Qwen2.5-Coder模型进行微调,打造了一个TA404前端开发助手。然而,微调过程中最具挑战性的部分其实是训练数据集的设计与准备。事实上,数据集的质量往往比模型结构更能决定最终的效果。经过一段时间的实践和思考,我总结出了一套更系统化的数据集准备方法论,希望能够帮助正在探索大模型微调的开发者们少走弯路。大模型微调的数据集准备是一门融合了艺术与科学的技艺。
2025-07-12 16:37:15
6
转载 强化学习框架:OpenRLHF源码解读,模型处理
本文主要介绍了在OpenRLHF中模型框架设计,主要分为3类模型:1、;2、;3、这三类模型中分别起到作用:1、直接更具prompt输出response;2、输出token的评分(3、返回整句输出评分(找出最后一个有效 token 的索引,然后从 value 向量中提取该位置的值作为 reward。原创作者: Big-Yellow转载于: https://www.cnblogs.com/Big-Yellow/p/18841821。
2025-06-07 18:12:28
9
转载 汉文博士词典编译配置文件概述
合集 - 词典制作(1)1.汉文博士词典编译配置文件概述11-09收起概述《汉文博士》允许使用者自己编写词典文件。本文简要讲述了词典编译过程和相关配置文件的编写方法。读者需具备XML和正则表达式的基础知识。词典编译器《汉文博士》的词典编译器可在“文件”菜单中点击“词典编译器”调出。编译前,需点击“加载”按钮指定配置文件。选定配置文件后,将自动填写输出位置。点击编译按钮后,将编译词典,并...
2024-11-11 02:48:16
52
转载 python qthread 判断线程执行结束
我整理的一些关于【状态图】的项目学习资料(附讲解~~)和大家一起分享、学习一下:https://d.51cto.com/bLN8S1Python QThread 线程管理与结束判断在现代软件开发中,多线程编程是提升应用性能和用户体验的重要技术手段。Python中,特别是使用PyQt库时,QThread线程的管理与控制尤...
2024-08-13 04:10:13
295
转载 jquery 读取xpath
jQuery 读取 XPath:新手教程作为一名刚入行的开发者,你可能听说过 jQuery,但可能对如何使用 jQuery 来读取 XPath 还不太熟悉。别担心,这篇文章将带你一步步了解如何实现这一功能。流程概览首先,让我们通过一个简单的流程图来了解整个过程:#render_12_1084455825-svg{f...
2024-07-30 03:33:50
211
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人