- 博客(10)
- 收藏
- 关注
原创 【项目实训 10】构建基于Qlora的代码补全微调大模型
在于有限的硬件资源下,如何高效地处理一个包含15万条样本的大型代码数据集。通过结合 QLoRA技术与一种迭代式分块训练 (Iterative Chunk-based Training)策略,成功完成了这次微调任务。
2025-06-15 12:36:08
1118
原创 【项目实训 09】前端开发记录3——智能代码实现
本文旨在对鸿蒙智能编码系统中的“智能代码”模块进行一次全面的技术拆解。我们将深入其在 `views/CodeEditor.vue` 中的实现,详细介绍其核心与细节功能,重点阐述其设计思路与代码逻辑。
2025-06-15 11:56:29
887
原创 【项目实训 08】前端开发记录2——代码高亮实现
通过使用highlight.js库并封装为Vue组件,我们成功实现了代码高亮功能,支持多种编程语言(包括JavaScript、TypeScript、ArkTS、HTML、CSS等),提供了美观的代码显示效果。
2025-06-03 16:25:41
1227
原创 【项目实训 06】Linux服务器非root用户cuda环境部署
在模型微调等AI任务中,CUDA加速至关重要。本文基于多次真实服务器环境下的安装实践,详细讲解非root用户完成CUDA 12.4和CUDNN的完整安装流程,涵盖版本选择、权限规避方案、环境配置等关键细节。
2025-05-18 17:23:09
1301
原创 【项目实训 05】从项目爬取到提示词生成
本文介绍了构建一个包含15万条数据的高质量代码补全数据集的过程。数据集构建包括项目爬取、数据清洗、代码分块和提示词生成等关键步骤。通过从GitHub和Gitee等平台爬取开源项目,进行数据清洗和代码分块,最终生成具有指导意义的提示词,成功构建了多样化的代码补全数据集。该数据集为代码补全模型的训练提供了坚实基础,未来将继续优化构建方法并开源共享,推动代码补全技术的发展。
2025-05-11 15:34:34
433
原创 【项目实训 04】代码分块实现
在代码补全模型的训练过程中,如何将原始代码拆分为有效的训练样本,是决定模型性能的关键因素。本文将深入解析一种支持多语言的动态代码分块算法,该算法能够根据不同编程语言的语法特征,智能地生成高质量的训练数据对。
2025-05-03 13:53:07
505
原创 【项目实训 02】Qlora微调
LoraConfig这个类中可以设置很多参数,但主要的参数没多少,简单讲一讲,感兴趣的同学可以直接看源码。task_type:模型类型:需要训练的模型层的名字,主要就是attention部分的层,不同的模型对应的层的名字不同,可以传入数组,也可以字符串,也可以正则表达式。rlora的秩,具体可以看Lora原理lora_alphaLora alaph,具体作用参见Lora原理Lora的缩放是啥嘞?当然不是r(秩),这个缩放就是, 在这个LoraConfig中缩放就是4倍。
2025-04-28 19:52:54
703
原创 【项目实训 01】Python爬虫基础
网络爬虫是一种自动化程序,用于从互联网上抓取和收集数据。它可以访问网页、下载内容,并根据预设的规则进行数据处理和存储。爬虫在搜索引擎、数据挖掘、市场研究等领域有着广泛的应用。
2025-04-19 11:24:19
1909
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅