项目实训
文章平均质量分 83
项目实训记录
m0_74289999
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【项目实训 10】构建基于Qlora的代码补全微调大模型
在于有限的硬件资源下,如何高效地处理一个包含15万条样本的大型代码数据集。通过结合 QLoRA技术与一种迭代式分块训练 (Iterative Chunk-based Training)策略,成功完成了这次微调任务。原创 2025-06-15 12:36:08 · 1121 阅读 · 0 评论 -
【项目实训 09】前端开发记录3——智能代码实现
本文旨在对鸿蒙智能编码系统中的“智能代码”模块进行一次全面的技术拆解。我们将深入其在 `views/CodeEditor.vue` 中的实现,详细介绍其核心与细节功能,重点阐述其设计思路与代码逻辑。原创 2025-06-15 11:56:29 · 890 阅读 · 0 评论 -
【项目实训 08】前端开发记录2——代码高亮实现
通过使用highlight.js库并封装为Vue组件,我们成功实现了代码高亮功能,支持多种编程语言(包括JavaScript、TypeScript、ArkTS、HTML、CSS等),提供了美观的代码显示效果。原创 2025-06-03 16:25:41 · 1231 阅读 · 0 评论 -
【项目实训 07】前端开发记录1
本次博客主要对HarmonySmartCoding项目前端开发进行记录,主要完成了项目前端框架的搭建工作。原创 2025-05-27 11:19:13 · 269 阅读 · 0 评论 -
【项目实训 06】Linux服务器非root用户cuda环境部署
在模型微调等AI任务中,CUDA加速至关重要。本文基于多次真实服务器环境下的安装实践,详细讲解非root用户完成CUDA 12.4和CUDNN的完整安装流程,涵盖版本选择、权限规避方案、环境配置等关键细节。原创 2025-05-18 17:23:09 · 1309 阅读 · 0 评论 -
【项目实训 05】从项目爬取到提示词生成
本文介绍了构建一个包含15万条数据的高质量代码补全数据集的过程。数据集构建包括项目爬取、数据清洗、代码分块和提示词生成等关键步骤。通过从GitHub和Gitee等平台爬取开源项目,进行数据清洗和代码分块,最终生成具有指导意义的提示词,成功构建了多样化的代码补全数据集。该数据集为代码补全模型的训练提供了坚实基础,未来将继续优化构建方法并开源共享,推动代码补全技术的发展。原创 2025-05-11 15:34:34 · 436 阅读 · 0 评论 -
【项目实训 04】代码分块实现
在代码补全模型的训练过程中,如何将原始代码拆分为有效的训练样本,是决定模型性能的关键因素。本文将深入解析一种支持多语言的动态代码分块算法,该算法能够根据不同编程语言的语法特征,智能地生成高质量的训练数据对。原创 2025-05-03 13:53:07 · 507 阅读 · 0 评论 -
【项目实训 03】代码补全训练数据集构建
为构建面向HarmonyOS开发者的智能代码补全工具,我们开发了自动化训练数据集生成系统。原创 2025-04-29 08:06:17 · 414 阅读 · 0 评论 -
【项目实训 02】Qlora微调
LoraConfig这个类中可以设置很多参数,但主要的参数没多少,简单讲一讲,感兴趣的同学可以直接看源码。task_type:模型类型:需要训练的模型层的名字,主要就是attention部分的层,不同的模型对应的层的名字不同,可以传入数组,也可以字符串,也可以正则表达式。rlora的秩,具体可以看Lora原理lora_alphaLora alaph,具体作用参见Lora原理Lora的缩放是啥嘞?当然不是r(秩),这个缩放就是, 在这个LoraConfig中缩放就是4倍。原创 2025-04-28 19:52:54 · 711 阅读 · 0 评论 -
【项目实训 01】Python爬虫基础
网络爬虫是一种自动化程序,用于从互联网上抓取和收集数据。它可以访问网页、下载内容,并根据预设的规则进行数据处理和存储。爬虫在搜索引擎、数据挖掘、市场研究等领域有着广泛的应用。原创 2025-04-19 11:24:19 · 1916 阅读 · 0 评论
分享