自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【项目实训 10】构建基于Qlora的代码补全微调大模型

在于有限的硬件资源下,如何高效地处理一个包含15万条样本的大型代码数据集。通过结合 QLoRA技术与一种迭代式分块训练 (Iterative Chunk-based Training)策略,成功完成了这次微调任务。

2025-06-15 12:36:08 1118

原创 【项目实训 09】前端开发记录3——智能代码实现

本文旨在对鸿蒙智能编码系统中的“智能代码”模块进行一次全面的技术拆解。我们将深入其在 `views/CodeEditor.vue` 中的实现,详细介绍其核心与细节功能,重点阐述其设计思路与代码逻辑。

2025-06-15 11:56:29 887

原创 【项目实训 08】前端开发记录2——代码高亮实现

通过使用highlight.js库并封装为Vue组件,我们成功实现了代码高亮功能,支持多种编程语言(包括JavaScript、TypeScript、ArkTS、HTML、CSS等),提供了美观的代码显示效果。

2025-06-03 16:25:41 1227

原创 【项目实训 07】前端开发记录1

本次博客主要对HarmonySmartCoding项目前端开发进行记录,主要完成了项目前端框架的搭建工作。

2025-05-27 11:19:13 266

原创 【项目实训 06】Linux服务器非root用户cuda环境部署

在模型微调等AI任务中,CUDA加速至关重要。本文基于多次真实服务器环境下的安装实践,详细讲解非root用户完成CUDA 12.4和CUDNN的完整安装流程,涵盖版本选择、权限规避方案、环境配置等关键细节。

2025-05-18 17:23:09 1301

原创 【项目实训 05】从项目爬取到提示词生成

本文介绍了构建一个包含15万条数据的高质量代码补全数据集的过程。数据集构建包括项目爬取、数据清洗、代码分块和提示词生成等关键步骤。通过从GitHub和Gitee等平台爬取开源项目,进行数据清洗和代码分块,最终生成具有指导意义的提示词,成功构建了多样化的代码补全数据集。该数据集为代码补全模型的训练提供了坚实基础,未来将继续优化构建方法并开源共享,推动代码补全技术的发展。

2025-05-11 15:34:34 433

原创 【项目实训 04】代码分块实现

在代码补全模型的训练过程中,如何将原始代码拆分为有效的训练样本,是决定模型性能的关键因素。本文将深入解析一种支持多语言的动态代码分块算法,该算法能够根据不同编程语言的语法特征,智能地生成高质量的训练数据对。

2025-05-03 13:53:07 505

原创 【项目实训 03】代码补全训练数据集构建

为构建面向HarmonyOS开发者的智能代码补全工具,我们开发了自动化训练数据集生成系统。

2025-04-29 08:06:17 407

原创 【项目实训 02】Qlora微调

LoraConfig这个类中可以设置很多参数,但主要的参数没多少,简单讲一讲,感兴趣的同学可以直接看源码。task_type:模型类型:需要训练的模型层的名字,主要就是attention部分的层,不同的模型对应的层的名字不同,可以传入数组,也可以字符串,也可以正则表达式。rlora的秩,具体可以看Lora原理lora_alphaLora alaph,具体作用参见Lora原理Lora的缩放是啥嘞?当然不是r(秩),这个缩放就是, 在这个LoraConfig中缩放就是4倍。

2025-04-28 19:52:54 703

原创 【项目实训 01】Python爬虫基础

网络爬虫是一种自动化程序,用于从互联网上抓取和收集数据。它可以访问网页、下载内容,并根据预设的规则进行数据处理和存储。爬虫在搜索引擎、数据挖掘、市场研究等领域有着广泛的应用。

2025-04-19 11:24:19 1909

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除