m0_74289999-优快云博客

原创【项目实训 10】构建基于Qlora的代码补全微调大模型

在于有限的硬件资源下，如何高效地处理一个包含15万条样本的大型代码数据集。通过结合 QLoRA技术与一种迭代式分块训练 (Iterative Chunk-based Training)策略，成功完成了这次微调任务。

2025-06-15 12:36:08 1118

原创【项目实训 09】前端开发记录3——智能代码实现

本文旨在对鸿蒙智能编码系统中的“智能代码”模块进行一次全面的技术拆解。我们将深入其在 `views/CodeEditor.vue` 中的实现，详细介绍其核心与细节功能，重点阐述其设计思路与代码逻辑。

2025-06-15 11:56:29 887

原创【项目实训 08】前端开发记录2——代码高亮实现

通过使用highlight.js库并封装为Vue组件，我们成功实现了代码高亮功能，支持多种编程语言（包括JavaScript、TypeScript、ArkTS、HTML、CSS等），提供了美观的代码显示效果。

2025-06-03 16:25:41 1227

原创【项目实训 07】前端开发记录1

本次博客主要对HarmonySmartCoding项目前端开发进行记录，主要完成了项目前端框架的搭建工作。

2025-05-27 11:19:13 266

原创【项目实训 06】Linux服务器非root用户cuda环境部署

在模型微调等AI任务中，CUDA加速至关重要。本文基于多次真实服务器环境下的安装实践，详细讲解非root用户完成CUDA 12.4和CUDNN的完整安装流程，涵盖版本选择、权限规避方案、环境配置等关键细节。

2025-05-18 17:23:09 1301

原创【项目实训 05】从项目爬取到提示词生成

本文介绍了构建一个包含15万条数据的高质量代码补全数据集的过程。数据集构建包括项目爬取、数据清洗、代码分块和提示词生成等关键步骤。通过从GitHub和Gitee等平台爬取开源项目，进行数据清洗和代码分块，最终生成具有指导意义的提示词，成功构建了多样化的代码补全数据集。该数据集为代码补全模型的训练提供了坚实基础，未来将继续优化构建方法并开源共享，推动代码补全技术的发展。

2025-05-11 15:34:34 433

原创【项目实训 04】代码分块实现

在代码补全模型的训练过程中，如何将原始代码拆分为有效的训练样本，是决定模型性能的关键因素。本文将深入解析一种支持多语言的动态代码分块算法，该算法能够根据不同编程语言的语法特征，智能地生成高质量的训练数据对。

2025-05-03 13:53:07 505

原创【项目实训 03】代码补全训练数据集构建

为构建面向HarmonyOS开发者的智能代码补全工具，我们开发了自动化训练数据集生成系统。

2025-04-29 08:06:17 407

LoraConfig这个类中可以设置很多参数，但主要的参数没多少，简单讲一讲，感兴趣的同学可以直接看源码。task_type：模型类型：需要训练的模型层的名字，主要就是attention部分的层，不同的模型对应的层的名字不同，可以传入数组，也可以字符串，也可以正则表达式。rlora的秩，具体可以看Lora原理lora_alphaLora alaph，具体作用参见Lora原理Lora的缩放是啥嘞？当然不是r（秩），这个缩放就是, 在这个LoraConfig中缩放就是4倍。

2025-04-28 19:52:54 703

原创【项目实训 01】Python爬虫基础

网络爬虫是一种自动化程序，用于从互联网上抓取和收集数据。它可以访问网页、下载内容，并根据预设的规则进行数据处理和存储。爬虫在搜索引擎、数据挖掘、市场研究等领域有着广泛的应用。

2025-04-19 11:24:19 1909

m0_74289999的博客