Maxi.Trinsloye-优快云博客

原创 Datawhale AI夏令营-图像攻防

通过模型的细粒度反馈，分析不同元素和策略对模型判断置信度的影响，挖掘不同图像元素的 “毒性”（对安全检测的影响程度）和模型的认知边界。可利用这一点，在图像中添加一些似是而非的元素或符号，这些元素对于图像安全模型而言难以判断风险，但结合原始任务描述，阅卷模型能理解其与任务的相关性。如发现图像安全模型对某些语言（如小众语言、专业术语缩写）的理解能力不足，无法判断图像中的有害文本，可在图像中巧妙融入这些文本信息，使图像通过安全检测的同时满足内容一致性要求。破解图像安全与内容一致的零和博弈。

2025-08-10 23:59:21 164

原创 Datawhale AI夏令营-多模态rag优化策略

文本理解：图像理解：检索策略：高效检索工具：信息融合：逻辑校验：答案精炼：来源标注：

2025-08-09 23:57:40 354

原创昇思学习营-模型推理和性能优化学习心得

有多种结合 JIT 的优化方法。使用 StaticCache 替代动态 Cache 也是提升性能的有效手段，而配合 JIT 编译，能让 StaticCache 的访问和更新操作更加高效，因为 JIT 可以针对固定的缓存结构生成更优的机器码。将预训练权重和微调权重分别加载，二者并非简单叠加，而是通过特定的融合机制，让 LoRA adapter 的微调成果能够精准作用于 base model，从而在推理过程中展现出微调后的良好效果。这种整图编译的方式，能让模型推理过程中的计算流程更加顺畅，大幅提高运行速度。

2025-08-07 17:52:45 339

原创昇思学习营-模型LoRA微调学习心得

与传统微调方式不同，LoRA 采用了一种 "冻结主干、微调分支" 的创新思路 —— 在保持原始模型参数固定不变的前提下，仅针对注意力机制中的查询（Q）、键（K）、值（V）等核心层，引入两个低秩矩阵 A 和 B 进行专项训练。这种设计的精妙之处在于，既能精准捕捉任务特定知识，又能将训练参数规模压缩至原模型的 0.5% 左右，相当于在不损失核心能力的前提下，为模型装上了一套 "可快速迭代的轻量插件"，从而大幅降低了对算力资源和显存空间的需求，尤其适合在边缘设备等资源受限场景中应用。

2025-08-07 17:45:28 216

原创昇思学习营-模型开发与适配学习心得

同时，在强化学习模块中引入的 GRPO 强化学习方法，通过优化奖励机制的计算逻辑，不仅提升了模型训练的稳定性，更将原本需要数百行代码实现的功能简化至几十行，极大降低了开发门槛，让调试与部署环节的效率得到显著提升。该模型通过保留核心推理能力同时精简参数规模，在资源有限的边缘设备上依然能保持出色的推理表现。加之其支持的高性能 MoE 并行优化策略，从模型训练时的梯度同步到推理阶段的结果生成，形成了对 DeepSeek 模型全生命周期的完整支持，为开发者提供了端到端的解决方案。

2025-08-07 17:39:19 295

原创 Datawhale AI夏令营-列车信息问答微调数据集进一步优化思路

基于原始表格数据，利用Python脚本生成微调数据集。数据集包含列车信息的多个维度，如始发站、终到站、发车时间、到达时间、候车厅、检票口、站台和列车类型等。每条数据包含两个字段：instruction（问题）和output（答案）。数据来源：基于列车信息表格结构化数据目标：生成高质量、多样化的模型微调数据集格式：严格遵循JSON格式（instruction/output结构）质量保证：所有回答严格基于表格数据，确保信息准确。

2025-07-30 22:50:47 556

原创 DataWhale AI夏令营-模型蒸馏

1. 思维链(CoT)工程优化。

2025-07-26 02:33:17 449

原创 Datawhale AI夏令营-列车信息数据集优化思路

检查数据中可能存在的逻辑错误，例如"D218次列车到达时间是00:42:00，从始发站出发的时间是00:53:00"，到达时间早于出发时间不符合逻辑。：之前数据集中存在时间格式不一致问题应统一为"HH:MM"或"HH:MM:SS"格式，便于模型学习。：统一车站名称表达（如"北京西"与"北京西站"应统一），确保相同实体在数据集中保持一致。

2025-07-26 01:25:18 269

原创 Datawhale AI夏令营-用AI预测新增用户

本人测试的优化方案如下：2. 模型参数优化后续将会参考模型融合策略，感谢观看

2025-07-14 23:52:31 194

原创 Datawhale AI夏令营

基于Gradio的MCP服务器开发方案一、核心实现（仅需5行代码） Gradio 3.50+版本已原生支持MCP协议，通过mcp_server=True参数即可快速启用 2。

2025-07-12 23:52:48 351

BriziMackinhos的博客