- 博客(10)
- 收藏
- 关注
原创 Datawhale AI夏令营-图像攻防
通过模型的细粒度反馈,分析不同元素和策略对模型判断置信度的影响,挖掘不同图像元素的 “毒性”(对安全检测的影响程度)和模型的认知边界。可利用这一点,在图像中添加一些似是而非的元素或符号,这些元素对于图像安全模型而言难以判断风险,但结合原始任务描述,阅卷模型能理解其与任务的相关性。如发现图像安全模型对某些语言(如小众语言、专业术语缩写)的理解能力不足,无法判断图像中的有害文本,可在图像中巧妙融入这些文本信息,使图像通过安全检测的同时满足内容一致性要求。破解图像安全与内容一致的零和博弈。
2025-08-10 23:59:21
164
原创 昇思学习营-模型推理和性能优化学习心得
有多种结合 JIT 的优化方法。使用 StaticCache 替代动态 Cache 也是提升性能的有效手段,而配合 JIT 编译,能让 StaticCache 的访问和更新操作更加高效,因为 JIT 可以针对固定的缓存结构生成更优的机器码。将预训练权重和微调权重分别加载,二者并非简单叠加,而是通过特定的融合机制,让 LoRA adapter 的微调成果能够精准作用于 base model,从而在推理过程中展现出微调后的良好效果。这种整图编译的方式,能让模型推理过程中的计算流程更加顺畅,大幅提高运行速度。
2025-08-07 17:52:45
339
原创 昇思学习营-模型LoRA微调学习心得
与传统微调方式不同,LoRA 采用了一种 "冻结主干、微调分支" 的创新思路 —— 在保持原始模型参数固定不变的前提下,仅针对注意力机制中的查询(Q)、键(K)、值(V)等核心层,引入两个低秩矩阵 A 和 B 进行专项训练。这种设计的精妙之处在于,既能精准捕捉任务特定知识,又能将训练参数规模压缩至原模型的 0.5% 左右,相当于在不损失核心能力的前提下,为模型装上了一套 "可快速迭代的轻量插件",从而大幅降低了对算力资源和显存空间的需求,尤其适合在边缘设备等资源受限场景中应用。
2025-08-07 17:45:28
216
原创 昇思学习营-模型开发与适配学习心得
同时,在强化学习模块中引入的 GRPO 强化学习方法,通过优化奖励机制的计算逻辑,不仅提升了模型训练的稳定性,更将原本需要数百行代码实现的功能简化至几十行,极大降低了开发门槛,让调试与部署环节的效率得到显著提升。该模型通过保留核心推理能力同时精简参数规模,在资源有限的边缘设备上依然能保持出色的推理表现。加之其支持的高性能 MoE 并行优化策略,从模型训练时的梯度同步到推理阶段的结果生成,形成了对 DeepSeek 模型全生命周期的完整支持,为开发者提供了端到端的解决方案。
2025-08-07 17:39:19
295
原创 Datawhale AI夏令营-列车信息问答微调数据集进一步优化思路
基于原始表格数据,利用Python脚本生成微调数据集。数据集包含列车信息的多个维度,如始发站、终到站、发车时间、到达时间、候车厅、检票口、站台和列车类型等。每条数据包含两个字段:instruction(问题)和output(答案)。数据来源:基于列车信息表格结构化数据目标:生成高质量、多样化的模型微调数据集格式:严格遵循JSON格式(instruction/output结构)质量保证:所有回答严格基于表格数据,确保信息准确。
2025-07-30 22:50:47
556
原创 Datawhale AI夏令营-列车信息数据集优化思路
检查数据中可能存在的逻辑错误,例如"D218次列车到达时间是00:42:00,从始发站出发的时间是00:53:00",到达时间早于出发时间不符合逻辑。:之前数据集中存在时间格式不一致问题应统一为"HH:MM"或"HH:MM:SS"格式,便于模型学习。:统一车站名称表达(如"北京西"与"北京西站"应统一),确保相同实体在数据集中保持一致。
2025-07-26 01:25:18
269
原创 Datawhale AI夏令营
基于Gradio的MCP服务器开发方案 一、核心实现(仅需5行代码) Gradio 3.50+版本已原生支持MCP协议,通过mcp_server=True参数即可快速启用 2。
2025-07-12 23:52:48
351
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅