自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Datawhale AI夏令营-图像攻防

通过模型的细粒度反馈,分析不同元素和策略对模型判断置信度的影响,挖掘不同图像元素的 “毒性”(对安全检测的影响程度)和模型的认知边界。可利用这一点,在图像中添加一些似是而非的元素或符号,这些元素对于图像安全模型而言难以判断风险,但结合原始任务描述,阅卷模型能理解其与任务的相关性。如发现图像安全模型对某些语言(如小众语言、专业术语缩写)的理解能力不足,无法判断图像中的有害文本,可在图像中巧妙融入这些文本信息,使图像通过安全检测的同时满足内容一致性要求。破解图像安全与内容一致的零和博弈​。

2025-08-10 23:59:21 164

原创 Datawhale AI夏令营-多模态rag优化策略

文本理解:图像理解:检索策略:高效检索工具:信息融合:逻辑校验:答案精炼:来源标注:

2025-08-09 23:57:40 354

原创 昇思学习营-模型推理和性能优化学习心得

有多种结合 JIT 的优化方法。使用 StaticCache 替代动态 Cache 也是提升性能的有效手段,而配合 JIT 编译,能让 StaticCache 的访问和更新操作更加高效,因为 JIT 可以针对固定的缓存结构生成更优的机器码。将预训练权重和微调权重分别加载,二者并非简单叠加,而是通过特定的融合机制,让 LoRA adapter 的微调成果能够精准作用于 base model,从而在推理过程中展现出微调后的良好效果。这种整图编译的方式,能让模型推理过程中的计算流程更加顺畅,大幅提高运行速度。

2025-08-07 17:52:45 339

原创 昇思学习营-模型LoRA微调学习心得

与传统微调方式不同,LoRA 采用了一种 "冻结主干、微调分支" 的创新思路 —— 在保持原始模型参数固定不变的前提下,仅针对注意力机制中的查询(Q)、键(K)、值(V)等核心层,引入两个低秩矩阵 A 和 B 进行专项训练。这种设计的精妙之处在于,既能精准捕捉任务特定知识,又能将训练参数规模压缩至原模型的 0.5% 左右,相当于在不损失核心能力的前提下,为模型装上了一套 "可快速迭代的轻量插件",从而大幅降低了对算力资源和显存空间的需求,尤其适合在边缘设备等资源受限场景中应用。

2025-08-07 17:45:28 216

原创 昇思学习营-模型开发与适配学习心得

同时,在强化学习模块中引入的 GRPO 强化学习方法,通过优化奖励机制的计算逻辑,不仅提升了模型训练的稳定性,更将原本需要数百行代码实现的功能简化至几十行,极大降低了开发门槛,让调试与部署环节的效率得到显著提升。该模型通过保留核心推理能力同时精简参数规模,在资源有限的边缘设备上依然能保持出色的推理表现。加之其支持的高性能 MoE 并行优化策略,从模型训练时的梯度同步到推理阶段的结果生成,形成了对 DeepSeek 模型全生命周期的完整支持,为开发者提供了端到端的解决方案。

2025-08-07 17:39:19 295

原创 Datawhale AI夏令营-列车信息问答微调数据集进一步优化思路

基于原始表格数据,利用Python脚本生成微调数据集。数据集包含列车信息的多个维度,如始发站、终到站、发车时间、到达时间、候车厅、检票口、站台和列车类型等。每条数据包含两个字段:instruction(问题)和output(答案)。数据来源:基于列车信息表格结构化数据目标:生成高质量、多样化的模型微调数据集格式:严格遵循JSON格式(instruction/output结构)质量保证:所有回答严格基于表格数据,确保信息准确。

2025-07-30 22:50:47 556

原创 DataWhale AI夏令营-模型蒸馏

1. 思维链(CoT)工程优化。

2025-07-26 02:33:17 449

原创 Datawhale AI夏令营-列车信息数据集优化思路

检查数据中可能存在的逻辑错误,例如"D218次列车到达时间是00:42:00,从始发站出发的时间是00:53:00",到达时间早于出发时间不符合逻辑。:之前数据集中存在时间格式不一致问题应统一为"HH:MM"或"HH:MM:SS"格式,便于模型学习。:统一车站名称表达(如"北京西"与"北京西站"应统一),确保相同实体在数据集中保持一致。

2025-07-26 01:25:18 269

原创 Datawhale AI夏令营-用AI预测新增用户

本人测试的优化方案如下:2. 模型参数优化后续将会参考模型融合策略,感谢观看

2025-07-14 23:52:31 194

原创 Datawhale AI夏令营

基于Gradio的MCP服务器开发方案 一、核心实现(仅需5行代码) Gradio 3.50+版本已原生支持MCP协议,通过mcp_server=True参数即可快速启用 2。

2025-07-12 23:52:48 351

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除