- 博客(22)
- 收藏
- 关注
原创 针对微调 LLM 的高准确率 MIA:SPV-MIA (NeurIPS 2024)
本文提出自校正概率波动成员推理攻击方法SPV-MIA,针对微调大语言模型的隐私泄露问题实现突破性进展。该研究通过自提示机制构建参考数据集(PDC模块)和概率变化指标(PVA模块)两大创新,首次在非过拟合场景下将攻击准确率提升至90%以上。实验表明,该方法在跨模型、跨数据集场景中保持稳定性能,且对差分隐私防御具有强鲁棒性。研究不仅改进了现有成员推理攻击框架,更为大语言模型遗忘学习领域的隐私评估提供了新范式。
2025-10-20 22:51:38
611
原创 快速入门LLM Unlearning: Large Language Model Unlearning明确设置、目标与评估体系 这篇文章就够了
摘要:字节跳动2024年论文《Large Language Model Unlearning》提出LLM遗忘技术框架,包含三大核心场景(移除有害输出、删除版权内容、减少幻觉)和三大优势(数据成本低、计算效率高、针对琵)。研究提出梯度上升+多损失协同优化方法,在仅用*mallfraction RL皇后计算时间的情况下,实现有害率的希望逾越 Conexión 7%、版权泄露率<1%、幻觉率降低70%。论文建立了LLM遗忘 boven的评估体系,但存在回复质量局限、复杂改写binary攻击鲁棒性不足等问题,
2025-10-15 23:06:39
877
原创 Tool Unlearning for Tool-Augmented LLMs 提出工具遗忘概念,LLM Unlearning 的细分场景,大模型遗忘下的MIA优化
本文提出首个针对工具增强型大型语言模型(Tool-Augmented LLMs)的工具遗忘(Tool Unlearning)方法TOOLDELETE,旨在安全移除特定工具(如废弃API)的使用能力。该方法通过工具知识删除(TKD)、知识保留(TKR)和通用能力保留(GCR)三大约束实现精准遗忘,并创新性地设计了LiRA-Tool评估方案,利用阴影样本验证工具功能的彻底移除。实验表明,TOOLDELETE在3个数据集上比传统方法显著提升遗忘效果(遗忘工具准确率降低9.8%),同时保留其他工具性能和通用能力。该
2025-10-13 22:25:48
1038
原创 SOUL:Second-Order UnLearning 基于动态迭代的二阶遗忘框架LLM 遗忘框架(优化器方向论文)
《SOUL: 解锁二阶优化在LLM遗忘中的潜力》提出了一种创新的大语言模型遗忘框架SOUL。该研究首次揭示了优化器选择对模型遗忘效果的关键影响,建立了二阶优化与影响函数遗忘之间的理论关联。通过将静态单步更新扩展为动态迭代过程,SOUL采用对角Hessian估计实现高效计算,在保持通用性的同时解决了传统方法收敛慢、效用易崩溃的问题。实验表明,SOUL在虚构遗忘、版权移除和模型去毒等任务中均显著优于一阶优化方法,实现了更快的收敛速度、更好的遗忘效果和更稳定的效用保持。
2025-10-11 19:12:32
840
原创 A Closer Look at Machine Unlearning for Large Language Models 提出新的评估体系+抗幻觉、防过度无知的遗忘策略
现有研究仅依赖 ROUGE评估遗忘效果,无法捕捉模型输出的多样性、语义一致性与事实正确性。论文提出3 个新增指标与2 个聚合指标。论文根据 “是否明确遗忘集的输出模板”,将现有遗忘方法分为untargeted and targeted两类,分别指出两类遗忘存在的问题,给出解决方案。
2025-10-10 16:08:54
907
原创 LLM unlearn:An embarrassingly simple approach to recover unlearned knowledge基于模块级显著性的大学习率遗忘框架(SURE)
《Does your LLM truly unlearn? An embarrassingly simple approach to recover unlearned knowledge》针对量化恢复知识的问题,论文设计了基于模块级显著性的大学习率遗忘框架(SURE),通过 “选择性权重更新” 平衡 “深度遗忘” 与 “效用保留”,解决了大学习率全量更新导致的效用下降和数据偏向问题。
2025-10-10 12:27:16
892
原创 操作系统课程设计:文件管理系统QTC++实现可视化界面 多目录多用户
构建一个多用户、多级目录结构的文件系统,该系统采用Qt Creator开发环境来设计用户友好的可视化界面。系统利用位图法直观地展示磁盘块的使用情况,并通过链接分配策略管理文件存储,确保每个文件都能在磁盘上找到其对应的物理位置。此外,系统采用树形结构来组织存储用户文件夹和账号信息,使得用户和文件的管理更加直观和有序。 block结构体来模拟磁盘文件,以此作为整个文件系统功能的基础。通过定义FAT(文件分配表)、INDEXES(文件详情索引节点)、MFD(账号文件夹)和TSD(树形文件目录)等结构体
2024-06-27 15:28:32
940
1
原创 【汇编语言】第三章微型计算机8086的结构 | 东北大学
东北大学2023年汇编语言笔记,根据教材和b站视频所整理(上课没听)。如果有校友有幸看到这篇文章,请提出宝贵的意见。共勉!
2023-03-26 23:20:04
403
原创 【C语言数据结构】选择排序:堆排序 | 直接(简单)选择排序(原理&完整代码)
【C语言数据结构笔记】选择排序:堆排序 | 直接(简单)选择排序(原理&完整代码)
2023-02-10 21:04:36
189
原创 【C语言数据结构】插入排序:直接插入排序 | 折半插入排序 | 希尔排序(原理和代码)
C语言数据结构笔记:插入排序部分,包括了 直接插入排序 | 折半插入排序 | 希尔排序的原理和代码
2023-02-10 12:56:51
228
原创 【C语言数据结构】最小生成树Kruskal(克鲁斯卡尔)算法 | 原理和代码
最小生成树Kruskal(克鲁斯卡尔)算法 | 原理和C语言完整代码,通过快速排序实现边的排序
2023-02-08 16:48:35
1193
原创 【C语言数据结构】快速排序(交换排序) | 原理+完整代码
快速排序(交换排序)的原理+完整代码,文章是我学习C语言数据结构的笔记,参考B站懒猫老师 &大话数据结构
2023-02-08 15:43:50
426
原创 【C语言数据结构】最小生成树Prim算法 | 原理和代码
【C语言数据结构课程】最小生成树Prim算法 | 包含了原理、代码和详细过程,是个人备考的笔记
2023-02-07 20:43:36
1041
1
原创 C语言数据结构二叉排序树的建立、插入、删除、查找操作(原理+完整代码)
C语言数据结构二叉排序树的建立、插入、删除、查找操作(原理+完整可运行代码)
2023-01-14 16:12:45
2668
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅