自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 针对微调 LLM 的高准确率 MIA:SPV-MIA (NeurIPS 2024)

本文提出自校正概率波动成员推理攻击方法SPV-MIA,针对微调大语言模型的隐私泄露问题实现突破性进展。该研究通过自提示机制构建参考数据集(PDC模块)和概率变化指标(PVA模块)两大创新,首次在非过拟合场景下将攻击准确率提升至90%以上。实验表明,该方法在跨模型、跨数据集场景中保持稳定性能,且对差分隐私防御具有强鲁棒性。研究不仅改进了现有成员推理攻击框架,更为大语言模型遗忘学习领域的隐私评估提供了新范式。

2025-10-20 22:51:38 611

原创 快速入门LLM Unlearning: Large Language Model Unlearning明确设置、目标与评估体系 这篇文章就够了

摘要:字节跳动2024年论文《Large Language Model Unlearning》提出LLM遗忘技术框架,包含三大核心场景(移除有害输出、删除版权内容、减少幻觉)和三大优势(数据成本低、计算效率高、针对琵)。研究提出梯度上升+多损失协同优化方法,在仅用*mallfraction RL皇后计算时间的情况下,实现有害率的希望逾越 Conexión 7%、版权泄露率<1%、幻觉率降低70%。论文建立了LLM遗忘 boven的评估体系,但存在回复质量局限、复杂改写binary攻击鲁棒性不足等问题,

2025-10-15 23:06:39 877

原创 Tool Unlearning for Tool-Augmented LLMs 提出工具遗忘概念,LLM Unlearning 的细分场景,大模型遗忘下的MIA优化

本文提出首个针对工具增强型大型语言模型(Tool-Augmented LLMs)的工具遗忘(Tool Unlearning)方法TOOLDELETE,旨在安全移除特定工具(如废弃API)的使用能力。该方法通过工具知识删除(TKD)、知识保留(TKR)和通用能力保留(GCR)三大约束实现精准遗忘,并创新性地设计了LiRA-Tool评估方案,利用阴影样本验证工具功能的彻底移除。实验表明,TOOLDELETE在3个数据集上比传统方法显著提升遗忘效果(遗忘工具准确率降低9.8%),同时保留其他工具性能和通用能力。该

2025-10-13 22:25:48 1038

原创 SOUL:Second-Order UnLearning 基于动态迭代的二阶遗忘框架LLM 遗忘框架(优化器方向论文)

《SOUL: 解锁二阶优化在LLM遗忘中的潜力》提出了一种创新的大语言模型遗忘框架SOUL。该研究首次揭示了优化器选择对模型遗忘效果的关键影响,建立了二阶优化与影响函数遗忘之间的理论关联。通过将静态单步更新扩展为动态迭代过程,SOUL采用对角Hessian估计实现高效计算,在保持通用性的同时解决了传统方法收敛慢、效用易崩溃的问题。实验表明,SOUL在虚构遗忘、版权移除和模型去毒等任务中均显著优于一阶优化方法,实现了更快的收敛速度、更好的遗忘效果和更稳定的效用保持。

2025-10-11 19:12:32 840

原创 A Closer Look at Machine Unlearning for Large Language Models 提出新的评估体系+抗幻觉、防过度无知的遗忘策略

现有研究仅依赖 ROUGE评估遗忘效果,无法捕捉模型输出的多样性、语义一致性与事实正确性。论文提出3 个新增指标与2 个聚合指标。论文根据 “是否明确遗忘集的输出模板”,将现有遗忘方法分为untargeted and targeted两类,分别指出两类遗忘存在的问题,给出解决方案。

2025-10-10 16:08:54 907

原创 LLM unlearn:An embarrassingly simple approach to recover unlearned knowledge基于模块级显著性的大学习率遗忘框架(SURE)

《Does your LLM truly unlearn? An embarrassingly simple approach to recover unlearned knowledge》针对量化恢复知识的问题,论文设计了基于模块级显著性的大学习率遗忘框架(SURE),通过 “选择性权重更新” 平衡 “深度遗忘” 与 “效用保留”,解决了大学习率全量更新导致的效用下降和数据偏向问题。

2025-10-10 12:27:16 892

原创 操作系统课程设计:文件管理系统QTC++实现可视化界面 多目录多用户

构建一个多用户、多级目录结构的文件系统,该系统采用Qt Creator开发环境来设计用户友好的可视化界面。系统利用位图法直观地展示磁盘块的使用情况,并通过链接分配策略管理文件存储,确保每个文件都能在磁盘上找到其对应的物理位置。此外,系统采用树形结构来组织存储用户文件夹和账号信息,使得用户和文件的管理更加直观和有序。 block结构体来模拟磁盘文件,以此作为整个文件系统功能的基础。通过定义FAT(文件分配表)、INDEXES(文件详情索引节点)、MFD(账号文件夹)和TSD(树形文件目录)等结构体

2024-06-27 15:28:32 940 1

原创 东北大学2024软件工程期末考试回忆&复习指南

东北大学计算机学院软工工程期末复习指南

2024-05-16 17:27:26 1087 7

原创 生成markdown流程图文件的格式(语法)

生成markdown文件的格式。之前只能搜到md的语法,但是找不到生成文件的格式,记录一下。

2023-05-27 23:57:40 507 1

原创 【汇编语言】第三章微型计算机8086的结构 | 东北大学

东北大学2023年汇编语言笔记,根据教材和b站视频所整理(上课没听)。如果有校友有幸看到这篇文章,请提出宝贵的意见。共勉!

2023-03-26 23:20:04 403

原创 【C语言数据结构】冒泡排序

C语言数据结构笔记:冒泡排序,理论and 代码,适用于备考

2023-02-10 21:58:27 222

原创 【C语言数据结构】选择排序:堆排序 | 直接(简单)选择排序(原理&完整代码)

【C语言数据结构笔记】选择排序:堆排序 | 直接(简单)选择排序(原理&完整代码)

2023-02-10 21:04:36 189

原创 【C语言数据结构】插入排序:直接插入排序 | 折半插入排序 | 希尔排序(原理和代码)

C语言数据结构笔记:插入排序部分,包括了 直接插入排序 | 折半插入排序 | 希尔排序的原理和代码

2023-02-10 12:56:51 228

原创 【C语言数据结构】散列表(哈希表)原理和代码

散列表(哈希表)原理和C语言代码,作为备考数据结构课程笔记,后续会不断丰富

2023-02-09 21:26:06 1707

原创 【C语言数据结构】最小生成树Kruskal(克鲁斯卡尔)算法 | 原理和代码

最小生成树Kruskal(克鲁斯卡尔)算法 | 原理和C语言完整代码,通过快速排序实现边的排序

2023-02-08 16:48:35 1193

原创 【C语言数据结构】快速排序(交换排序) | 原理+完整代码

快速排序(交换排序)的原理+完整代码,文章是我学习C语言数据结构的笔记,参考B站懒猫老师 &大话数据结构

2023-02-08 15:43:50 426

原创 【C语言数据结构】最小生成树Prim算法 | 原理和代码

【C语言数据结构课程】最小生成树Prim算法 | 包含了原理、代码和详细过程,是个人备考的笔记

2023-02-07 20:43:36 1041 1

原创 线性查找、折半(二分)查找、分块查找(静态查找)原理+完整代码

静态查找部分:线性查找、折半(二分)查找、分块查找 原理+完整代码

2023-01-19 19:55:37 188

原创 C语言数据结构二叉排序树的建立、插入、删除、查找操作(原理+完整代码)

C语言数据结构二叉排序树的建立、插入、删除、查找操作(原理+完整可运行代码)

2023-01-14 16:12:45 2668

原创 C语言数据结构平衡二叉树(AVL树)原理和代码

二叉排序树(AVL树)的实现,包含代码和讲解

2023-01-14 13:21:01 386

原创 C语言数据结构先、中、后序线索化二叉树并输出(完整代码)

前序、中序、后序线索化二叉树+遍历,内涵可运行代码(我改了好久)、过程笔记

2023-01-12 20:55:13 835 3

原创 C语言数据结构二叉树的层序、先序、中序、后序遍历(完整代码)

C语言数据结构二叉树的层序、先序、中序、后序遍历

2023-01-06 17:26:05 1652 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除