Stealthy Attack on Large Language Model based Recommendation

最新推荐文章于 2026-01-07 10:31:23 发布

原创

最新推荐文章于 2026-01-07 10:31:23 发布 · 598 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#语言模型 #人工智能 #自然语言处理

传统RS依赖id信息进行推荐，攻击：生成虚假用户，这些用户对特定目标物体给于高评价，从而影响模型的训练。

基于llm的RS：llm利用语义理解，将用户兴趣转化为语义向量，通过计算用户兴趣向量与物品向量之间的相似度来进行推荐。

创新点

将LLM引入推荐系统 recommender systems (RS)，存在潜在脆弱性：

攻击者可以在测试阶段改变目标项目的文本内容（标题、描述）来提高目标项目的曝光率，而不需要直接干扰模型的训练过程。攻击很隐蔽的，不会影响整体推荐性能。
在这里插入图片描述
如图，基于llm的RS模型的文本攻击范式。

修改目标物品的标题，误导RS模型对其进行更高的排名。修改微妙，整体推荐性能几乎没有变化。

方法

1.使用单词插入

预定义一个积极感叹词语料库。随机从语料库中挑选k个单词插入到原文内容的末尾，并保持整体的连贯性。提高目标被系统推荐的可能性。
在这里插入图片描述
2.利用（gpt）重写

利用GPT模型指导内容改写，生成与目标任务关联的多种改写版本，从中筛选出最符合攻击意图的结果。
在这里插入图片描述

文本攻击的主要组成部分

1.目标函数：用来评估最合适的文本扰动，作为搜索方法识别最优解的依据。

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。