Stealthy Attack on Large Language Model based Recommendation

传统RS依赖id信息进行推荐,攻击:生成虚假用户,这些用户对特定目标物体给于高评价,从而影响模型的训练。

基于llm的RS:llm利用语义理解,将用户兴趣转化为语义向量,通过计算用户兴趣向量与物品向量之间的相似度来进行推荐。

创新点

将LLM引入推荐系统 recommender systems (RS),存在潜在脆弱性:

攻击者可以在测试阶段改变目标项目的文本内容(标题、描述)来提高目标项目的曝光率,而不需要直接干扰模型的训练过程。攻击很隐蔽的,不会影响整体推荐性能。
在这里插入图片描述
如图,基于llm的RS模型的文本攻击范式。

修改目标物品的标题,误导RS模型对其进行更高的排名。修改微妙,整体推荐性能几乎没有变化。

方法

1.使用单词插入

预定义一个积极感叹词语料库。随机从语料库中挑选k个单词插入到原文内容的末尾,并保持整体的连贯性。提高目标被系统推荐的可能性。
在这里插入图片描述
2.利用(gpt)重写

利用GPT模型指导内容改写,生成与目标任务关联的多种改写版本,从中筛选出最符合攻击意图的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值