Adaptive Stress Testing Black-Box LLM Planners

文章主要内容

本文聚焦于大语言模型(LLMs)在规划任务中可能出现的幻觉问题,提出一种基于自适应压力测试(AST)和蒙特卡洛树搜索(MCTS)的黑箱检测方法,旨在系统评估LLMs在不同提示扰动下的鲁棒性,具体内容如下:

  1. 手动扰动案例研究:在自动驾驶场景中,通过手动调整提示中的传感器细节(如移除位置、速度信息)、添加噪声或随机化文本顺序,发现LLMs(如DeepSeek、Llama)的决策会因扰动而产生不一致,甚至出现幻觉行为(如生成不可行的变道动作)。
  2. 自适应压力测试框架:将提示扰动建模为MDP问题,利用MCTS搜索最优扰动策略,通过最大化LLMs输出的动作多样性(作为不确定性代理指标),自动发现导致模型高不确定性的场景和提示。
  3. 实验验证:在高速公路驾驶环境中,对Llama、Dolphin等开源LLMs进行离线压力测试,生成扰动树并分析模型敏感性。结果表明,AST能有效识别模型不可靠的场景,且离线分析可在运行时生成影响模型不确定性的提示,辅助实时信任评估。

文章创

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值