如何设计 Prompt 以充分发挥大语言模型（LLM）的性能？

最新推荐文章于 2025-11-25 11:33:13 发布

原创最新推荐文章于 2025-11-25 11:33:13 发布 · 283 阅读

CC 4.0 BY-SA版权

文章标签：

当然可以，这段内容我可以为你改成更口语化、亲切易懂的风格，适合用作讲稿、分享文章或者面向非专业开发者的教学材料。下面是润色后的版本：

在开发基于大语言模型的应用时，有一个千万不能忽略的大坑：那就是——它有时候会“编造”知识，听起来特别真，但其实是假的。

这类情况，我们一般叫它“幻觉（Hallucination）”。

说白了，模型并不像人类那样真正“知道”某件事，它只是通过概率预测什么内容应该出现。所以，即使它“看起来懂”，其实是在“猜”。如果你问它一个并不存在的东西，它可能不会说“不知道”，反而会一本正经地瞎编，还编得挺像那么回事。

我们问它：“告诉我华为公司生产的 GT Watch 运动手表的相关信息。”

注意，这个品牌是存在的，但这个“GT Watch”运动款其实根本不存在。

结果模型是怎么回答的呢？你看👇：

华为GT Watch是一款智能手表，具有精致的外观、1.39英寸AMOLED高清屏、多种运动监测功能、血氧和心率监测、蓝牙连接、消息推送、长续航，还支持NFC和音乐播放……

你是不是都快信了？是不是感觉这手表还挺好用？

但实际上，这些都是模型“瞎编”的。没有真实的产品信息作支撑，它就是根据“GT Watch”几个词+华为这个品牌的惯常风格“猜”出这么一段话来。

这，就是典型的幻觉现象。

当然能用，但开发者一定要有这个意识：模型有时候是“装懂”，不是“真懂”。

我们可以通过一些技巧尽量减少这种问题的出现，比如：

这样做的好处是：让模型“有所依赖”地回答，而不是自己随便发挥。

目前像 OpenAI、Google 等大公司都在研究如何减少幻觉。技术层面有一些改进，比如：

但说实话，幻觉问题短时间内还没法彻底解决。所以在它还“爱胡说”的阶段，我们做应用的开发者就更要“小心使用”。

你可能注意到：我们在代码块或文字中用了很多反斜杠 \，主要是为了让文本在小屏设备上好看些，并不是代表换行。

如果你用的是 GPT-3，它对换行（\n）没啥反应。但其他模型（特别是没训练太好的），换行可能会影响理解效果，所以你在开发时要特别注意 Prompt 格式的控制。

幻觉问题很“迷”，但更“迷”的是你没意识到它存在。

所以：

幻觉这事，说到底就是一句话：你得知道模型什么时候在“认真回答”，什么时候在“编故事”。