13、训练数据的获取与评估：打造高效AI助手的关键-优快云博客

在训练AI助手时，获取用户的实际话语是非常重要的。如果无法获取用户之前的发言，也可以通过一些方法了解他们可能会说的内容，其中模拟用户界面就是一种可行的方式。

如果无法获取生产数据，可以从模拟用户界面收集一些模拟数据。模拟用户界面是一个原型或虚拟界面，除了能够记录用户向助手提出的问题外，没有其他智能功能。它看起来（或听起来）像真实的界面，但并不理解用户的问题。

一个好的模拟用户界面应该具备以下特点：
- 向用户打招呼，并告知不会提供答案。
- 允许用户提问。
- 记录问题，并邀请用户提出更多问题。

在使用模拟用户界面时，要礼貌对待用户，仅向志愿者开放。不要让用户自行发现这是模拟界面，以免他们产生获得帮助的错误期望。可以通过电子邮件发送助手链接，或者在用户可选择参与的调查末尾包含该链接。

以下是模拟用户界面的操作流程：

graph LR
    A[介绍与邀请] --> B[用户提问]
    B --> C[记录问题]
    C --> D[邀请用户再提问]

不同的行动呼吁对收集问题的效果不同，如下表所示：
| 行动呼吁 | 有用性 | 原因 |
| — | — | — |
| “问我任何问题。” | 太模糊 | 会引来如“天气如何？”“讲个笑话”等离题问题，对训练助手没有帮助。 |
| “问我任何客户服务问题。” | 恰到好