训练数据的获取与评估:打造高效AI助手的关键
1. 寻找训练数据
在训练AI助手时,获取用户的实际话语是非常重要的。如果无法获取用户之前的发言,也可以通过一些方法了解他们可能会说的内容,其中模拟用户界面就是一种可行的方式。
2. 模拟用户界面
如果无法获取生产数据,可以从模拟用户界面收集一些模拟数据。模拟用户界面是一个原型或虚拟界面,除了能够记录用户向助手提出的问题外,没有其他智能功能。它看起来(或听起来)像真实的界面,但并不理解用户的问题。
一个好的模拟用户界面应该具备以下特点:
- 向用户打招呼,并告知不会提供答案。
- 允许用户提问。
- 记录问题,并邀请用户提出更多问题。
在使用模拟用户界面时,要礼貌对待用户,仅向志愿者开放。不要让用户自行发现这是模拟界面,以免他们产生获得帮助的错误期望。可以通过电子邮件发送助手链接,或者在用户可选择参与的调查末尾包含该链接。
以下是模拟用户界面的操作流程:
graph LR
A[介绍与邀请] --> B[用户提问]
B --> C[记录问题]
C --> D[邀请用户再提问]
不同的行动呼吁对收集问题的效果不同,如下表所示:
| 行动呼吁 | 有用性 | 原因 |
| — | — | — |
| “问我任何问题。” | 太模糊 | 会引来如“天气如何?”“讲个笑话”等离题问题,对训练助手没有帮助。 |
| “问我任何客户服务问题。” | 恰到好
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



