11、构建成功的AI助手:指标与策略解析

构建成功的AI助手:指标与策略解析

1. 会话式AI的指标测量

在构建AI助手时,测量其性能指标至关重要。有些指标,AI平台会自动收集,而有些则需要我们通过编写代码来辅助测量。

1.1 可控性(Containment)测量

许多AI平台可以通用地测量可控性,特别是那些提供内置升级渠道集成的平台。转移或升级场景通常由单个对话节点处理,可控性可以通过计算访问该对话节点的次数除以总对话次数来衡量。

手动测量可控性的步骤如下:
1. 在代码中设置一个变量,表明对话不可控。
2. 正常响应用户,用户不会察觉该上下文变量。

通过这种方式,我们可以有效地测量会话式AI的可控性。

1.2 常见成功指标的测量方法

测量会话式AI的常见成功指标,通常只需要采取以下一种行动,也可根据平台进行组合:
- 记录哪些对话节点或对话响应与成功指标一致。
- 向对话中添加与事件相关的变量。
- 添加代码以向报告工具发送事件。

以下是常见会话式AI成功指标的测量方法:
| 指标 | 常见测量技术 |
| — | — |
| 可控性 | 定义转移或升级节点;设置可控状态变量;发送“对话开始”和“对话转移”事件。 |
| 解决时间 | 定义哪些对话节点等同于解决;计算对话开始到访问解决节点的时间;发送“对话开始”和“对话解决”事件。 |
| 净推荐值(NPS) | 设置数值调查结果的变量;发送带有NPS响应的事件。 |
| 覆盖率 | 定义回退或默认对话响应;发送“覆盖失败”和“覆盖成功”事件。 | <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值