智能问答系统与谣言控制策略
1. 智能问答系统
1.1 用户声誉计算
在问答系统中,当问题不在现有问题池中时,为避免问题无人解答,系统需将问题转发给最有可能提供满意答案的用户。用户声誉的计算结合了直接信任和聚合信任两种类型:
- 聚合信任 :基于用户答案被关注者接受而获得的声誉。初始值为 0,答案获得一个赞时增加 50,获得一个踩时减少 10。点赞和踩的用户声誉也会相应改变,点赞加 5,踩减 1。
- 直接信任 :基于过去的交互来预测用户给出满意答案的可能性。
计算用户声誉后,选择声誉表顶部的用户转发问题,也可将问题转发给近期最有可能在线的用户。频繁回答时间通过计算每小时内回答的答案数量来确定。
1.2 实验结果
1.2.1 多项式朴素贝叶斯实验
对多项式朴素贝叶斯算法进行了有和没有 TF - IDF 缩放的实验,并将词袋与提取的代码特征进行拼接重复该过程,结果如下:
| 实验条件 | 准确率 |
| — | — |
| 有 TF - IDF | 0.90 |
| 无 TF - IDF | 0.82 |
实验还发现,无 TF - IDF 的多项式朴素贝叶斯的 AUC 比有 TF - IDF 的更大。
1.2.2 神经网络实验
使用一些特征工程和自然语言处理技术,训练了一个神经网络,仅根据问题的标题和内容对 Stack Overflow 上的问题进行分类,精确率、召回率和 F1 分数约为 0.93。
<