个性化抽取式摘要与共情对话生成技术解析
1. 个性化抽取式摘要
1.1 有趣文档选择方法
在个性化抽取式摘要中,有趣文档选择是重要的一步。相关变量定义如下表所示:
| 变量 | 定义 |
| — | — |
| (x_d^k) | 文档 (d_k) 是否被选中 |
| (y_d^{kl}) | 文档 (d_k) 和 (d_l) 是否都被选中 |
| (r_d^{kl}) | 文档 (d_k) 和 (d_l) 之间的相似度 |
| (N) | 最大选择文档数 |
| (D) | 文档 ID |
同时有以下约束条件:
- (\forall k,l : x_d^k \in {0, 1}, y_d^{kl} \in {0, 1})
- (\sum_{k \in D} x_d^k \leq N)
- (\forall k,l : y_d^{kl} - x_d^k \leq 0)
- (\forall k,l : y_d^{kl} - x_d^l \leq 0)
- (\forall k,l : x_d^k + x_d^l - y_d^{kl} \leq 1)
其中,(a_u^k) 是用户 (u) 对文档 (d_k) 主题的兴趣度,由兴趣估计器估计得出;(r_d^{kl}) 表示构成 (d_k) 和 (d_l) 的词袋之间的余弦相似度。
1.2 有趣句子提取
有趣句子提取旨在从选定的 (N) 篇文档中提取用户 (u) 可能感兴趣的句子,并在 (T) 秒内通过语音传输。该问题被表述为整数线性规划问题,目标函数
超级会员免费看
订阅专栏 解锁全文
1033

被折叠的 条评论
为什么被折叠?



