银行交易聚类与聊天机器人情感分析技术研究
引言
在当今数字化时代,数据处理和分析变得至关重要。在银行领域,对交易数据的有效聚类可以用于反洗钱、欺诈检测等多个方面;而在人工智能领域,开发能够识别用户情绪的聊天机器人是一个具有挑战性的问题。本文将探讨银行交易聚类的相关方法以及聊天机器人情感分析的技术。
银行交易聚类
- 交易相似性分析 :通过图表,我们可以根据交易上下文的相似性来判断哪些类型的交易更为相似。当两个词之间的距离较小时,意味着它们出现在相似的上下文中。
- 段落自身相似性评估 :
- 在DV - DSR中,由于将原始段落压缩为固定大小的向量,会丢失一些数据。从训练集中选取样本,使用Doc2Vec模型找到与输入样本最相似的样本,结果显示,样本与自身最相似的比例为0.82%。
- 而在WV - DSR中,由于其段落表示方式,每个段落与自身是最相似的,无需进行此项评估。
- 最近邻相似长度分析 :为了进行比较,我们使用两种不同的表示方法计算了100个样本的最近邻。测试样本的长度分布与训练集相似,使用欧几里得距离作为相似性度量。比较原始样本、WV - DSR最近邻和DV - DSR最近邻的序列长度,结果如下表所示:
| 样本类型 | 平均长度 |
| — | — |
| 100个样本 | 25.56 |
| DV - DSR最近邻 | 18.51 |
| WV - DSR最近邻 | 26
超级会员免费看
订阅专栏 解锁全文
26

被折叠的 条评论
为什么被折叠?



