小说段落分割与分类算法的优化与并行实现
在自然语言处理领域,小说段落分割和分类算法的优化一直是研究的热点。本文将介绍两种不同的研究内容,一是关于小说段落分割中损失函数的比较与应用,二是最近特征线(NFL)和修正最近特征线段(RNFLS)分类器的并行实现。
小说段落分割:损失函数的比较与应用
损失函数介绍
在小说段落分割的实验中,使用了三种损失函数:
- BCE损失 :这是本次实验的基线方法。
- αBCE损失 :在BCE损失的基础上引入了权重α。
- FL(Focal Loss) :通过网格搜索确定超参数α和γ的值,以开发数据的评估指标为依据。
评估指标
处理不平衡数据的分类问题时,模型评估指标的设置非常重要。本研究采用了F1分数、马修斯相关系数(MCC)和平衡准确率作为评估指标,用于比较不同损失函数的模型。
实验结果
经过10次实验,得到了每个评估指标的平均值和标准差。以下是数据集A和B在不同损失函数下的评估指标值:
| 数据集 | 方法 | F1 - 分数(均值) | F1 - 分数(标准差) | MCC(均值) | MCC(标准差) | 平衡准确率(均值) | 平衡准确率(标准差) |
| — | — | — | — | — | — | — | — |
| A - Dev | BCE | 0.8523 | 0.00419 | 0.7724 | 0.00666 | 0.8814 | 0.00324 |
|
超级会员免费看
订阅专栏 解锁全文
75

被折叠的 条评论
为什么被折叠?



