基于集成的正无标签时间序列分类及高效挖掘规则频繁模式
基于集成的正无标签时间序列分类
在时间序列分类领域,正无标签学习方法具有重要意义,它能省去手动标记大量训练数据这一繁琐且昂贵的过程。这里提出了一种新颖的 En - LCLC 算法(基于集成的公共局部聚类学习算法),旨在克服现有 LCLC 算法的不足。
实验设置
- 数据处理 :在实证评估中,重复了相关实验,从正训练类中随机选取一个种子示例用于学习阶段,其余训练集(包括正例和负例)视为无标签数据。每个数据集使用不同的初始正种子实例重复实验 10 次,并报告 10 次结果的平均值。
- 参数设置 :En - LCLC 算法执行 n 个不同的分类器来为每个实例生成置信度分数,这里设置 n = 15,后续还会评估 n 的敏感性。
- 评估指标 :使用 F - 度量来评估四种正无标签(PU)学习技术的性能。F - 度量是精确率(p)和召回率(r)的调和平均值,即 F = 2 * p * r / (p + r)。只有当精确率和召回率都较好时,F - 度量才会较大,这适合准确分类正负时间序列数据的需求。
实验结果
| 数据集 | Wei’s 方法 | Ratana’s 方法 | LCLC | En - LCLC |
|---|
超级会员免费看
订阅专栏 解锁全文
1104

被折叠的 条评论
为什么被折叠?



