主动学习与部分有序模式挖掘研究
在当今的数据挖掘和机器学习领域,主动学习(Active Learning,AL)和部分有序模式挖掘是两个备受关注的研究方向。主动学习旨在通过选择最有价值的数据样本进行标注,以提高模型的性能;而部分有序模式挖掘则致力于从序列数据中发现更具灵活性和综合性的模式。下面将深入探讨这两个领域的研究成果。
主动学习的效果与影响因素
主动学习的性能提升效果往往难以捉摸,许多研究都发现其性能增益并不显著。为了深入探究主动学习何时能发挥作用,研究人员进行了一系列实验,并采用了特定的方法来分析实验结果。
实验中,因变量是主动学习性能区域的长度,通过拟合广义可加模型(Generalised Additive Model,GAM)来确保结果的统计显著性。初始分析采用了泊松回归和负二项式回归,由于泊松回归模型存在过度离散的问题,最终选择了负二项式回归广义线性模型,其表达式为:
[
Y_i \sim NegBin(\mu_i, \kappa)
]
其中,(\log(\mu_i) = x_i \cdot \beta),(\kappa)是离散参数。
负二项式回归的显著结果如下表所示:
| 名称 | 系数 | p 值 |
| — | — | — |
| 截距 | -1.695 | 1.70e - 12 |
| 特定分类器,逻辑回归 | 1.142 | < 2e - 16 |
| 特定任务,标记为 sd7 | -0.481 | 0.000405 |
| 输入类型,连续 | 0.578 | 1.11e - 09 |
| 输入类型,离散 | -1.235 | &
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



