基于机器学习的PU数据分类与易腐库存鲁棒控制研究
在当今的数据分析和供应链管理领域,PU(Positive and Unlabeled)数据分类以及易腐库存的鲁棒控制是两个备受关注的问题。本文将详细介绍相关研究,包括PU数据分类的多种方法和实验结果,以及易腐库存鲁棒控制的新方法。
一、PU数据分类研究
- 研究目的与方法
- 研究的第二个目的是推荐最可靠和高效的后验概率$f(x) = P(Y = 1|X = x)$评估方法,假设$Y$由逻辑模型控制且有PU数据可用。
- 研究基于13种机器学习(ML)模型方案,应用了LassoJoint方法,考虑了BFGS或MM算法的联合方法。LassoJoint方法是一个三步过程:
- 第一步,使用Lasso方法进行预测变量的初始选择,调整参数$\lambda$可以通过10折交叉验证技术获得,也可以固定为$\lambda = ((log p)/n)^{1/3}$。
- 第二步,执行阈值化Lasso。
- 第三步,对第二步中选择的变量应用联合方法。
- 还使用了朴素逻辑回归方法、联合方法、LassoJoint方法和加权方法,并将结果与已知真实标签变量$Y$时的oracle方法结果进行比较。为了比较基于逻辑回归模型的分类方法,还使用了支持向量机(SVM)和k近邻算法(KNN),并结合了AdaSampling方案。此外,对特征进行了最小 - 最大变换,显著提高了结果的准确性。
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



