基于模拟量子退火的特征子集选择方法
1. 引言
特征子集选择是从原始特征集中挑选有意义特征子集的过程,它是一种降维技术,能提升机器学习模型的分类准确率、增强可解释性并减少训练时间。过去几十年,特征选择取得了显著进展,主要分为基于包装器、基于过滤器和嵌入式方法。其中,基于包装器和嵌入式的方法在过程中会使用分类器,而基于过滤器的方法则无需分类器参与,它使用多种评估指标来评估特征子集。这些方法各有优缺点,而底层的搜索技术对特征子集选择起着关键作用。
在大数据时代,特征数量的增加给机器学习和数据挖掘领域带来了诸多挑战,如特征选择算法的可扩展性和稳定性问题。利用基于量子计算的特征选择可能是解决这些挑战的有效途径,但目前该领域仍有待深入探索。量子计算基于量子力学原理,如叠加和纠缠,能同时处理多个状态,与每次只能执行一个状态的经典计算机不同,这使其在解决经典计算机计算成本高的问题时具有潜在的显著加速能力。量子计算主要有退火模型和门模型两种计算模型,它们分别适用于不同类型的问题。
量子退火在从大量潜在解决方案中快速找到足够好的解决方案方面非常有效,适合解决组合优化问题。它能生成可转换为二次无约束二进制优化(QUBO)或伊辛模型的问题解向量。然而,将问题恰当地映射到QUBO和量子系统是一项挑战。模拟量子退火(SQA)是在经典计算机上对量子退火的模拟,最近已被证明比其经典对应物模拟退火(SA)快指数倍。尽管已经有许多组合优化问题使用量子退火解决,但在量子机器上执行特征选择问题的研究还很少。
本文旨在开发一种基于量子的新方法来解决特征子集选择问题。首次将包括最小冗余最大相关性(mRMR)、联合互信息(JMI)和快速基于相关性的过滤器(FCBF)等知名的基于过滤器的特征子集选择方法转
超级会员免费看
订阅专栏 解锁全文
914

被折叠的 条评论
为什么被折叠?



