硬件感知概率电路学习的实验评估
1. 引言
在资源受限的嵌入式应用中,实现高效的机器学习算法一直是一个挑战。传统的机器学习模型,如朴素贝叶斯(Naive Bayes)和树增强朴素贝叶斯(Tree-Augmented Naive Bayes),虽然在分类任务上表现良好,但它们在处理复杂查询时的效率有限。概率子句决策图(PSDDs)作为一种新型的概率模型,能够在表达力和可处理性之间取得平衡,非常适合硬件感知的学习和推理。本篇文章将详细介绍如何通过引入判别性偏差来优化 PSDDs 的学习过程,并评估其在多个基准数据集上的性能。
2. D-LearnPSDD 评估
为了评估引入判别性偏差的 PSDD 学习算法(D-LEARNPSDD)的性能,我们进行了五折交叉验证实验。实验中比较了 D-LEARNPSDD、LEARNPSDD、朴素贝叶斯(NB)、树增强朴素贝叶斯(TANB)和逻辑回归(LogReg)在准确率和参数数量上的表现。实验结果表明,D-LEARNPSDD 在大多数数据集上优于 LEARNPSDD,并且在分类准确率方面与逻辑回归(LogReg)相当,同时保持了对缺失特征的鲁棒性。
2.1 实验设置
我们在 15 个标准机器学习基准测试集上进行了实验,这些数据集来自 UCI 机器学习库。所有数据集都经过了预处理步骤,包括删除缺失值的实例和其特征值始终等于 0 的特征,并使用了一次性编码。此外,数据集通过应用离散化方法进行了预处理,然后将变量二值化。表 5.3 列出了每个数据集的详细信息,包括二进制特征的数量、类别的数量以及可用的训练样本数量。
| 数据集 |
|---|
超级会员免费看
订阅专栏 解锁全文
46

被折叠的 条评论
为什么被折叠?



