硬件感知概率电路中的有偏 PSDD 学习实验
1. 引言
在资源受限的嵌入式系统中,实现高效的机器学习算法是一个极具挑战性的任务。为了在这些系统中实现有效的分类任务,需要考虑硬件感知(hardware-aware)的方法。本篇文章将探讨一种新的学习方法——D-LearnPSDD,它通过引入判别性偏差(discriminative bias)来优化概率子句决策图(PSDDs)的分类性能。此外,还将比较生成式学习方法(如 LearnPSDD、朴素贝叶斯(NB)和树增强朴素贝叶斯(TANB))和判别式学习方法(如逻辑回归)在多个数据集上的表现,并分析变量树(variable tree)和结构约束对模型可处理性和性能的影响。
2. 性能比较
在本章中,我们使用了15个标准机器学习基准测试集进行实验,这些数据集涵盖了广泛的应用领域,从金融数据到医学诊断。所有数据集均来自 UCI 机器学习库,除了 “Mofn” 和 “Corral”。为了确保公平比较,我们对所有数据集进行了预处理,包括离散化和二值化。
2.1 数据集详情
表1总结了每个数据集的二进制特征数量(|F|)、类别数量(|C|)以及可用的训练样本数量(|N|)。
数据集 | 特征数量(|F|) | 类别数量(|C|) | 训练样本数量(|N|) |
---|---|---|---|
澳大利亚 | 40 | 2 |