极端边缘设备的机器学习:资源高效与硬件感知之路
1. 机器学习模型分类
机器学习模型是机器学习的主要输出,可从数据中学习执行所需任务。Peter Flach将机器学习模型分为三大类:几何模型、概率模型和逻辑模型。
- 几何模型 :这类模型直接在特征空间中使用几何概念构建,如线、平面和距离。例如线性分类器,通过在两个质心之间的线的中间相交来构建×和◦样本之间的边界;最近邻分类器通过评估新实例的欧几里得距离并将其分配到最近训练实例的同一类;支持向量机学习一个与每个类型的最近训练示例具有最大距离的边界;多层感知器等一些神经网络也基于几何概念,试图在特征空间中找到一个分离不同类实例的非线性超平面。
- 概率模型 :假设存在一个潜在的随机过程生成变量(或特征),可以用概率分布来描述它们之间的关系。例如在活动识别中,可以通过学习可用特征上的分布并使用贝叶斯规则计算后验概率,推断给定感官数据下可能活动的概率。概率模型通常是生成性的,意味着可以从模型中包含的变量中采样值。
- 逻辑模型 :依靠一系列逻辑规则来执行感兴趣的任务,这些规则通常组织成树或图结构,如决策树。决策树对特征空间进行分层划分,叶子节点标记不同的类,新实例的分类通过遵循树的路径直到叶子级别,并预测该叶子的多数类。
这三种分类并非相互排斥,例如概率电路结合了概率和逻辑模型的概念。
2. 机器学习管道中的特征
特征是输入数据的可测量属性,对机器学习任务的成功至关重要,因为模型是根据特征定义的。在实际场景中,特征通常需要由开发者或机器学习应用程序构建。例如活动识别应用程