工业4.0与工业物联网中的机器学习和数据科学
1. 机器学习的分类
机器学习对于决策至关重要,但需要大量资源。根据建立数学模型所使用的算法,机器学习可分为以下几类:
1.1 监督学习
监督学习利用采样/标记的数据集,算法需要对数据集进行直接监督并施加一定限制。传入的数据集会根据过去的样本进行标记,然后算法识别并分类这些标记的数据集。监督学习的两个主要过程是分类和回归:
- 分类 :从数据中提取有意义的信息,并根据相似性将其分隔成不同的类别。数据分类的第一步是对数据进行学习/训练,然后从数据集中预测类别标签。名义、二元和有序数据属性的分隔使用分类器。
- 回归 :适用于数值属性。
常见的监督学习算法包括:
|算法名称|算法描述|数学表达式|
| ---- | ---- | ---- |
|线性回归|用于选择目标值,根据给定的自变量确定因变量的值,主要用于预测变量的值和检测变量之间的关系|$y = β_0 + β_1x_1 + β_2x_2 + · · · + β_nx_n$|
|逻辑回归|当因变量为二元/二分变量时适用,说明因变量与一个或多个名义、二元、有序和数值自变量之间的关系|无|
|随机森林|一种基于集成的机器学习算法,用于分类和回归。集成中的每个分类器被假定为一个决策树,它们组合形成森林|无|
|支持向量机|用于线性和非线性数据的分类,可用于分类和回归。使用超平面进行分类,超平面最大化两类之间的间隔|线性:$f(x) = w^T X + b$;非线性:$f’(x) = f(x) + w’\sum_
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



