数据分割与线性回归:机器学习的关键技术
1. 机器学习算法类型
机器学习算法主要分为两类,这取决于给出响应所需的调整程度:
- 监督学习算法 :需要通过用于训练的数据不断改进。例如,线性模型的监督机器学习函数需要一组初始数据进行训练并生成初始条件。之后,要对模型进行测试和使用,还需持续监测结果,判断其是否合理。若模型失败,可能需要重新训练。
- 无监督学习算法 :不需要对数据有任何先验知识。无监督机器学习过程会获取数据并开始分析,直至得出结果。与监督线性回归和时间序列不同,这类数据无需测试来判断是否可用于构建模型。K - means 算法就是一个例子,它使用未知和未经测试的数据对变量值进行分类,并返回分类段。
2. 机器学习的三个主题
我们将关注机器学习的三个不同主题:
- 分组统计以查找数据段 :可使用 Excel 插件自动进行分类。
- 线性回归 :使用 Excel 公式判断数据是否可用于通过回归模型进行预测以及时间序列的预测。
- 时间序列
3. 数据分类和分组的原因
使用机器学习算法对数据进行分类和分组,原因如下:
- 大量数据难以手动分类。
- 通过观察二维或三维图表进行分割不准确。
- 对多个变量进行分割是不可能的,因为无法绘制多维图表。
4. K - means 聚类前确定最佳组数
在使用 K - means
数据分割与线性回归解析
超级会员免费看
订阅专栏 解锁全文
3777

被折叠的 条评论
为什么被折叠?



