1、定义机器学习
机器学习简介
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
简单来说,机器学习是让计算机通过数据来学习模式并做出预测或决策的技术。
2、有监督学习和无监督学习的区别是什么?
在有监督学习中,输入算法的数据带有期望的解决方案,这些数据被称为“标签”,包括以下任务:
- 分类
- 回归
而在无监督学习中,数据是未标记的,常见的任务类型包括:
- 聚类
- 关联规则学习
- 可视化
- 降维
3、列举无监督学习任务。
- 聚类(如 k-均值、层次聚类分析)
- 关联规则学习(如 Eclat、Apriori)
- 可视化和降维(如 核主成分分析、t-分布主成分分析)
4、为什么测试和验证很重要?
测试与验证
测试和验证能确保模型运行良好,判断其能否对新情况进行泛化。
在评估模型性能时,通常会将数据分为:
- 训练集 :用于训练模型
- 测试集 :用于评估模型的泛化误差
通过测试集评估模型的误差率,可以判断模型是否足够好、能否正常工作:
| 误差率 | 模型表现 |
|---|---|
| 低 | 模型表现好 |

最低0.47元/天 解锁文章
1311

被折叠的 条评论
为什么被折叠?



