1. 监督学习
- 核心原理:模型在带有标签的训练数据上学习,输入数据(如特征)和对应输出标签(如类别或数值)已知。目标是学习输入到输出的映射关系。
- 典型应用:预测房价(回归)、判断邮件是否为垃圾邮件(分类)。
- 常见算法:线性回归(预测连续值)、逻辑回归(二分类)、支持向量机(SVM,处理高维数据)、决策树(规则化决策)、随机森林(集成树模型)。
- 生活案例:
你用手机App预测明天天气:输入“湿度70%、风速10km/h”,App输出“下雨概率80%”。
原理:App在历史数据(湿度、风速、是否下雨)上训练,学习“湿度高+风速低→下雨概率高”的规律。
2. 无监督学习
- 核心原理:模型在无标签数据上运行,目标是发现数据中的隐藏模式(如分组或降维),无需预先定义输出。
- 典型应用:客户分群(市场分析)、图像压缩(减少数据维度)。
- 常见算法:K均值聚类(将数据分成K类)、层次聚类(构建树状分组)、主成分分析(PCA,降低数据维度)。
- 生活案例:
电商平台将用户分为“高消费”“中消费”“低消费”群体:
输入用户数据(消费金额、浏览时长),系统自动分组,无需人工标注“高消费”标签。
原理:通过计算用户行为相似度,将相似用户归为一类。
3. 半监督学习
- 核心原理:结合少量有标签数据和大量无标签数据训练,解决标签数据稀缺问题。
- 典型应用:医疗影像分析(医生标注少量病灶,大量未标注影像辅助学习)。
- 常见方法:自训练(用模型预测无标签数据,将高置信度结果加入训练集)、协同训练(多个模型互相验证)。
- 生活案例:
你开发一个垃圾分类App:
- 有100张标注的图片(“塑料瓶”“纸张”),但有10,000张未标注图片。
- 模型先用100张训练,再用模型预测10,000张,筛选高准确率结果加入训练集。
原理:用少量人工标注+大量自动标注数据提升模型精度。
4. 强化学习
- 核心原理:智能体通过与环境交互试错学习,根据奖励/惩罚调整行为,目标是最大化长期累积奖励。
- 典型应用:游戏AI(如AlphaGo)、机器人路径规划。
- 生活案例:
你训练一个扫地机器人:
- 机器人尝试不同路径(“左转”“右转”),清洁成功得奖励,撞墙得惩罚。
- 通过反复试错,它学会“避开障碍→高效清扫”的策略。
原理:环境反馈(奖励)驱动行为优化,类似人类学习。
机器学习的学派详细说明
1. 符号学派
- 核心思想:知识通过符号表示和逻辑推理获取,事物关系有因果性(如“下雨→地面湿”)。
- 典型算法:决策树(通过条件判断决策,如“如果温度>30℃→开空调”)。
- 生活案例:
你设计一个交通规则系统:
- 规则:“红灯亮→停车”(符号逻辑),无需数据训练,直接编程实现。
2. 贝叶斯学派
- 核心思想:因果关系非绝对,带概率性,用贝叶斯定理更新信念(如“下雨概率50%”)。
- 典型应用:朴素贝叶斯分类器(邮件过滤)。
- 生活案例:
你判断“是否下雨”:
- 初始认为下雨概率30%(先验概率)。
- 观察到“云层厚重”(新证据),更新为70%(后验概率)。
原理:用概率动态调整判断,而非绝对规则。
3. 类推学派
- 核心思想:通过类比学习新知识,核心是定义“相似度”标准(如“相似事物性质相似”)。
- 典型应用:推荐系统(“喜欢A的人也喜欢B”)。
- 生活案例:
你推荐电影:
- 用户喜欢《星际穿越》(A),系统类比“科幻+高评分”电影《盗梦空间》(B),推荐B。
原理:基于相似度(如题材、评分)推导新内容。
- 用户喜欢《星际穿越》(A),系统类比“科幻+高评分”电影《盗梦空间》(B),推荐B。
4. 联结学派
- 核心思想:模仿人脑神经元连接,通过调整连接强度学习(如神经网络)。
- 典型代表:神经网络、深度学习(图像识别)。
- 生活案例:
你用手机识图功能:
- 相机扫描猫,神经网络通过多层神经元(类似人脑)识别“猫耳朵”“胡须”特征,输出“猫”。
原理:数据通过神经元连接逐步抽象,无需人工设计规则。
- 相机扫描猫,神经网络通过多层神经元(类似人脑)识别“猫耳朵”“胡须”特征,输出“猫”。
5. 进化学派
- 核心思想:模拟生物进化(选择、交叉、变异)优化解决方案。
- 典型应用:遗传算法(优化复杂问题)。
- 生活案例:
你设计最优物流路线:
- 初始随机生成10条路线(“种群”),根据“里程最短”筛选优秀路线(选择),交叉生成新路线(如A路线+ B路线→新路线C),变异调整细节。
原理:类似自然选择,迭代优化到最佳解。
- 初始随机生成10条路线(“种群”),根据“里程最短”筛选优秀路线(选择),交叉生成新路线(如A路线+ B路线→新路线C),变异调整细节。
总结
- 分类:监督(带标签)、无监督(无标签)、半监督(少量标签+大量无标签)、强化(交互试错)。
- 学派:符号(逻辑规则)、贝叶斯(概率推理)、类推(相似度类比)、联结(神经网络)、进化(生物优化)。
- 关键价值:理解这些方法和学派,能精准匹配实际问题(如用监督学习预测房价,用联结学派做图像识别),避免“用错工具”。
1192

被折叠的 条评论
为什么被折叠?



