机器学习——week 1——绪论_机器学习machine learning-优快云博客

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心，是使计算机具有智能的根本途径。

一、机器学习

定义

机器学习（Machine Learning, ML）是人工智能（AI）的一个核心分支，其核心定义如下：
机器学习是一门研究如何让计算机系统通过从数据中自动学习规律或模式，并利用这些规律完成预测、分类、决策等任务的学科。它不依赖于显式的编程指令，而是通过算法分析数据，逐步改进性能。

简言之，机器学习是让计算机“通过数据获得经验”的科学，核心思想是从数据中学习，而非被明确编程。

算法分类

一、监督学习（Supervised Learning）

定义：使用带标签的数据（输入-输出对）训练模型，用于预测或分类。

1. 分类（Classification）

逻辑回归（Logistic Regression）
- 用于二分类问题（如垃圾邮件检测）
- 输出概率（0~1），使用Sigmoid函数
支持向量机（SVM, Support Vector Machine）
- 寻找最优超平面分割数据
- 适用于高维数据，可处理非线性分类（核函数）
决策树（Decision Tree）
- 基于特征值递归划分数据
- 可解释性强，易过拟合
随机森林（Random Forest）
- 多个决策树的集成学习算法
- 通过投票机制提高泛化能力
K-近邻（K-Nearest Neighbors, KNN）
- 基于距离度量进行分类
- 简单但计算复杂度高

2. 回归（Regression）

线性回归（Linear Regression）
- 拟合线性关系（y = w * x + b）
- 最小化均方误差（MSE）
岭回归（Ridge Regression）
- 线性回归 + L2正则化，防止过拟合
Lasso回归（Lasso Regression）
- 线性回归 + L1正则化，可做特征选择
梯度提升树（Gradient Boosting, 如XGBoost, LightGBM）
- 迭代训练弱学习器，优化残差
- 广泛用于结构化数据比赛（Kaggle）

二、无监督学习（Unsupervised Learning）

定义：使用无标签数据，发现数据中的隐藏模式。

1. 聚类（Clustering）

K-Means
- 将数据划分为K个簇，最小化簇内距离
- 需预先指定K值，对异常值敏感
层次聚类（Hierarchical Clustering）
- 通过树状图（Dendrogram）展示数据层次关系
- 无需预设簇数量
DBSCAN（Density-Based Clustering）
- 基于密度划分簇，可发现任意形状的簇
- 适合噪声数据

2. 降维（Dimensionality Reduction）

主成分分析（PCA, Principal Component Analysis）
- 通过正交变换提取主要特征
- 减少数据维度，保留最大方差
t-SNE（t-Distributed Stochastic Neighbor Embedding）
- 高维数据可视化（如MNIST手写数字）
- 保持局部相似性

3. 关联规则（Association Rule）

Apriori算法
- 发现频繁项集（如购物篮分析）
- “啤酒与尿布”案例的经典算法

三、半监督学习（Semi-Supervised Learning）

定义：结合少量标注数据和大量未标注数据训练模型。

自训练（Self-Training）
- 先用标注数据训练模型，再对未标注数据打伪标签
生成对抗网络（GAN）的半监督变体
- 如SGAN（Semi-Supervised GAN）

四、强化学习（Reinforcement Learning）

定义：智能体（Agent）通过与环境交互学习最优策略。

1. 经典算法

Q-Learning
- 基于值函数（Q-Table）选择最优动作
- 适用于离散动作空间
深度Q网络（DQN, Deep Q-Network）
- 用神经网络替代Q-Table
- 解决高维状态空间问题

2. 策略梯度（Policy Gradient）

REINFORCE
- 直接优化策略函数（Policy）
PPO（Proximal Policy Optimization）
- 稳定训练，适用于连续控制任务

五、深度学习（Deep Learning）

定义：使用深层神经网络进行特征学习。

1. 核心架构

卷积神经网络（CNN）
- 用于图像识别（如ResNet, VGG）
- 局部感知、权重共享
循环神经网络（RNN）
- 处理序列数据（如LSTM, GRU）
- 存在梯度消失问题
Transformer
- 自注意力机制（Self-Attention）
- 奠基模型（如BERT, GPT）

2. 生成模型

生成对抗网络（GAN）
- 生成器（Generator）与判别器（Discriminator）对抗训练
变分自编码器（VAE）
- 学习数据潜在分布

六、集成学习（Ensemble Learning）

定义：结合多个弱模型提升整体性能。

Bagging（如随机森林）
Boosting（如AdaBoost, XGBoost）
Stacking（多层模型融合）

应用领域

1. 医疗健康

疾病诊断：
- 帕金森病（PD）检测：利用声学数据（语音障碍分析）、医学影像（MRI、DTI）、运动数据（步态分析）进行早期诊断。
- 心脏病预测：梅奥诊所使用心电图（EKG）数据训练神经网络，检测无症状左心室功能障碍，预测心力衰竭风险。
- 癌症治疗响应预测：AI分析CT影像，预测免疫治疗疗效，提高个性化治疗方案。
医学影像分析：
- 肿瘤检测：CNN模型在X光、CT、MRI数据中识别肿瘤，减少误诊率。
- 视网膜病变分析：结合OCTA（光学相干断层扫描血管成像）与机器学习，提高糖尿病视网膜病变筛查效率。
药物研发：
- 分子结构预测：深度学习加速药物分子筛选，降低研发成本。

2. 智能制造

质量检测：
- 外观缺陷检测：CNN分析生产线图像，识别产品划痕、裂纹等缺陷。
- 动态质量监控：LSTM处理时间序列数据，预测生产过程中的异常。
设备故障预测：
- 预测性维护：随机森林、XGBoost分析传感器数据，提前预警设备故障。
- 工业机器人优化：强化学习优化机械臂操作策略，提高装配精度。
供应链优化：
- 库存管理：ML预测需求波动，优化库存水平，降低仓储成本。

3. 环境与能源

空气质量预测：
- PM2.5浓度预测：随机森林（RF）和XGBoost结合气象数据，预测室内PM2.5水平。
- 污染源追踪：ML分析传感器网络数据，识别工业排放热点。
能源管理：
- 智能电网优化：强化学习优化电力分配，降低能耗。
- 数据中心冷却优化：Google利用ML优化冷却系统。

4. 自动驾驶

感知与决策：
- BEV（鸟瞰图）感知：多传感器融合（摄像头+激光雷达），提升目标检测精度。
- 端到端自动驾驶：直接映射传感器输入到控制指令，减少模块化系统延迟。
仿真与测试：
- 3D高斯溅射（3DGS）：高精度场景重建。
- 闭环仿真：虚拟测试场模拟极端场景。

5. 金融与商业

风险管理：
- 信用评分：XGBoost分析用户行为数据，预测违约风险。
- 欺诈检测：异常检测算法识别信用卡欺诈交易。
个性化推荐：
- 电商推荐系统：协同过滤+深度学习优化用户购物体验。

6. 机器人技术

机器人学习：
- Robo-DM 数据管理：统一多模态数据（视频、文本、动作）。
- 强化学习控制：机器人自主适应动态环境（如抓取不同形状物体）。

7. 农业

精准农业：
- 作物病害检测：CNN分析无人机图像，识别玉米锈病、小麦条锈病等8。
- 智能灌溉：ML预测土壤湿度，优化水资源使用。

领域	典型应用	关键技术
医疗健康	疾病诊断、影像分析	CNN、LSTM、强化学习
智能制造	质量检测、预测性维护	XGBoost、随机森林、CNN
自动驾驶	BEV感知、端到端驾驶	Transformer、3DGS
金融	信用评分、欺诈检测	异常检测、集成学习
机器人	多模态数据管理、强化学习	Robo-DM、DQN
环境监测	PM2.5预测、污染源追踪	RF、XGBoost