0201概述-机器学习-人工智能

1、概述

1.1、示例

小明1月工资1000,每月增长10%,第10个月是多少?

月份x工资y
11000
21100
31210
41331
51464
61611
71772
81949
92144
10

如下图所示,传统方式与机器学习对比:在这里插入图片描述

1.2、概念

机器学习是一种实现人工智能的方法。从数据(经验)中寻找规律、建立关系,根据建立的关系解决问题。

2、应用场景

2.1、行业应用场景

2.1.1、金融领域
  • 信用评分:基于用户行为、征信数据预测贷款违约概率(如:XGBoost模型)
  • 欺诈检测:通过异常交易模式识别信用卡盗刷(如:孤立森林算法)
  • 量化交易:利用时间序列分析预测股票价格趋势(如:LSTM神经网络)
  • 智能投顾:根据用户风险偏好推荐投资组合(如:协同过滤算法)
2.1.2、 医疗健康
  • 疾病诊断:通过医学影像识别癌症病灶(如:CNN卷积神经网络)
  • 药物研发:预测分子结构与药效的关联性(如:图神经网络)
  • 个性化治疗:结合基因数据推荐靶向治疗方案(如:强化学习)
  • 流行病预测:分析社交媒体与病例数据预测疫情扩散(如:时空序列模型)
2.1.3、零售与电商
  • 推荐系统:根据用户历史行为推荐商品(如:矩阵分解算法)
  • 需求预测:基于季节性、促销活动预测库存需求(如:Prophet模型)
  • 动态定价:实时调整商品价格以最大化收益(如:博弈论+深度学习)
  • 客户分群:通过RFM模型划分高价值用户(如:K-means聚类)
2.1.4、 制造业
  • 预测性维护:通过传感器数据预判设备故障(如:随机森林分类)
  • 质量控制:检测生产线上的产品缺陷(如:YOLO目标检测)
  • 供应链优化:最小化物流成本与交货时间(如:组合优化算法)
2.1.5、自动驾驶
  • 目标识别:实时检测行人、车辆、交通标志(如:Transformer模型)
  • 路径规划:动态生成最优行驶路线(如:A*算法+强化学习)
  • 决策控制:判断加速、刹车或转向时机(如:深度Q网络)

2.2、功能场景分类

2.2.1、 预测类
场景输入数据模型示例输出结果
销量预测历史销售、市场活动ARIMA/Prophet未来30天销量
客户流失预警用户行为、服务记录LightGBM分类流失概率(0-100%)
股价波动预测K线数据、新闻情感分析LSTM+Attention明日涨跌幅区间
2.2.2、分类与识别类
场景输入数据模型示例输出结果
垃圾邮件过滤邮件文本、发件人信息BERT文本分类垃圾/非垃圾标签
人脸识别摄像头图像FaceNet网络身份ID匹配度
语音转文本音频波形Whisper模型文字转录结果
2.2.3、生成与优化类
场景输入数据模型示例输出结果
图像生成文字描述(如“雪山风景”)Stable Diffusion高分辨率合成图像
文本摘要长篇文章BART/T5模型压缩后的关键段落
参数调优历史实验数据贝叶斯优化最优参数组合

2.3、机器学习适用场景的共同特征

  1. 数据驱动:需充足、高质量的历史数据(如:用户行为日志、传感器数据)
  2. 模式复杂:传统规则难以描述的关系(如:非线性的用户购买偏好)
  3. 动态变化:需持续适应新趋势(如:在线学习更新推荐模型)
  4. 规模化需求:人工处理成本过高(如:每天百万级订单的欺诈检测)

3、实现机器学习的基本框架

{ x 1 x 2 ⋯ x n y 1 y 2 ⋯ y n ⋮ ⋮ ⋮ ⋮ ⋯ ⋯ ⋯ ⋯ } → → → f ( x 1 , x 2 , ⋯   , x n ) → → → 解决问题 \begin{Bmatrix} x_1&x_2&\cdots&x_n\\ y_1&y_2&\cdots&y_n\\ \vdots&\vdots&\vdots&\vdots\\ \cdots&\cdots&\cdots&\cdots \end{Bmatrix}\to\to\to f(x_1,x_2,\cdots,x_n)\to\to\to 解决问题 x1y1x2y2xnyn →→→f(x1,x2,,xn)→→→解决问题

训练数据喂给计算机,自算计自动求解数据关系,在新的数据上做出预测或者给出建议。

4、类别

类别定义典型算法应用场景数据要求优点缺点
监督学习基于带标签的数据训练模型,输入与输出存在明确映射关系- 线性回归 - 决策树 - SVM - 神经网络 - XGBoost房价预测、垃圾邮件分类、图像识别需大量标注数据预测精准,结果可解释性强依赖标注数据,成本高
无监督学习从无标签数据中发现隐藏模式或结构- K-means聚类 - PCA降维 - Apriori关联规则 - 自编码器客户分群、异常检测、数据降维无需标注数据节省标注成本,探索未知模式结果解释性弱,评估难度大
半监督学习结合少量标注数据和大量未标注数据进行训练- 标签传播 - 半监督SVM - 自训练模型医学影像分析(标注样本少)少量标注+大量未标注数据降低标注需求,提升模型泛化能力依赖未标注数据质量
强化学习智能体通过与环境交互获得奖励,学习最优策略- Q-Learning - 深度Q网络(DQN) - 策略梯度(PPO)游戏AI、机器人控制、自动驾驶决策需模拟环境与奖励机制适应动态环境,长期决策优化训练成本高,收敛速度慢
自监督学习利用数据自身结构生成伪标签进行训练- BERT(掩码语言模型) - SimCLR(对比学习)预训练语言模型、图像特征提取无需人工标注利用海量无标注数据下游任务需微调
迁移学习将已训练模型的知识迁移到新任务- 微调预训练模型(如ResNet) - 领域自适应(DANN)小样本图像分类、跨领域文本分析源域数据充足,目标域数据少加速新任务训练,降低数据需求领域差异过大时效果下降
集成学习组合多个基模型提升整体预测性能- Bagging(随机森林) - Boosting(AdaBoost) - Stacking高精度预测(如Kaggle竞赛)需多样化基模型减少过拟合,提高鲁棒性计算复杂度高,可解释性差
  • 补充说明
  1. 混合类型

    • 深度强化学习:结合深度学习与强化学习(如AlphaGo)
    • 半监督+迁移学习:利用少量标注数据跨领域迁移(如医疗影像诊断)
  2. 算法交叉性

    • 神经网络可应用于监督、无监督、强化学习等场景(如Transformer模型)
    • 聚类算法(如K-means)也可用于监督学习的特征预处理
  3. 类别选择依据

    场景特征推荐类别
    数据标注齐全监督学习
    数据无标注且需探索结构无监督学习
    标注成本高且数据量大半监督/自监督学习
    动态决策与长期反馈强化学习

5、机器学习 vs 传统方法的优势对比

场景传统方法痛点机器学习解决方案
信用卡反欺诈规则库更新滞后,误判率高实时学习新型欺诈模式
医学影像诊断依赖医生经验,漏诊率波动标准化分析,辅助医生决策
商品推荐人工策划覆盖品类有限长尾商品精准匹配用户兴趣

6、何时不适合机器学习?

  1. 数据量极小(如:企业仅10条历史销售记录)
  2. 因果逻辑明确(如:税率计算已有清晰公式)
  3. 结果需完全可解释(如:法律判决中的责任认定)

如果需要针对某一行业(如金融、医疗)或功能(如预测、分类)的深入案例分析,可进一步说明需求,我将提供更具体的技术方案和代码示例。

结语

❓QQ:806797785

⭐️仓库地址:https://gitee.com/gaogzhen

⭐️仓库地址:https://github.com/gaogzhen

[1]AI人工智能从入门到精通全套教程[CP/OL].

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

gaog2zh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值