【Python与机器学习 4-1】 机器学习基本概念和流程

本文介绍了机器学习的基本概念,包括监督学习与非监督学习的区别,以及机器学习问题的表示方式。详细阐述了从特征表示到优化的基本流程,并讨论了如何通过独立同分布的假设来处理数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习基本概念

机器学习可以通过有无标签划分为监督学习和非监督学习
最后要预测什么什么就是标签

  • 监督学习:学习的是带有标记的数据
  • 非监督学习:学习的是未被标记的数据

机器学习问题的表示

1.根据n个独立同分布观测样本确定预测函数
独立同分布是机器学习的前提,同分布是指数据的分布是相同的,独立是指数据之间相互不影响。但是实际的数据中有很多不符合独立同分布,比如视频。
2.在一组函数{f(x,w)}中求一个最优的函数f(x,w0)对依赖关系进行估计,使期望风险最小

机器学习基本流程

这里写图片描述

  • representation 特征表示
    对数据进行处理,根据属性构造特征。
    把数据表示成模型可以接收的格式
  • evaluation 检验
    每个模型有许多参数,根据上一步的历史数据调整参数
  • optimization 优化
    得到最优化的参数,得到模型
    这里写图片描述
基本框架

这里写图片描述

  • 定义一系列函数
    给一个同一个机器学习模型的具有不同参数的函数
  • 定义函数优劣
    制定评价模型的好坏标准
  • 选择最优的函数
    根据制定的标准和训练集找到最好的函数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值