机器学习基础

  • 机器学习(Machine Learning,ML)领域分类:回归(regression)、分类(classification)和结构化学习(structured learning)。
    • 回归:假设要找的函数的输出是一个数值,一个标量(scalar),这种机器学习的任务称为回归。。举个回归的例子,假设机器要预测未来某一个时间的 PM2.5 的数值。机器要找一个函数 f,其输入是可能是种种跟预测 PM2.5 有关的指数,包括今天的 PM2.5 的数值、平均温度、平均的臭氧浓度等等,输出是明天中午的 PM2.5的数值。
    • 分类:分类任务要让机器做选择题。人类先准备好一些选项,这些选项称为类别(class),现在要找的函数的输出就是从设定好的选项里面选择一个当作输出,该任务称为分类。
    • 结构化学习:机器不只是要做选择题或输出一个数字,而是产生一个有结构的物体,比如让机器画一张图,写一篇文章。这种叫机器产生有结构的东西的问题称为结构化学习。
  • 一些概念
    • 领域知识(domain knowledge):例如预测某个视频的观看次数,也许今天的观看次数,总是会跟昨天的观看次数有点关联,所以把昨天的观看次数,乘上一个数值,但是总是不会一模一样,所以再加上一个 b 做修正。得到y = b + w ∗ x1。
    • 参数(parameter):b 跟 w 是未知的参数。
    • 模型(model):带有未知的参数的函数称为模型。模型在机器学习里面,就是一个带有未知的参数的函数。
    • 特征(feature) :特征x1 是这个函数里面已知的。
    • 权重(weight):w 是未知的参数,称为权重。
    • 偏置(bias):b 是未知的参数,称为偏置。
    • 损失(loss):损失也是一个函数。这个函数的输入是模型里面的参数,模型是 y = b + w ∗ x1,而 b 跟 w 是未知的,损失是函数 L(b, w),其输入是模型参数 b 跟w。输出表示模型算的估测值和真实值之间的差距。L值越小说明模型越好。
    • 标签(label):在损失函数中的真实值就是标签。
    • 回归模型的误差,误差越小越好
      • 平均绝对误差(Mean Absolute Error,MAE):误差e为:e = |yˆ − y|,其中yˆ为估测值,y为真实值。
      • 均方误差(Mean SquaredError,MSE):e = (ˆy − y)2。
      • 交叉熵(cross entropy):
      • 误差表面(error surface):二维的话就是等高线图,例如下图,偏红色系,代表计算出来的损失越大,就代表这一组 w 跟 b 越差。如果越偏蓝色系,就代表损失越小。

    • 梯度下降(gradient descent):对未知参数求微分寻找最优解,每次让未知参数移动一小段步伐,寻找最优解。

      • 学习率(learning rate):η 也会影响步伐大小。学习率是自己设定的,如果 η 设大一点,每次参数更新就会量大,学习可能就比较快。如果 η 设小一点,参数更新就很慢,每次只会改变一点点参数的数值。
      • 超参数(hyperparameter):在机器学习中需要自己设定,不是机器自己找出来的,称为超参数。
      • 全局最小值(global minima):全局让损失最小的值。
      • 局部最小值(local minima):局部让损失最小的值。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值