【科研积累】机器学习的认知笔记

一、机器学习通识

机器学习,就是用模型来学习数据的规律。

大多数机器学习任务都是三步走:实例化➡️训练➡️预测。

机器学习任务按照最后一步预测,可以分为三种:

1. 分类:输出概率分布

2. 回归

3. 生成:本质上也是分类,生成的是对下一个字的分类,在字典中,每个字都是一个类别。

如果按照数据标签的完整与否来划分,则可以分为以下三类:

1. 结构化的数据(全都有标签):用于监督学习,包括分类、回归;

2. 半结构化的数据(部分有标签)

3. 无标签的数据:用于无监督学习,包括聚类、降维、生成模型、主题模型、文本编码。

对算法而言,数据分为序列数据和静态数据,其中序列数据就包括文本、时间序列和音频视频。

在深度学习中,无论什么数据,都要转化为张量来计算。

监督学习/无监督学习:

监督学习本质上就是在做函数逼近F(x),通过内部外部参数的学习,找到和数据最贴合的函数。

这里的内参和外参是什么?

内参是模型通过训练数据自动学习得到的,而非像外参那样直接由用户指定。

模型 = 外部参数实例化 + 训练数据调整内部参数 + 算法

在实践中,我们把内部分数称为参数,外部参数称为超参数

经典机器学习可以理解为显式的函数,也就是能用数学公式表达的算法,而深度学习则可以理解为函数的隐式表达&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值