- 博客(6)
- 收藏
- 关注
原创 Datawhale X 李宏毅苹果书 AI夏令营 第三章
目前数理基础还不够,先理解比较L(θ)与L(θ‘)的关系来判断三者区别。利用最小值比例,一半上升一半下降。梯队下降失效,梯度为零的点。具体怎么找方向不大懂。
2024-08-24 20:53:14
327
原创 Datawhale X 李宏毅苹果书 AI夏令营 第二章
优化程度可能较低···出现56层不如20层的情况(不是过拟合而是优化问题)模型太简单···无论如何训练都很难找到损失小的函数。其他方法···早停,正则化,dropout。模型太复杂···过拟合。减少参数···全连接变卷积神经网络。模型复杂度与目标函数复杂度的偏差。创造新数据···cv中的左右镜像。训练集与测试集不匹配导致落差。与过拟合不同,增加数据集徒劳。问题:容易停留在局部最优解。
2024-08-24 09:21:28
289
原创 Datawhale X 李宏毅苹果书 AI夏令营 task2
过拟合···随着模型层数增加或可学习参数增加而导致训练集表现变好但预测表现变差的现象。增加可学习的参数数量···虽然函数仍是线性组合,但是随参数增加拟合性能大幅增强。回合(epoch)···将每个batch都更新一次或者说把每个参数都更新一遍。sigmoid函数···用于逼近不好表示的hard sigmoid函数。······将参数以矩阵形式统一以θ来打包,利用梯度下降算法进行更新。ReLu函数···可以用两个它来表示hard sigmoid函数。多层神经网络----》深度学习。······反向传播算法。
2024-08-23 11:25:53
137
原创 Datawhale X 李宏毅苹果书 AI夏令营 task1
平均绝对误差:预测值与理论值之差的绝对值之平均数。学习率:一个决定模型参数更新与收敛情况的超参数。均方误差:预测值与理论值之差的平方之平均数。弊端:可能只找到局部最小值而非全局最小值。交叉熵:概率分布数据使用的误差衡量标准。而对于更多参数的梯度下降算法也是同理,换成偏导数而已。分类:某函数的输出值为分立的类别。误差表面:以损失为值衡量的等高线。偏置 在原有输出量上增减的值。重要数学原理:偏导数。回归:求一个理想的预测函数。权重 与输入量相乘的值。
2024-08-22 19:12:33
153
原创 计算机必备200个英语专有名词汇总
第一组Algorithm:解决问题的步骤或规则。 Array:存储一组相同类型元素的数据结构。 Argument:传递给函数的值。 API (Application Programming Interface):程序之间的接口,用于交互。 Attribute:对象或类的特性或属性。第二组Binary:二进制数系统,使用0和1。 Boolean:逻辑数据类型,值为true或false。 Bug:程序中的错误或缺陷。 Class:定义对象的蓝图,包括属性和方法。 Compiler:将源
2024-08-18 21:42:12
2800
原创 《白话机器学习的数学》感悟
读完我对机器学习的基本概念有了理解,不少方法在接下来ai学习中应该也会不断涉及。今日大致读完了这本书,对机器学习的概念有了基本认知,文中用到的数学知识浅显。梯度下降算法:利用微分方法使得可调参数对应函数最值移动,多元参数使用偏微分。随机梯度下降算法:利用多个随机初始参数组,规避前者求到局部最优解的问题。正则化:引入偏正函数,减小理想的参数的值,从而减小参数对整体函数的影响。过拟合:参数过多,导致对训练数据拟合好,对检测数据拟合差的问题。简化式子,利用矩阵,以及定义函数时巧妙的1/2简化求导结果。
2024-08-12 15:56:30
157
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人