- 博客(3)
- 收藏
- 关注
原创 深度学习Day3 卷积神经网络的理论学习
我们经过上面的学习,直到了怎么卷积,怎么提取图片特征,可我们想要的是一个类别,现在经过池化卷积得到了矩阵,可依旧不是我们想要的,应该再怎么样呢?很简单的道理,如果不引入padding,特征图在一直卷积后会变得很小,导致无法再卷积,而且如果反复卷积,边缘的数据会丢失,而中间的数据被反复卷积,这样获取到的数据也是不完整的。倘若还是像回归模型那般,输入数据得到预测值,倘若我要是预测一个动物是猫是狗,运算得到的预测值是y,可猫和狗这两个类是等价的,两者并无关联,那我如何根据这个预测值y来判断猫或者狗呢?
2025-03-06 23:03:27
848
原创 深度学习Day2 利用深度学习模型预测COVID-19阳性病例
答:每个训练批次的梯度应该独立反应当前数据对模型参数的调整方向,如果不清除梯度,多个批次的梯度会累积相加,导致参数偏离当前批次的实际梯度方向。答:梯度的计算设计复杂的反向传播,占用大量内存和计算时间,而验证模型仅需要评测模型的性能并不需要更新参数,所以禁止计算梯度可以减少资源的损耗。答:我们有一批数据x,然后我们有准确的y,让x通过模型得到预测值y^,然后令y-y^作差后得到差距,然后训练模型,得到更好的预测值y^。答:为了得到一个好的模型,然后得到一个尽量正确的输出值y。为什么验证状态时不再计算梯度?
2025-03-05 23:34:26
303
原创 深度学习Day1
在高中阶段我们学习过矢量——只有大小无方向,向量——既有大小又有方向,以向量为基础做张量的定义为一阶张量,在二维坐标系中可以用两个数(x,y)来表示,三维坐标系中可以用(x,y,z)来表示,这三个数的每一个数都表示了一个方向上的大小,叫做一节张量的分量,这三个数合起来就很好地表示了三维空间的一阶张量。以此类推可以得到r2,r3的函数表达式,其实不难发现,r = b + W*x,这是很基本的矩阵方程的形式,因此我们可以知道基本的神经网络的运算原理其实就是基本的矩阵运算。然后我们编写一段随机生成数据的函数。
2025-03-04 22:41:41
412
空空如也
关于#HTTP##javaweb#的问题,如何解决?
2023-05-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人