- 博客(11)
- 收藏
- 关注
原创 DataWhale 二月组队学习-深度学习教程-Task04
(梯度为零但某些方向存在更低值的点)。在非凸优化中,梯度下降可能收敛到。(梯度为零且周围更低的点)或。
2025-02-23 22:53:17
599
原创 DataWhale 二月组队学习-深入浅出pytorch-Task06
通过继承PyTorchVideo是PyTorch生态中专注于视频理解视频数据集:支持Kinetics、Something-Something等主流数据集。预训练模型:包含SlowFast、X3D、CSN等前沿视频模型。数据处理工具:支持视频解码、时空数据增强。模块化设计:灵活组合模型组件(如backbone、head)。clip_sampler=RandomClipSampler(clip_duration=2), # 随机采样2秒片段torchtext是PyTorch中专门用于文本数据处理。
2025-02-23 22:35:18
940
原创 DataWhale 二月组队学习-深入浅出pytorch-Task05
特点:快速生成网络结构的文本描述安装与使用# 安装!# 使用示例summary(model, input_size=(3, 224, 224)) # 输入尺寸输出示例...TensorBoard是TensorFlow开发的交互式可视化工具,PyTorch通过训练指标监控:损失、准确率等标量数据曲线模型结构可视化:计算图与网络层次结构特征图/卷积核可视化:激活与权重的空间分布梯度分布分析:参数更新动态嵌入向量投影:高维数据的低维可视化实验跟踪:记录超参数、训练指标、系统资源可视化分析。
2025-02-21 23:26:32
904
原创 DataWhale 二月组队学习-深入浅出pytorch-Task04
若损失函数无需可学习参数,可直接定义为函数。例如实现平滑L1损失(Smooth L1 Loss)说明:当预测与目标的差值小于beta时使用平方损失,否则使用线性损失,结合了MSE和MAE的优点。# 实现warmup策略:前10个epoch线性增长学习率imgaug支持60+种增强操作(几何变换、颜色空间变换、模糊等)支持同时处理图像、关键点、边界框、分割图灵活的随机组合与概率控制与NumPy/PyTorch/TensorFlow完美兼容。
2025-02-19 20:17:14
884
原创 DataWhale 二月组队学习-深度学习教程-Task03
训练数据划分策略:k折交叉验证(k-fold cross validation),如下图所示,将训练数据随机分成k等份,每次取其中的(k-1)份作为训练集,剩下一份作为验证集,重复k次,得到k组结果,将k组结果平均起来,得到模型的最终效果。当有多个模型时,选择结果最好的模型用在全部训练集上,再到测试集上。将训练数据分成两部分,训练集(training set)和验证集(validation set),用training set中的数据训练模型,用validation set中的数据挑选模型。
2025-02-19 19:27:41
1026
原创 DataWhale 二月组队学习-深入浅出pytorch-Task03
Sequential顺序模型适用于简单层堆叠,通过直接添加层,代码简洁但灵活性低。Module子类化继承nn.Module类,在__init__中定义层,forward中实现前向逻辑,灵活性高,适合复杂模型。ModuleList与ParameterList:管理子模块列表,支持迭代和索引(如动态添加层)。:管理参数列表,适用于需要动态调整参数的场景。模型定义:灵活使用nn.Module和模块化思想提升开发效率1114。模型修改:通过替换层、扩展子类或冻结参数适应不同任务135。模型保存。
2025-02-16 20:12:18
850
原创 DataWhale 二月组队学习-深入浅出pytorch-Task02
_init__: 用于向类中传入外部参数,同时定义样本集: 用于逐个读取样本集合中的元素,可以进行一定的变换,并将返回训练/验证所需的数据__len__: 用于返回数据集的样本数作用:衡量模型预测结果与真实值的差异,指导模型参数优化。核心思想:通过最小化损失函数,使模型预测接近真实数据。实现步骤继承类。在forward方法中定义计算逻辑。示例:加权L1+L2损失self.alpha = alpha # 控制L1和L2的权重SGD(随机梯度下降)基础优化器,支持动量。
2025-02-14 22:52:58
950
原创 DataWhale 二月组队学习-深入浅出pytorch-Task01
就我目前的理解来看二维是矩阵,三维以及三维以上是张量。3维加入时间维度,4维表示图片,5维表示视频对于图片为什么不是三维而是四维,其实图片可以用三维表示,也就是宽、高、通道。其中宽和高指的是水平和竖直方向的像素数;通道指的是特征维度,比如RGB图像通道数为3,灰度图像通道数为1。而在训练模型是会有分批处理的情况的,所以需要使用四维表示,也就是在宽高通道的基础上加上了同时处理的样本图像的大小。
2025-02-11 22:57:19
1691
原创 DataWhale 2月组队学习 Task01
无论是机器学习还是深度学习,所要做的工作无非寻找一个函数,使我们的输入经过这个函数之后得到我们想要的输出,而根据输出的类别不同,又可以将机器学习或深度学习任务分为不同的类别。
2025-02-11 10:03:48
1958
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅