自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 深度学习课程第五周总结

本次课程系统学习了ViT、Transformer、RNN系列及CLIP的核心原理:ViT将Transformer引入视觉领域,打破CNN垄断但依赖大数据预训练Transformer凭借自注意力和并行计算成为NLP主流架构RNN/LSTM/GRU处理序列数据的经典方法,LSTM/GRU有效缓解梯度消失CLIP开创多模态对比学习新范式,实现强大的零样本迁移能力各模型在结构设计和应用场景上形成互补,为深度学习解决复杂任务提供多样化工具。

2025-06-12 19:35:25 1000

原创 深度学习课程第四周总结

数据集特点:不同数据集的适用场景与标注格式。评价体系:精确率、召回率、AP与mAP的计算方法。YOLO原理:单阶段检测框架、损失函数设计与多版本改进。语义分割:FCN与DeepLab的核心思想。模型轻量化:优化YOLOv5等模型,适配移动端与边缘设备。多任务学习:结合检测、分割与姿态估计,提升模型实用性。自监督学习:利用无标注数据预训练,降低标注成本。学习资源推荐YOLOv5官方GitHub仓库理论深化:《深度学习》(花书)第9章计算机视觉。

2025-05-19 20:55:26 880

原创 深度学习课程第三周总结

主流的深度学习框架包括TensorFlow(Google)、Caffe(UC Berkeley)、PyTorch(Facebook)、MXNet(Amazon/DMLC)和PaddlePaddle(百度)等,各有其特点和适用场景。选择平台时需考虑学习材料丰富程度、CNN/RNN建模能力、易用性、运行速度及多GPU支持等因素。核心概念张量(Tensor):类似于NumPy的ndarrays,但可在GPU上加速计算,是PyTorch中数据表示的基本单位。计算图(Computational Graph)

2025-05-12 21:20:17 763

原创 深度学习课程第二周总结

线性分类器通过特征的线性组合进行分类决策。与线性回归不同,分类问题的输出是类别标签或概率值(如0或1)。线性回归和分类问题本质是参数优化,分类问题引入Sigmoid函数后需迭代求解神经元模型通过激活函数实现非线性映射,感知机是线性分类的基础多分类问题通过Softmax函数扩展,损失函数采用交叉熵梯度下降法是优化非线性问题的核心方法。

2025-05-04 17:16:09 843

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除