- 博客(4)
- 收藏
- 关注
原创 深度学习课程第五周总结
本次课程系统学习了ViT、Transformer、RNN系列及CLIP的核心原理:ViT将Transformer引入视觉领域,打破CNN垄断但依赖大数据预训练Transformer凭借自注意力和并行计算成为NLP主流架构RNN/LSTM/GRU处理序列数据的经典方法,LSTM/GRU有效缓解梯度消失CLIP开创多模态对比学习新范式,实现强大的零样本迁移能力各模型在结构设计和应用场景上形成互补,为深度学习解决复杂任务提供多样化工具。
2025-06-12 19:35:25
1000
原创 深度学习课程第四周总结
数据集特点:不同数据集的适用场景与标注格式。评价体系:精确率、召回率、AP与mAP的计算方法。YOLO原理:单阶段检测框架、损失函数设计与多版本改进。语义分割:FCN与DeepLab的核心思想。模型轻量化:优化YOLOv5等模型,适配移动端与边缘设备。多任务学习:结合检测、分割与姿态估计,提升模型实用性。自监督学习:利用无标注数据预训练,降低标注成本。学习资源推荐YOLOv5官方GitHub仓库理论深化:《深度学习》(花书)第9章计算机视觉。
2025-05-19 20:55:26
880
原创 深度学习课程第三周总结
主流的深度学习框架包括TensorFlow(Google)、Caffe(UC Berkeley)、PyTorch(Facebook)、MXNet(Amazon/DMLC)和PaddlePaddle(百度)等,各有其特点和适用场景。选择平台时需考虑学习材料丰富程度、CNN/RNN建模能力、易用性、运行速度及多GPU支持等因素。核心概念张量(Tensor):类似于NumPy的ndarrays,但可在GPU上加速计算,是PyTorch中数据表示的基本单位。计算图(Computational Graph)
2025-05-12 21:20:17
763
原创 深度学习课程第二周总结
线性分类器通过特征的线性组合进行分类决策。与线性回归不同,分类问题的输出是类别标签或概率值(如0或1)。线性回归和分类问题本质是参数优化,分类问题引入Sigmoid函数后需迭代求解神经元模型通过激活函数实现非线性映射,感知机是线性分类的基础多分类问题通过Softmax函数扩展,损失函数采用交叉熵梯度下降法是优化非线性问题的核心方法。
2025-05-04 17:16:09
843
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅