
深度学习笔记
文章平均质量分 73
分享在深度学习过程中遇到的知识点,也会更新自己的学习笔记。
旅途中的宽~
计算机视觉在读研究生,第二十届华为杯研究生数学建模国一(第6名),获Kaggle计算机视觉竞赛Stable Diffusion银牌(top3%,37名),Identify Contrails银牌(top5%,45名),UBC-OCEAN铜牌(top7%,86名),Kaggle Expert(总排名1400+),优快云人工智能领域优质创作者,阿里云博客专家。主要研究方向是目标检测和语义分割,对CV其他领域亦有兴趣。希望和大家一起交流学习!
展开
-
【深度学习】Upsample模块采用的采样方式总结汇总(含示例代码)
【深度学习】Upsample模块采用的采样方式总结汇总(含示例代码)原创 2025-02-20 14:37:27 · 1225 阅读 · 0 评论 -
【计算机视觉 | Linux】问题解决:OSError: cannot open resource
【计算机视觉 | Linux】问题解决:OSError: cannot open resource原创 2024-05-18 21:38:39 · 910 阅读 · 0 评论 -
【深度学习】torchvision.transforms中的ToTensor和Normalize
【深度学习】torchvision.transforms中的ToTensor和Normalize原创 2024-05-14 18:57:01 · 1825 阅读 · 0 评论 -
【深度学习】Kaggle知识点:Pytorch基类 nn.Module(含代码)
【深度学习】Kaggle知识点:Pytorch基类 nn.Module原创 2024-01-18 10:02:11 · 1374 阅读 · 0 评论 -
【机器学习】干货:计算两个向量之间相似性的方法(含源代码)
【机器学习】干货:计算两个向量之间相似性的方法(含源代码)原创 2023-09-13 16:40:11 · 15388 阅读 · 0 评论 -
【torch】如何把把几个 tensor 连接起来?(含源代码)
【torch】如何把把几个 tensor 连接起来?(含源代码)原创 2023-09-06 13:39:51 · 2224 阅读 · 0 评论 -
【深度学习】神经网络中 Batch 和 Epoch 之间的区别是什么?我们该如何理解?
【深度学习】神经网络中 Batch 和 Epoch 之间的区别是什么?我们该如何理解?原创 2023-08-29 10:50:10 · 7519 阅读 · 0 评论 -
【深度学习 | 计算机视觉】Focal Loss原理及其实践(含源代码)
【深度学习 | 计算机视觉】Focal Loss原理及其实践(含源代码)原创 2023-07-15 11:04:31 · 9078 阅读 · 0 评论 -
【深度学习】最全的十九种损失函数汇总
【深度学习】最全的十九种损失函数汇总原创 2023-06-27 10:09:30 · 23991 阅读 · 0 评论 -
【跑实验04】CLIP安装报错,setup.py如何安装,图像编码器(image_encoder)的使用(含源代码)
【跑实验04】CLIP安装报错,setup.py如何安装,图像编码器(image_encoder)的使用(含源代码)原创 2023-06-23 10:49:34 · 5857 阅读 · 0 评论 -
【计算机视觉】在计算机视觉里,传统卷积已经彻底输给Transformer了吗?
【计算机视觉】在计算机视觉里,传统卷积已经彻底输给Transformer了吗?原创 2023-06-23 09:14:55 · 2791 阅读 · 0 评论 -
【深度学习】近万字解读深度学习领域有哪些瓶颈?
【深度学习】近万字解读深度学习领域有哪些瓶颈?原创 2023-06-21 14:08:26 · 1866 阅读 · 0 评论 -
【计算机视觉】CVPR 2023 上的分割论文真的是神仙打架(介绍前12篇,图像分割,全景分割,语义分割,实例分割)
【计算机视觉】CVPR 2023 上的分割论文真的是神仙打架(介绍前12篇,图像分割,全景分割,语义分割,实例分割)原创 2023-06-21 13:46:50 · 26392 阅读 · 3 评论 -
【计算机视觉】计算机视觉的简单入门代码介绍(含源代码)
【计算机视觉】计算机视觉的简单入门代码介绍(含源代码)原创 2023-06-21 10:28:58 · 3062 阅读 · 0 评论 -
【深度学习 | 机器学习】干货满满 | 近万字总结了 12 个令人惊艳的神经网络可视化工具!
【深度学习 | 机器学习】干货满满 | 近万字总结了 12 个令人惊艳的神经网络可视化工具!原创 2023-06-20 21:08:22 · 7016 阅读 · 0 评论 -
【机器学习 | 深度学习】Colab是什么?以及如何使用它?
【机器学习 | 深度学习】Colab是什么?以及如何使用它?原创 2023-06-08 15:37:12 · 26087 阅读 · 3 评论 -
【计算机视觉 | 目标检测】术语理解3:Precision、Recall、F1-score、mAP、IoU 和 AP
【计算机视觉 | 目标检测】术语理解3:Precision、Recall、F1-score、mAP、IoU 和 AP原创 2023-05-19 14:32:16 · 8934 阅读 · 0 评论 -
【计算机视觉】最后显示的CIFAR-100数据集照片很模糊怎么解决?
【计算机视觉】最后显示的CIFAR-100数据集照片很模糊怎么解决?原创 2023-05-18 10:36:31 · 1966 阅读 · 0 评论 -
【计算机视觉】CLIP实战:Zero-Shot Prediction(含源代码)
【计算机视觉】CLIP实战:Zero-Shot Prediction(含源代码)原创 2023-05-18 10:19:47 · 3376 阅读 · 1 评论 -
【计算机视觉 | 目标检测】术语理解2:Grounding 任务、MLM、ITM代理任务
【计算机视觉 | 目标检测】术语理解2:Grounding 任务、MLM、ITM代理任务原创 2023-05-16 15:07:44 · 11651 阅读 · 4 评论 -
【计算机视觉 | 目标检测】术语理解:V2L 映射、视觉 embedding 和文本 embedding
【计算机视觉 | 目标检测】术语理解:V2L 映射、视觉 embedding 和文本 embedding原创 2023-05-16 14:01:56 · 1419 阅读 · 0 评论 -
【计算机视觉】如何利用 CLIP 做简单的人脸任务?(含源代码)
【计算机视觉】如何利用 CLIP 做简单的人脸任务?(含源代码)原创 2023-05-15 16:09:48 · 3336 阅读 · 3 评论 -
【深度学习 | torchvision】当使用 torchvision.datasets 加载数据集时,如何获取路径?
【深度学习 | torchvision】当使用 torchvision.datasets 加载数据集时,如何获取路径?原创 2023-05-15 14:45:00 · 942 阅读 · 0 评论 -
【计算机视觉】如何利用 CLIP 做简单的图像分类任务?(含源代码)
【计算机视觉】如何利用 CLIP 做简单的图像分类任务?(含源代码)原创 2023-05-15 11:12:16 · 10448 阅读 · 0 评论 -
【计算机视觉 | 自然语言处理】Hugging Face 超详细介绍和使用教程
【计算机视觉 | 自然语言处理】Hugging Face 超详细介绍和使用教程原创 2023-05-14 17:11:49 · 20462 阅读 · 0 评论 -
【Python | 深度学习】safetensors 包的介绍和使用案例(含源代码)
【Python | 深度学习】safetensors 包的介绍和使用案例(含源代码)原创 2023-05-14 15:20:46 · 28868 阅读 · 5 评论 -
【计算机视觉 | Pytorch】timm 包的具体介绍和图像分类案例(含源代码)
【计算机视觉 | Pytorch】timm 包的具体介绍和图像分类案例(含源代码)原创 2023-05-14 12:04:17 · 9270 阅读 · 6 评论 -
【深度学习 | Python】AutoModel, AutoProcessor的介绍
【深度学习 | Python】AutoModel, AutoProcessor的介绍原创 2023-05-12 20:33:38 · 5713 阅读 · 0 评论 -
【自然语言处理 | BERT】BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding论文讲解
【自然语言处理 | BERT】BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding论文讲解原创 2023-05-04 21:00:41 · 1992 阅读 · 1 评论 -
【人工智能 | 计算机视觉】Google Research, 2022 & beyond: Language, vision and generative models
【人工智能 | 计算机视觉】Google Research, 2022 & beyond: Language, vision and generative models原创 2023-05-04 15:27:47 · 511 阅读 · 0 评论 -
【深度学习 | PPT分享】一文看懂注意力机制
【深度学习 | PPT分享】一文看懂注意力机制原创 2023-05-04 14:57:34 · 969 阅读 · 0 评论 -
【人工智能 | 多模态】几种常见的多模态任务
【人工智能 | 多模态】几种常见的多模态任务原创 2023-05-03 15:51:52 · 6755 阅读 · 0 评论 -
【ChatGPT】如何让 ChatGPT 不再频繁报错,获取更加稳定的体验?
【ChatGPT】如何让 ChatGPT 不再频繁报错,获取更加稳定的体验?原创 2023-04-25 13:28:53 · 6752 阅读 · 0 评论 -
【自然语言处理 | NLP】“token“, “embedding“,“encoding“各自的区别分别是什么?
【自然语言处理 | NLP】"token", "embedding","encoding"各自的区别分别是什么?原创 2023-04-22 10:52:34 · 17227 阅读 · 0 评论 -
【深度学习 | Pytorch】从MNIST数据集看batch_size
【深度学习 | Pytorch】从MNIST数据集看batch_size原创 2023-04-06 09:11:54 · 1873 阅读 · 0 评论 -
SOTA该如何理解?
SOTA该如何理解?原创 2023-03-16 15:42:52 · 2835 阅读 · 0 评论 -
【目标检测】目标检测中的标签分配
文章目录一、前言二、标签分配方法的分类2.1 标签是否非负2.2 是否有预测结果参与一、前言在目标检测任务中,标签分配起着关键的作用,其目的是将样本划分成正样本和负样本,然后与GT之间计算loss,决定模型如何学习和收敛。二、标签分配方法的分类2.1 标签是否非负标分配策略,是一个预定义的规则,能够分配每个anchor的正负,也就是一个gt会对应多个anchor。 常用的label assignment是Max IOU Assign,具体流程:首先,对于GT box(NNN个)和anchor(原创 2023-03-15 10:27:05 · 2439 阅读 · 0 评论 -
【计算机视觉】CNN 可视化算法
【计算机视觉】CNN 可视化算法原创 2023-03-13 10:36:03 · 1977 阅读 · 0 评论 -
【深度学习】什么是解耦?
【深度学习】什么是解耦?原创 2023-03-10 18:51:20 · 4222 阅读 · 0 评论 -
【计算机视觉】Zero-shot, One-shot和Few-shot的理解
【计算机视觉】Zero-shot, One-shot和Few-shot的理解原创 2023-03-09 14:54:55 · 24227 阅读 · 7 评论