- 博客(142)
- 问答 (1)
- 收藏
- 关注
原创 yolo的各模块扫盲 模块缝合
问题回答图里没提 FPN/PAN 吗?✅是的,没直接写,但结构完全对应。那 FPN/PAN 存在吗?✅存在!它们是通过UpsampleConcatConv等基本操作实现的。怎么理解?FPN = 自顶向下路径(上采样 + 拼接)PAN = 自底向上路径(下采样 + 拼接)两者合起来就是PANet。这图能说明什么?它展示了 YOLOv8 如何用最基础的模块构建一个强大的 PANet neck,体现了其工程化和可复现性。
2025-10-13 19:03:55
962
原创 Task Alignment(任务对齐):TOOD和YOLO的爱恨情仇
你以为 YOLO 很强?其实它体内,流着 TOOD 的血。——任务对齐,早已无处不在。
2025-10-13 18:32:07
405
原创 计算机视觉 图像分类 → 目标检测 → 实例分割
任务输出粒度是否定位是否区分个体输出形式典型模型分类整图否不适用类别标签目标检测物体级别是否(YOLO等)边界框 + 类别实例分割像素级别是是掩码(Mask)+ 类别语义分割像素级别是否类别图(每个像素有类别)全景分割像素级别是是(所有物体)统一的像素级标注。
2025-10-09 20:16:03
1977
原创 cv领域接地气的方向
方向接地气程度应用广泛性学习建议小目标检测⭐⭐⭐⭐☆⭐⭐⭐⭐☆✔️ 入门首选遮挡检测⭐⭐⭐⭐☆⭐⭐⭐⭐结合上下文建模低光照增强⭐⭐⭐⭐⭐⭐⭐☆图像恢复 + 检测医学图像⭐⭐⭐⭐☆⭐⭐⭐⭐☆注重伦理与精度遥感图像⭐⭐⭐⭐⭐⭐⭐☆学习旋转框等扩展缺陷检测⭐⭐⭐⭐☆⭐⭐⭐⭐异常检测方向轻量化模型⭐⭐⭐⭐☆⭐⭐⭐⭐⭐工程落地必备技能。
2025-10-06 20:56:43
473
原创 深度学习优化在求导时,到底谁是变量,谁是常数?
场景/操作变量常数(在本次操作中固定)单个模型前向传播输入数据x模型参数θ损失函数求值模型参数θ训练数据(x, y), 模型结构计算梯度(反向传播)模型参数θ训练数据(x, y), 模型结构SGD整个训练过程模型参数θ不断变化模型结构固定训练数据(x, y)在不同步骤被采样优化算法(如SGD)的超参数固定核心结论:在SGD优化器进行求导(计算梯度)的那个时刻,我们优化的对象——模型参数θ(如W, b)是变量,而用来定义损失函数的数据(x, y)被当作常数。
2025-09-24 13:28:20
613
原创 yolo neck特征融合 浅层特征深层特征
在目标检测(以及更广泛的卷积神经网络)里,和的区别主要在这几个方面。:网络前几层(靠近输入图像)。:第一、二个卷积块的输出(ResNet 的 C2、C3)。:网络后几层(靠近输出分类器)。:ResNet 的 C4、C5 层输出。现代检测器通常会。
2025-08-16 09:16:46
462
1
原创 Python中的 __name__
这句话就是告诉Python:“如果你是直接执行这个文件,就运行下面的代码。这也是Python程序的入口习惯写法。然后再运行,应该就不会报那个多进程错误了。需要我帮你写完整示例吗?
2025-08-10 23:27:10
441
原创 李宏毅机器学习
• 例如:用汽车(监督学习)完成客运(分类任务),用轮船(无监督学习)完成货运(聚类任务)。• 自监督学习(无监督生成标签+监督训练)用于预训练模型,再微调分类任务。• 强化学习的策略学习可视为动态分类(选择动作)或回归(预测价值函数)。• 误区:认为“分类是监督学习的一种”或“聚类是一种无监督学习”。• 分类任务必须通过监督学习(需标签)或半监督学习(部分标签)。• 种类(Types):回答“模型如何学习”(框架)。• 任务(Tasks):回答“模型要做什么”(目标)。某些复杂任务可能结合多种学习种类。
2025-05-08 11:35:39
511
原创 python的import类与模块区别
在 Python 中,import语句既可以用于导入,也可以用于导入、函数、变量等。是一个包含 Python 定义和语句的文件(通常以.py为扩展名)。是定义在模块中的对象蓝图或模板。类是模块的一部分。因此,当你通过import导入一个模块时,你可以进一步访问该模块中定义的类、函数或变量。当你使用import导入一个模块时,你实际上是在加载整个模块的内容。可以通过模块名来访问模块中的类、函数或变量。
2025-04-16 16:31:13
750
原创 多层感知机与全连接神经网络关系解析
感知机(Perceptron)、多层感知机(MLP,Multilayer Perceptron)和全连接神经网络(FCNN,Fully Connected Neural Network)是神经网络发展过程中密切相关的概念,但它们有明确的区别。
2025-04-12 16:41:40
1047
原创 NAT和VPN的联系
理解VPN和NAT的区别以及它们如何工作是非常重要的。虽然从某种角度来看,你可以说VPN在某些方面类似于“两个NAT”加上加密解密的过程,但实际上,这种类比并不完全准确,因为两者的核心功能和技术实现有显著的不同。
2025-03-21 17:39:25
758
原创 深度学习 bert流程
在自然语言处理任务中,特别是使用预训练模型如BERT时,文本首先通过一个分词器(例如)转换为一系列的token IDs。这些ID是每个词或子词单元在词汇表(包含汉字、英文单词、标点符号)中的索引位置。如果输入句子是,经过分词器处理后,得到的token IDs可能是[1, 2],这里1和2分别对应词汇表中的'hello'和'world'。
2025-03-13 16:41:36
663
原创 深度学习 bert与Transformer的区别联系
BERT(Bidirectional Encoder Representations from Transformers)和Transformer都是现代自然语言处理(NLP)中的重要概念,但它们代表不同的层面。理解这两者之间的区别与联系有助于更好地掌握它们在NLP任务中的应用。
2025-03-13 14:59:26
996
原创 深度学习 常见优化器
另外,用户之前的问题是关于论文格式调整的,现在突然转向优化器,可能是他们在撰写论文时需要涉及相关内容,或者是学习过程中遇到了这个问题。最后,检查是否有遗漏的重要优化器,比如Adadelta、Nadam,或者最近的一些改进版本如AdamW、LAMB等,是否需要包含进来。然后,考虑用户可能对某些术语不太熟悉,比如动量、自适应学习率这些概念,需要用简单易懂的语言说明。总结下来,我需要组织一个结构清晰、内容详实的回答,涵盖主要优化器的原理、优缺点、适用场景,并给出使用建议,帮助用户全面理解并应用这些优化器。
2025-03-12 18:12:39
1538
原创 交叉熵损失函数和softmax激活函数的关系
交叉熵损失(Cross-Entropy Loss)和Softmax函数在机器学习尤其是深度学习中经常一起使用,特别是在多分类问题中。它们之间的关系主要体现在如何将模型的输出转化为类别概率以及如何计算预测值与真实标签之间的误差。
2025-03-12 16:32:20
622
原创 计算机网络常见疑问
在计算机网络中,TCP/IP模型与OSI五层模型的分层差异确实容易引发疑问,尤其是关于数据链路层(五层模型)的功能是否实际存在。理解这一点,可以避免混淆模型的理论抽象与实际协议的工程实现。:简化分层,贴近实际协议(如以太网、IP、TCP等)。:实际包含数据链路层(MAC、LLC)和物理层的功能。:教学清晰,明确区分逻辑功能,便于理解各层职责。(合并数据链路层和物理层)。
2025-03-04 16:03:53
1315
原创 深度学习_第二轮
确实,当进行模型训练时,(x) 和 (y) 分别代表输入特征和对应的输出值,它们以数据点对的形式存在,一个数据集中通常包含多对这样的数据。因此,即使 (x) 和 (y) 在处理每个样本时被视为常量,为了优化模型参数,我们需要遍历数据集中的所有 ((x_i), (y_i)) 对,利用它们提供的信息来指导权重的更新方向。这意味着,在实际操作中,虽然在计算单个样本的偏导数时 (x_i) 和 (y_i) 被视为常量,但这一过程会针对数据集中的每一个样本重复执行。
2025-03-01 11:10:36
653
原创 深度学习_学习笔记
csv 是 Python 标准库的一部分,适合处理简单的 CSV 文件,不支持复杂的数据操作;而pandas直接支持 Excel、CSV 等,也可复杂的数据处理。都可用于处理csv文件(注意csv文件不是excel文件)
2025-02-09 12:05:19
541
原创 对深度学习中的基本概念—梯度的理解
首先,我们定义一个简单的例子,来模拟一下深度学习的学习过程。已知:有一个正确的数据对(或者叫样本),(x,y)其中,x代表输入值,y代表输出值。这里我们假定x等于 1, y也等于1。也就是说这个已知的、正确的数据对为(1,1)求:根据上面的数据对,求出y和x之间的映射关系该如何求呢?解:我们设计一个神经网络来求这个映射关系。简单又不失一般性,我们设计一个只有一个参数w的神经网络。用这个简单的神经网络来表示x和y之间的映射关系的话,如下表示:Y = wx。
2025-02-05 23:08:53
1133
原创 数据结构教材关于C/C++的研究
如果在定义class A时,A域的类型是未定义的class A而不是指向class A对象的指针类型,编译器会尝试在编译时分配一块内存给A域,但由于class A的定义还没有出现,因此无法确定A域需要多少空间。这就导致了编译错误。改用指针可以解决这个问题,因为指针的大小是固定的,与指向的类型无关。在定义class A时,编译器只需要知道A域是一个指针类型,就能正确地分配内存。同时,在实际使用A域时,可以通过对指针进行解引用来访问实际的class A对象。
2024-06-27 11:52:48
357
原创 流量控制 可靠传输 滑动窗口之间的关系 以及 流量控制和可靠传输的关系
流量控制、可靠传输和滑动窗口是网络通信中的三个重要概念,它们之间有密切的关系。流量控制是指在数据传输过程中控制发送方发送数据的速率,以避免接收方无法及时处理大量数据而导致的数据丢失或拥塞。流量控制通过使用滑动窗口机制来实现。发送方和接收方都维护一个窗口大小,发送方根据接收方的窗口大小来决定发送数据的数量,接收方根据自身处理能力来调整窗口大小。可靠传输是指在数据传输过程中保证数据的完整性和可靠性,即确保数据能够按照正确的顺序到达接收方,并且没有丢失或损坏。滑动窗口机制也可以用于实现可靠传输。
2024-02-20 17:33:39
570
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅