- 博客(125)
- 收藏
- 关注
原创 YOLO系列正传(五)YOLOv4论文精解(上):从CSPNet、SPP、PANet到CSPDarknet-53
至此,我们详细讲解了CSPNet、SPP、PANet的相关重点,以及YOLOv4模型网络CSPDarknet-53的模型结构内容!
2024-12-28 21:53:14
2113
原创 YOLO系列正传(四)YOLOv3论文精解(下)——损失函数推导与其他优化项
这篇文章详细解析了YOLOv3模型的损失函数,主要包括三个部分:1.lbox(边框损失):通过计算预测框和目标框的 CIOU来评估框的重叠程度,损失为 1 -IoU的均值。2. lobj(目标物体损失):根据预测框和目标框的 IoU 计算物体存在性的损失,使用 BCE来衡量物体存在性预测和目标之间的差异。3. lcls(类别损失)基于预测的类别概率和目标类别之间的 BCE 损失,优化类别分类精度。最终的总损失是三部分损失的加权和
2024-12-22 22:30:55
1983
1
原创 YOLO系列正传(三)神经网络的反向传播(back propagation)与公式推导
那么很简单,我们只需要对此函数求导并使得导函数为零我们就能解出最小的loss所需要的参数w和b。我们只需要逐步慢慢靠近偏导数指向的方向,我们就能将模型慢慢拟合到我们期望的方向!在私信反馈中,发现有些读者针对反向传播的原理不甚了解,所以我们今天我们针对神经网络的正向与反向传播的原理进行详解。在视觉检测领域独领风骚,本系列旨在从小白出发,给大家讲解清楚视觉检测算法的前世今生,并讲清楚YOLOv11版本算法的所有模块功能!我们从此入手进行推导!这是因为我们在求解某一层的w的解析解的时候,我们有一个前提,那就是。
2024-12-18 14:00:15
1789
2
原创 YOLO系列正传(二)YOLOv3论文精解(上)——从FPN到darknet-53
综上,我们完成了YOLOv3的原理初探,从图像金字塔到FPN特征金字塔,再到YOLOv3的相关原理与网络结构,以及公式推导。我们对YOLOv3的原理有了一个较为清晰的认知。
2024-12-09 23:44:20
1945
原创 YOLO系列正传(一)类别损失与MSE损失函数、交叉熵损失函数
随着YOLOv11版本的发布,YOLO算法在视觉检测领域独领风骚,本系列旨在从小白出发,给大家讲解清楚视觉检测算法的前世今生,并讲清楚YOLOv11版本算法的所有模块功能!在YOLOv1中,作者对所有的数值采用的都是均方差损失函数,即MSE。然而在YOLOv3中,作者使用了交叉熵损失函数来表示分类回归损失。
2024-12-05 23:41:01
2380
原创 YOLO系列基础合集——小白也看得懂的论文精解
随着YOLOv11版本的发布,YOLO算法在视觉检测领域独领风骚,本系列旨在从小白出发,给大家讲解清楚视觉检测算法的前世今生,并讲清楚YOLOv11版本算法的所有模块功能!在本系列的内容中,我们主要讲解YOLO系列的基础内容。从卷积神经网络基础原理到YOLOv2的论文精解,涵盖了YOLOv1到YOLOv2的所有理论基础,这也是后续YOLO系列的基础内容。敬请期待,YOLO系列的正传!
2024-12-04 17:58:27
884
原创 YOLO系列基础(十)YOLOv2论文及原理详解(下)Darknet-19网络结构
batch norm 归一化层anchor boxes 锚框PassThrough直通层multi-scale 多尺度训练高分辨率分类器预训练 Darknet-19网络综上,我们针对YOLO9000进行了全面的学习和回顾!接下来就是YOLOv3了!
2024-12-03 11:32:38
1683
原创 YOLO系列基础(九)YOLOv2论文及原理详解(上)
随着YOLOv11版本的发布,YOLO算法在视觉检测领域独领风骚,本系列旨在从小白出发,给大家讲解清楚视觉检测算法的前世今生,并讲清楚YOLOv11版本算法的所有模块功能!在YOLO(You Only Look Once)系列算法的演进中,YOLOv1作为开山之作,奠定了实时目标检测的基础框架。但是YOLOv1仍然存在诸多缺陷,且同期的其他检测算法也在蒸蒸日上抢夺最强检测算法的宝座,本文从YOLOv1的缺陷出发,详解YOLOv2的原理和改进措施。
2024-11-22 08:30:00
1402
原创 深入排查Unity开发中的“要实例化的对象为空”异常:一次从报错到修复的完整历程
摘要:Unity开发中常见的"实例化对象为空"异常通常由资源引用问题引起。本文分析了错误堆栈,提出四步诊断法:检查Inspector引用配置、验证动态加载路径、排查AssetBundle/Addressables系统问题,以及考虑异步编程环境的影响。文章还介绍了高级调试技巧和预防措施,强调防御性编程和资源管理的重要性。通过系统排查,开发者不仅能解决当前问题,还能深入理解Unity资源管理机制,提升代码质量。
2025-12-15 23:15:40
868
原创 平面薄片对质点的引力:从牛顿定律到三重积分的完整推导
本文从牛顿万有引力定律出发,系统推导了平面薄片对空间质点的引力积分公式。通过建立物理模型和数学框架,详细分析了引力微元的向量表达式及其分量形式。重点探讨了对称性条件对计算结果的简化作用,并以均匀圆盘为例展示了具体计算过程。文章还介绍了数值积分和蒙特卡洛等计算方法,并讨论了在重力勘探、天体物理等领域的应用。最后指出未来研究方向,包括非均匀材料、相对论修正等复杂情况下的引力计算问题。
2025-12-11 22:42:31
906
原创 文件系统磁盘块分配方式:从隐式链接到索引结构
本文系统分析了文件系统磁盘块分配的三种主要策略:隐式链接、显式链接(FAT)和索引分配(inode)。隐式链接实现简单但随机访问性能差;显式链接通过集中式FAT表减少磁盘I/O;索引分配采用多级结构实现高效随机访问。现代文件系统如ext4、ZFS和Btrfs综合多种策略,在空间效率、性能和可靠性间取得平衡。随着NVM和分布式存储的发展,块分配策略仍在持续创新,需适应新型存储介质和应用需求的变化趋势。
2025-12-11 20:12:03
617
原创 线性代数核心概念:正定矩阵、合同矩阵与正交矩阵
本文系统总结了线性代数中正定矩阵、合同矩阵和正交矩阵的核心概念。正定矩阵通过二次型正定性定义,具有特征值全正、可Cholesky分解等性质;合同矩阵由惯性定理刻画,保持惯性指数不变;正交矩阵对应标准正交基,保持内积不变。特别指出实对称矩阵的特征向量正交性,这是谱定理的基础。这些概念在优化、科学计算等领域有重要应用,理解其相互关系对掌握线性代数理论至关重要。
2025-12-10 16:25:34
1380
1
原创 Python合并多个PDF文件:完整指南与实践
本文介绍了三种使用Python合并PDF文件的方法:PyPDF2、pypdf和PyPDF4。重点推荐使用pypdf库,它是PyPDF2的继任者,具有现代化API且持续维护。文章提供了详细的代码示例,包括基础合并功能和进阶书签添加功能。PyPDF2虽然经典但已停止维护,PyPDF4作为其分支仍在更新。每种方法都分析了优缺点,并给出了安装指南和实践案例,帮助开发者根据需求选择最适合的解决方案。文中还包含错误处理、文件验证等实用技巧,确保合并过程稳定可靠。
2025-12-09 23:57:29
866
原创 傅里叶级数全面解析:从理论基础到典型例题
本文系统介绍了周期为2l的傅里叶级数理论及其应用。首先给出了傅里叶级数展开的基本公式和系数计算方法,阐述了利用三角函数正交性分解周期性函数的原理。接着讲解了狄利克雷收敛定理的条件和结论,说明级数在连续点和间断点的收敛特性。针对奇偶函数,分别介绍了正弦级数和余弦级数的简化计算方法,并讨论了周期延拓、奇延拓和偶延拓的处理技巧。最后通过典型例题,详细演示了偶延拓条件下傅里叶系数的计算过程,以及利用小量近似求解极限的完整思路,体现了傅里叶级数从理论到实践的应用逻辑。解题关键在于正确识别函数特性,选择合适的展开方式,
2025-10-03 16:39:29
575
原创 函数展开成幂级数的方法总结
本文 MR 幂级数展开方法,总结了三类常见函数的展开TPSPS展开技巧:(1) 对数函数类通过提取系数、因式分解或分式拆分转化为标准形式ln(1-x);(2) 分式函数类通过提取系数或部分分式分解化为1/(1-x)形式;(3) 三角函数平方类使用降幂公式展开。每类方法均配有典型例题示范解题步骤,并给出收敛域分析。这些方法为解题提供了系统思路,可有效解决大多数幂级数展开问题。
2025-10-03 13:32:50
1248
原创 幂级数的和函数求法总结及无穷幂级数公式大全
本文系统总结了幂级数收敛域与和函数的求解方法。主要内容包括:1. 收敛域确定,介绍不缺项幂级数、缺项幂级数的判别方法,以及阿贝尔定理的应用;2. 和函数求解技巧,详细阐述"先积后导"和"先导后积"两种方法在不同类型幂级数中的应用;3. 通过微分方程求解和函数的思路;4. 提供常用幂级数展开式及其收敛域表格。文中辅以典型例题解析,展示了如何综合运用这些方法解决实际问题。
2025-10-03 02:08:33
926
原创 级数敛散性判别方法全解析:从基础到进阶的技巧与原理
本文系统总结了级数敛散性的判别方法,重点分析了通项极限为0的必要条件,并针对不同形式的通项给出了具体的解题思路。对于对数型、泰勒展开型、差分型等常见级数,通过特征识别、原理分析和例题示范,展示了如何运用比较判别法、积分判别法等工具进行判断。文章特别强调了通过泰勒展开得到渐近表达式的重要性,并提供了处理函数值与导数值组合、收敛数列函数值等复杂情况的实用技巧。这些方法有助于读者在面对级数问题时建立系统的解题框架。
2025-10-03 00:31:22
1078
原创 级数敛散性判别:泰勒展开与等价无穷小的正确使用
本文通过两组级数实例,对比分析了泰勒公式法和等价无穷小法在判断级数敛散性中的适用条件。研究表明:等价无穷小法仅适用于正项级数,而泰勒公式法能更全面地分析非正项级数的敛散性,特别是对于交错级数或含振荡项的级数。文章强调正确理解两种方法的适用范围至关重要,并建议根据级数类型选择合适方法:正项级数优先使用等价无穷小法,非正项级数必须采用泰勒公式展开分析。
2025-10-02 22:01:22
749
原创 高阶常系数线性微分方程求解方法全解析
本文系统介绍了二阶常系数线性微分方程的求解方法。对于齐次方程,根据特征方程的判别式分三种情况讨论通解形式:不等实根、重根和共轭复根。非齐次方程特解求解针对两种常见形式给出了具体解法,并说明了叠加原理的应用。此外还介绍了欧拉方程的变量代换解法,以及n阶常系数线性微分方程的解结构。最后总结了核心思想、解题步骤和常见易错点,为求解此类微分方程提供了系统的方法论指导。
2025-09-28 23:22:07
877
原创 二阶可降阶微分方程的求解方法总结
类型特征代换方法关键步骤不显含yp(x) = y’求解 p’ = f(x, p)不显含xp(y) = y’求解 p·dp/dy = f(y, p)可划归型需变形视情况而定化为前两种类型掌握二阶可降阶微分方程的求解方法对于解决实际问题具有重要意义。通过识别方程类型、选择合适代换、熟练掌握求解步骤,我们能够有效解决这类微分方程问题。在实际应用中,灵活运用这些方法往往能起到事半功倍的效果。
2025-09-28 22:25:35
1358
1
原创 一阶微分方程求解方法详解:构建系统学习笔记
本文系统总结了一阶微分方程的四种基本解法:1)可分离变量方程,通过分离变量后积分求解;2)齐次方程,通过变量替换化为可分离形式;3)一阶线性方程,利用积分因子和求解公式;4)伯努利方程,通过变量代换转为线性方程处理。每种方法都给出了标准形式、求解步骤和典型示例,并分析了识别特征和解题技巧。最后提供了系统的识别流程图,帮助快速选择合适解法。这些方法覆盖了大多数一阶微分方程的求解需求,掌握后能有效解决相关问题。
2025-09-28 21:32:46
1006
原创 三角函数积分方法全面总结
本文系统总结了三角函数积分的常用方法,包括三角代换、奇偶性代换、降幂公式和分部积分。通过具体示例展示了各类积分问题的求解步骤,如$\sqrt{a^2-x^2}$型积分采用正弦代换,高次幂积分使用降幂处理,以及建立递推关系求解复杂积分。这些技巧能有效解决各类三角函数积分问题,是微积分学习的重要内容。
2025-09-27 19:44:38
965
原创 多元函数可微性的完整证明方法与理解
多元函数的可微性是微积分中的一个核心概念,它描述了函数在某一点附近能否用线性函数很好地近似。对于二元函数 $z = f(x, y)$,可微性意味着在点 $(x_0, y_0)$ 附近,函数值的变化可以由一个线性变换(全微分)来近似。
2025-09-23 22:30:36
1176
原创 为什么齐次线性方程组的系数行列式为零时有非零解?
在线性代数的学习中,我们经常会遇到这样一个重要结论:**齐次线性方程组的系数行列式为零时,方程组存在非零解**。这个结论不仅理论上有重要意义,在实际应用中也有着广泛的价值。本文将深入探讨这一现象背后的数学原理。
2025-09-23 21:39:56
1529
原创 多元函数微分学核心概念辨析:连续、偏导与可微
在多元函数微分学中,连续性、偏导数存在与可微性之间的关系远比一元函数中复杂。这些概念的细微差别常常成为学习的难点。本文将通过严格的定义、直观的解释和反例,彻底厘清它们之间的逻辑关系。
2025-09-20 23:43:57
1093
原创 完全解决!Python 3.12版本安装d2l包!
Python3.12安装d2l报错"module'pkgutil'hasnoattribute'ImpImporter'"的解决方案:该问题因Python3.12移除旧模块导致。解决方法是:1)从华为云镜像下载最新d2l源码;2)修改setup.py文件,将依赖版本号中的"=="改为">=";3)本地安装修改后的包。此方案通过放宽版本限制实现兼容,经测试在Python3.12环境下可正常运行d2l包。
2025-07-14 15:26:36
2642
9
原创 2026年考研数一重要公式大全集合(早上起来第一件事是什么!)
本文总结了高等数学中的重要公式与定理:1)泰勒展开式(包括指数、三角、对数等函数在x=0处的展开);2)积分相关公式(对称性、点火公式等)及旋转体体积计算;3)曲线曲率公式;4)数列求和公式(等差、等比数列);5)常用不等式(三角、均值等)。内容涵盖微积分、数列和不等式三大板块的核心知识点,适合作为数学公式速查手册使用。
2025-07-07 01:12:57
964
原创 无监督<视觉-语言>模型中的跨模态对齐
跨模态对齐指的是将来自不同模态的数据(如图像和文本)映射到一个共享的表示空间,使得同一实体在不同模态下具有相似的语义表示。例如,当给定一张图片和一段描述这张图片的文字时,我们希望模型能够将图像和文本映射到一个相似的向量空间,使得图像和文本之间的语义关系能够被正确地捕捉。在无监督学习环境下,这一任务面临着很多挑战。我们没有像传统的监督学习那样,有丰富的人工标注数据来指导模型学习,因此,需要模型自己从未标注的数据中发现图像和文本之间的潜在关系。
2025-01-20 20:51:15
1399
原创 数据结构与算法整理复习(一):数据结构概念与线性表
数据结构算法、线性表、增删改查、静态链表、双链表、循环链表、单链表、循环双链表、数据结构概念、顺序表。线性表不同数据结构的比较……
2025-01-20 08:30:00
1230
原创 PANet:路径聚合网络——实例分割的创新之路
在多实例分割场景下,某些实例可能因相似的外观或紧密的空间关系而难以区分,注意机制帮助网络更加关注这些难以分割的实例,提高了模型的鲁棒性。如果你对PANet的实现有更深的兴趣,或是希望了解如何将其应用到自己的项目中,欢迎继续关注我们后续的博客文章,我们将详细讲解如何在不同框架中实现PANet,并分享一些实际应用中的技巧和经验。为了克服这些问题,PANet提出了一种新的路径聚合策略,将低层次的细节信息与高层次的语义信息进行有效融合,从而提高了实例分割的准确性。作为一种经典方法,已经取得了显著的成果。
2024-12-28 21:56:15
1323
原创 多源多点路径规划:基于启发式动态生成树算法的实现
启发式动态生成树算法的核心思想是通过建立一棵动态生成树,其中每个节点代表一个路径选择的状态。在搜索过程中,算法递归地生成子节点,并通过启发式函数评估每个节点的优劣。每当我们到达一个叶子节点时,就计算其启发式值,并将这一值反向传递给父节点。最终,树的根节点会选择具有最小启发式值的子节点作为最佳路径。启发式函数在此过程中的作用至关重要。它通过结合路径的距离、货物状态等多个因素,动态地评估每个节点的优劣,进而引导路径的选择。
2024-12-25 20:03:41
1518
原创 数据增强之从对抗训练(AT)到自对抗训练(SAT)
对抗训练和自对抗训练是提升模型鲁棒性的关键技术。在对抗样本生成的质量和效率之间,需要根据实际需求进行权衡。希望本文能帮助初学者理解这两种方法的核心思想与实现过程,并在实践中探索适合的改进策略!
2024-12-25 15:05:36
1924
原创 深入理解批量归一化(BN):原理、缺陷与跨小批量归一化(CmBN)
批量归一化(BN)是一种在神经网络的训练过程中对每一层输入进行标准化的技术。具体来说,BN对每一层的输入数据进行均值为0、方差为1的归一化处理,从而消除了数据分布的变化(即内部协变量偏移BN的核心目标是加速网络训练过程,并提高网络的稳定性。简而言之,BN就是将每层的输入数据进行标准化处理,使其具有相同的尺度,这样可以避免某些层的输出值过大或过小,从而加速训练的收敛。跨小批量归一化(CmBN)通过跨多个小批量数据计算全局均值和方差,从而避免了单个小批量的统计量可能存在的误差。
2024-12-24 22:17:55
1909
原创 深度学习中的残差网络、加权残差连接(WRC)与跨阶段部分连接(CSP)详解
本文介绍了残差网络(ResNet)加权残差连接(WRC)和跨阶段部分连接(CSP)这三种网络架构,它们通过不同的方式提升了深度网络的训练效率、表达能力和计算效率。ResNet通过残差连接解决了深层网络训练中的梯度消失问题,使得深层网络的训练变得更加稳定。WRC通过引入可学习的加权机制,使得残差连接可以更灵活地调整输入和输出的贡献,从而提高了网络的表达能力。CSP通过跨阶段的部分连接,减少了冗余的信息传递和计算开销,提高了网络的效率。
2024-12-24 15:58:20
2279
原创 YOLO模型分布式训练:步骤与操作方式
分布式训练是将模型训练的任务分配到多个计算节点上,通过并行计算加速训练过程。数据并行(Data Parallelism):将数据切分成多个小批次(mini-batches),每个计算节点处理不同的数据,并同步更新模型参数。模型并行(Model Parallelism):将模型分成多个子模型,分配到不同的计算节点上进行计算。对于YOLO模型,分布式训练通常使用数据并行方式。每个GPU节点加载数据集的一部分,计算梯度,并通过一定的同步机制共享梯度,从而更新全局模型参数。
2024-12-22 22:36:00
1568
原创 深入理解YOLO系列目标检测头的设定方式
版本检测头结构关键技术优势缺点YOLOv1全连接层(FC)无速度快,设计简单,适合实时检测精度低,定位不准确,小物体检测能力差YOLOv2多卷积层 + passthrough更好的精度,适应不同尺寸物体,改进了小物体检测计算复杂度增加,锚框选择依赖数据YOLOv3多卷积层 + 跨层特征融合多尺度预测,特征金字塔(FPN)多尺度检测,精度更高,尤其是小物体检测计算开销大,推理速度较慢通过YOLOv1到YOLOv3。
2024-12-18 20:43:41
1382
原创 深入解读FPN中的横向连接:从细节到优化
尽管整体设计看似简单——上采样、高低层特征相加、卷积处理,但在实际应用中,这些步骤蕴含了许多细节与潜在的优化空间。今天我们以一个更细微的切入点,聚焦横向连接中的核心环节,探讨实现中的小技巧与优化方向。从特征对齐到权重分配,从卷积设计到上采样选择,细节的精雕细琢决定了FPN的性能上限。横向连接中,低层特征通常具有更高的通道数,而高层特征的通道数较低。特征融合后,可能存在高频噪声或边界不连续的问题,使用3×3卷积进一步处理融合特征,可以缓解混叠效应,提高特征的表达能力。使用可学习参数对高低层特征赋予不同权重。
2024-12-09 23:49:15
1223
原创 代码架构编写规范:多线程操作与多文件、多包设计
在多线程编程中,代码架构的设计不仅影响系统的性能,还决定了系统的可维护性、扩展性和可调试性。在多线程环境下,设计良好的架构可以有效避免竞态条件、死锁以及其他并发问题,同时提高系统的稳定性和可扩展性。本文将聚焦于如何在多线程操作中编写规范的代码架构,涵盖多文件、多线程、多包的交互设计,并提供线程机制的规范和保活机制的实现。
2024-12-05 23:46:20
1154
原创 深入解析YOLO中的Anchor机制及其优化
Anchor机制是YOLO中提高目标定位精度的关键组成部分。通过合理选择和优化Anchor框,我们能够显著提升检测精度。K-means聚类提供了一种简单而有效的方法来选择Anchor框,而YOLOv5则通过自动优化机制使得Anchor框的选择更加灵活。理解并合理优化Anchor框设置,能够帮助我们提升YOLO模型在实际应用中的性能。希望这篇博客能帮助你更深入地理解YOLO中的Anchor机制,并能够在实践中应用这一技术来优化模型的目标检测效果。如果你有任何问题或优化建议,欢迎在评论区交流
2024-12-04 18:30:20
2019
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅