迪哥论文-优快云博客

原创一文读懂目标检测：概念、算法与应用

目标检测面临诸多挑战。此外，目标的尺度变化也不容忽视，小物体包含的像素信息少，难以检测，而大物体占据像素多，可能跨越多个区域，对算法的尺度适应性要求很高。例如在检测行人时，可能会出现多个部分重叠的行人预测框，NMS 会筛选出最准确的那个，避免重复检测，提高检测结果的准确性。选择性搜索（selective search，简称 SS）则改进了这一问题，它基于图像中物体区域的相似性和连续性，通过图像分割生成许多小的子区域，再依据颜色、纹理、大小等相似性准则合并这些子区域，每次合并都生成外切矩形作为候选框。

2025-04-21 16:25:55 1877

原创卷积神经网络（CNN）：图像识别背后的 “超级捕手”

卷积层：特征提取的 “先锋队”：卷积层是 CNN 的核心引擎，它使用被称为 “卷积核” 的小窗口，像探照灯一样在图像上逐格扫描。不同的卷积核可以捕捉不同类型的特征，通过叠加多个卷积层，就能从简单的边缘逐步提取出复杂的物体形状。全连接层：决策输出的 “指挥官”：全连接层就像最终的 “指挥官”，它将池化层输出的特征图 “摊平”，并与预设的类别进行关联。卷积与特征提取：卷积层的卷积核开始工作，通过滑动窗口不断提取图像中的边缘、纹理等初级特征，形成初步的特征图。一、CNN 的核心架构：层层递进的 “特征猎手”

2025-04-18 17:27:22 409

原创神经网络基础：从生物原型到计算模型

从生物神经元的仿生灵感，到多层感知机的数学建模，再到反向传播算法的工程实现，神经网络的发展始终遵循 "理论创新 - 技术突破 - 应用落地" 的螺旋上升路径。对于初学者而言，理解神经元模型的数学本质、掌握梯度优化的核心逻辑、通过实战项目积累调参经验，是进入深度学习领域的必经之路。如果需要调整特定章节的技术深度（如增加反向传播数学推导细节）、补充更多代码示例，或优化语言风格（更偏向学术严谨性 / 通俗可读性），可以随时告知具体需求，我将进一步优化。nn.Softmax(dim=1) # 分类输出。

2025-04-17 14:12:44 827

原创深度学习与计算机视觉：核心技术与实战应用全解析

计算机视觉作为人工智能的核心分支，致力于赋予机器 “看懂” 世界的能力。基础感知：图像分类（识别物体 / 场景）、目标检测（定位与分类多目标）、图像分割（像素级区域划分）高级理解：姿态估计（人体动作分析）、三维重建（场景结构恢复）、视频动作识别（时序行为分析）

2025-04-16 16:43:26 973 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 一文读懂目标检测：概念、算法与应用

原创 卷积神经网络（CNN）：图像识别背后的 “超级捕手”

原创 神经网络基础：从生物原型到计算模型

原创 深度学习与计算机视觉：核心技术与实战应用全解析

空空如也

空空如也

原创一文读懂目标检测：概念、算法与应用

原创卷积神经网络（CNN）：图像识别背后的 “超级捕手”

原创神经网络基础：从生物原型到计算模型

原创深度学习与计算机视觉：核心技术与实战应用全解析