- 博客(4)
- 收藏
- 关注
原创 一文读懂目标检测:概念、算法与应用
目标检测面临诸多挑战。此外,目标的尺度变化也不容忽视,小物体包含的像素信息少,难以检测,而大物体占据像素多,可能跨越多个区域,对算法的尺度适应性要求很高。例如在检测行人时,可能会出现多个部分重叠的行人预测框,NMS 会筛选出最准确的那个,避免重复检测,提高检测结果的准确性。选择性搜索(selective search,简称 SS)则改进了这一问题,它基于图像中物体区域的相似性和连续性,通过图像分割生成许多小的子区域,再依据颜色、纹理、大小等相似性准则合并这些子区域,每次合并都生成外切矩形作为候选框。
2025-04-21 16:25:55
1877
原创 卷积神经网络(CNN):图像识别背后的 “超级捕手”
卷积层:特征提取的 “先锋队”:卷积层是 CNN 的核心引擎,它使用被称为 “卷积核” 的小窗口,像探照灯一样在图像上逐格扫描。不同的卷积核可以捕捉不同类型的特征,通过叠加多个卷积层,就能从简单的边缘逐步提取出复杂的物体形状。全连接层:决策输出的 “指挥官”:全连接层就像最终的 “指挥官”,它将池化层输出的特征图 “摊平”,并与预设的类别进行关联。卷积与特征提取:卷积层的卷积核开始工作,通过滑动窗口不断提取图像中的边缘、纹理等初级特征,形成初步的特征图。一、CNN 的核心架构:层层递进的 “特征猎手”
2025-04-18 17:27:22
409
原创 神经网络基础:从生物原型到计算模型
从生物神经元的仿生灵感,到多层感知机的数学建模,再到反向传播算法的工程实现,神经网络的发展始终遵循 "理论创新 - 技术突破 - 应用落地" 的螺旋上升路径。对于初学者而言,理解神经元模型的数学本质、掌握梯度优化的核心逻辑、通过实战项目积累调参经验,是进入深度学习领域的必经之路。如果需要调整特定章节的技术深度(如增加反向传播数学推导细节)、补充更多代码示例,或优化语言风格(更偏向学术严谨性 / 通俗可读性),可以随时告知具体需求,我将进一步优化。nn.Softmax(dim=1) # 分类输出。
2025-04-17 14:12:44
827
原创 深度学习与计算机视觉:核心技术与实战应用全解析
计算机视觉作为人工智能的核心分支,致力于赋予机器 “看懂” 世界的能力。基础感知:图像分类(识别物体 / 场景)、目标检测(定位与分类多目标)、图像分割(像素级区域划分)高级理解:姿态估计(人体动作分析)、三维重建(场景结构恢复)、视频动作识别(时序行为分析)
2025-04-16 16:43:26
973
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅