自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 一文读懂目标检测:概念、算法与应用

目标检测面临诸多挑战。此外,目标的尺度变化也不容忽视,小物体包含的像素信息少,难以检测,而大物体占据像素多,可能跨越多个区域,对算法的尺度适应性要求很高。例如在检测行人时,可能会出现多个部分重叠的行人预测框,NMS 会筛选出最准确的那个,避免重复检测,提高检测结果的准确性。选择性搜索(selective search,简称 SS)则改进了这一问题,它基于图像中物体区域的相似性和连续性,通过图像分割生成许多小的子区域,再依据颜色、纹理、大小等相似性准则合并这些子区域,每次合并都生成外切矩形作为候选框。

2025-04-21 16:25:55 1877

原创 卷积神经网络(CNN):图像识别背后的 “超级捕手”

卷积层:特征提取的 “先锋队”:卷积层是 CNN 的核心引擎,它使用被称为 “卷积核” 的小窗口,像探照灯一样在图像上逐格扫描。不同的卷积核可以捕捉不同类型的特征,通过叠加多个卷积层,就能从简单的边缘逐步提取出复杂的物体形状。全连接层:决策输出的 “指挥官”:全连接层就像最终的 “指挥官”,它将池化层输出的特征图 “摊平”,并与预设的类别进行关联。卷积与特征提取:卷积层的卷积核开始工作,通过滑动窗口不断提取图像中的边缘、纹理等初级特征,形成初步的特征图。一、CNN 的核心架构:层层递进的 “特征猎手”

2025-04-18 17:27:22 409

原创 神经网络基础:从生物原型到计算模型

从生物神经元的仿生灵感,到多层感知机的数学建模,再到反向传播算法的工程实现,神经网络的发展始终遵循 "理论创新 - 技术突破 - 应用落地" 的螺旋上升路径。对于初学者而言,理解神经元模型的数学本质、掌握梯度优化的核心逻辑、通过实战项目积累调参经验,是进入深度学习领域的必经之路。如果需要调整特定章节的技术深度(如增加反向传播数学推导细节)、补充更多代码示例,或优化语言风格(更偏向学术严谨性 / 通俗可读性),可以随时告知具体需求,我将进一步优化。nn.Softmax(dim=1) # 分类输出。

2025-04-17 14:12:44 827

原创 深度学习与计算机视觉:核心技术与实战应用全解析

计算机视觉作为人工智能的核心分支,致力于赋予机器 “看懂” 世界的能力。基础感知:图像分类(识别物体 / 场景)、目标检测(定位与分类多目标)、图像分割(像素级区域划分)高级理解:姿态估计(人体动作分析)、三维重建(场景结构恢复)、视频动作识别(时序行为分析)

2025-04-16 16:43:26 973 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除