
cv
文章平均质量分 95
cv
晋级菜鸟
这个作者很懒,什么都没留下…
展开
-
经典网络结构总结--MobileNet系列
经典网络结构总结--MobileNet系列MobileNetmobilenet是Google提出的。优点:体积小,计算量小,适用于移动设备的卷积神经网络。可以实现分类/目标检测/语义分割;小型化:卷积核分解,使用1xN和Nx1的卷积核替换NxN的卷积核。采用bottleneck结构 ,以SqueezeNet为代表以低精度浮点数保存,例如Deep Compression冗余卷积核剪枝及哈弗曼编码。mobilenet v1:参考了传统的VGGNet等链式架构,都以层叠卷.原创 2021-07-12 17:42:43 · 6968 阅读 · 0 评论 -
目标检测入门:候选区域选择(region proposals)
转自:https://blog.youkuaiyun.com/M_Z_G_Y/article/details/81281398目标检测入门:候选区域选择(region proposals)滑动窗口 滑动窗口检测器是一种暴力检测方法,从左到右,从上到下滑动窗口,然后利用分类识别目标。这里使用不同大小的窗口,因为一张图片可能展示从不同距离观测检测出不同的目标类型 滑动窗口目标检测算法也有很明显的缺点,就是计算成本,因为你在图片中剪切出太多小方块,卷积网络要一个个地处理。如果你选用的步...转载 2020-10-17 17:17:46 · 1757 阅读 · 0 评论 -
关于颜色直方图中bins的理解
CV基础(bin)关于颜色直方图中bins的理解每个直方图,通常都可以用一个列向量来表示,列向量里面的每一个值就是一个bin,比如说列向量有个50个元素,那么就代表有50个bin。对于颜色直方图来说,横坐标是颜色空间(对应灰度直方图的灰度值),纵坐标是该颜色的像素点的数量。对于常用的RGB坐标一共有256x256x256=16777216种,这样横坐标过多,而且很多横坐标对应的像素点数量很少,整个直方图会很稀疏。因此将颜色空间划分为若干个小的颜色区间,对于每个颜色通道(R,G,B),每32个划转载 2020-10-17 17:11:05 · 5073 阅读 · 0 评论