
deep_learning
文章平均质量分 90
机械不学习
这个作者很懒,什么都没留下…
展开
-
语义分割---边缘优化
视频分割在移动端的算法进展综述原创 2023-06-25 19:40:18 · 4877 阅读 · 0 评论 -
移动端语义分割
1.1 基础模型1.1.1GhostNet图1是由ResNet-50中的第一个残差块生成的某些中间特征图的可视化。从图中我们可以看出,这里面有很多特征图是具有高度相似性的(在图中分别用不同的颜色示意),换句话说,就是存在许多的冗余特征图。所以从另一个角度想,我们是不是可以利用一系列的线性变化,以很小的代价生成许多能从原始特征发掘所需信息的“幻影”特整图呢?这个便是整篇文章的核心思想深度卷积神经网络通常是由大量的卷积块所组成的,导致大量的计算成本。尽管最近的工作,例如Mobile...原创 2024-09-18 14:05:24 · 670 阅读 · 0 评论 -
Real-time Hair Segmentation and Recoloring on Mobile GPUs
问题:如何在手机端实现 实时、细致、时间连续的 Hair Mask 分割?首先一个高质量的数据集是关键,1.1.1 网络输入为了确保帧间输出的时间连续性,一般使用的LSTM耗时太高,因此输入使用:4 channels (RGB + previous frame mask) → current frame mask1.1.2 数据增强为了实现高质量的视频分割效果,除了实现帧到帧的时间连续性之外,我们还需要考虑时间的不连续性,例如突然出现在摄像机视野中的人:因此在使用 previou..原创 2024-09-18 14:06:05 · 424 阅读 · 0 评论 -
ssd 详解
1.1.1 网络结构ssd的基础网络和vgg16是一样的不过全连接层换成了conv6+relu+conv7+relu.其后的层称为extra layer以得到更多不同尺寸的feature map. 并且对网络中conv4_3, conv7,conv8_2,conv9_2,conv10_2,conv11_2这六个layer的feature map再做卷积,得到类别和位置信息.具体操作为:分别用2组3 x 3的卷积核去做卷积,一个负责预测类别,一个负责预测位置.卷积核的个数分别为boxnum x cl原创 2020-05-11 22:58:13 · 7286 阅读 · 0 评论 -
神经网络优化思路
一,通用优化技巧二,目标检测优化2.1 如何更好的检测小目标常用的方法有:第一种:图像金字塔(不常用),将输入图片放缩成不同比例,将预测结果融合得到最终输出 第二种:特征融合,融合 Encoder阶段的多尺度特征和Decoder上采样特征以恢复空间分辨率 第三种:在原始模型的顶端叠加额外的模块,以捕捉像素间长距离信息。例如Dense CRF,或者叠加一些其他的...原创 2023-06-25 19:36:22 · 2611 阅读 · 0 评论