MobileNet V2

MobileNetV2通过引入inverted residual和linear bottleneck等结构,在保持高效的同时显著减少了参数量。该模型采用Depthwise Separable Convolutions并加入1*1卷积层形成bottleneck,以扩大-提取特征-压缩的方式提升性能。

MobileNet V2 是对于MobileNet 的改进 此模型的主要特点是使用了 inverted residual 和 linear bottleneck 对于MobileNet本身的特点 使用Depthwise Separable Convolutions 被保留了下来 而在ResNeXt ShuffleNet 等网络非常有效的shortcuts 被引入了本结构。首先是对于bottleneck的改进 这里在原先MobileNet的Depthwise Separable convolutions基础上 加了一层1*1的卷积层形成bottleneck结构。 这里有个假设 神经网络中的manifold可以嵌入低维子空间中,这样通过加宽卷积层的通道数能够降低激活空间的维度 直至感兴趣的manifold充满整个空间。这样就有了 扩大-提取特征-压缩的bottleneck步骤。但是由于激活函数如ReLU的非线性计算 导致丢失了一部分信息 这是我们不想看到的 所以 在提压缩之后 没有使用非线性激活函数 而是选用了线性的来保护信息。这种扩大-提取特征-压缩的方式与residual 正好相反 于是叫做 inverted residual。文章相比于mobilenet和ShuffleNet都减小了参数和存储空间 这里我一开始没弄明白既然加了一层卷积 又是有扩大的操作 为何参数会变小 结果发现相对于mobilenet的layer output通道数都减小了 达到了减小计算量的目的。效果和其他几个网络接近但参数量很小 分别在分类 语义分割等方向有不错的效果。

对于文章中的manifold假设那部分一直没怎么看懂 结果看到同学发给我的博客 三言两语就将这篇文章讲的非常透彻和便于理解 非常佩服

### MobileNet V2 架构概述 MobileNet V2 是一种高效的卷积神经网络架构,专为移动设备和嵌入式视觉应用设计[^2]。它通过引入 **倒残差结构 (Inverted Residuals)** 和 **线性瓶颈 (Linear Bottlenecks)** 来优化计算效率和模型表现。 #### 主要特点 - **深度可分离卷积 (Depthwise Separable Convolutions):** 这种技术显著减少了计算复杂度和参数数量。标准卷积分解为两部分:深度卷积(depthwise convolution)处理空间信息,逐点卷积(pointwise convolution)负责通道间的交互[^4]。 - **倒残差块:** 倒残差块的设计思路是从低维特征映射扩展到高维特征映射,再压缩回低维输出。这种机制允许在网络较浅的部分保留更多细节信息,从而提升性能[^4]。 - **线性瓶颈:** 在每个倒残差块的末端使用线性激活函数来保持信息流稳定,防止因非线性操作导致的信息丢失。 --- ### 实现代码示例 以下是基于 PyTorch 的 MobileNet V2 模型加载与推理代码: ```python import torch from torchvision import models # 加载预训练的 MobileNet V2 模型 model = models.mobilenet_v2(pretrained=True) # 设置模型为评估模式 model.eval() # 创建随机输入张量 (模拟图像数据) input_tensor = torch.randn(1, 3, 224, 224) # 执行前向传播推理 with torch.no_grad(): output = model(input_tensor) print(output.shape) # 输出形状应为 [1, 1000] 对应 ImageNet 数据集中的类别数 ``` 此代码片段展示了如何利用 `torchvision` 中提供的接口快速加载并运行 MobileNet V2 预训练模型[^5]。 --- ### 使用场景分析 MobileNet V2 广泛应用于多种计算机视觉任务,例如图像分类、目标检测和语义分割等。其高效性和轻量化特性使其特别适合资源受限环境下的部署[^3]。具体来说,在 COCO 数据集中,MobileNet V2 被用作 SSD 单阶段检测器的基础特征提取器之一,并表现出良好的速度与精度权衡[^3]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值