【论文学习笔记-1】XNOR-net

本文介绍了XNOR-net,一种高效的二值化神经网络。它包括Binary-Weight-Networks和XNOR-Networks两种架构,分别实现了权重和输入的二值化,通过XNOR操作大幅降低了计算资源需求。
部署运行你感兴趣的模型镜像

【论文学习笔记-1】XNOR-net

简介

文章中提出了两种二值化网络,分别是Binary-Weight-NetworksXNOR-Networks

Binary-Weight-Networks对模型中的权重W进行二值化操作,即要么是1要么是-1。其中更新参数时依然采用原参数W进行更新。
XNOR-Networks通过对权重W和输入I都进行二值化操作,同时降低空间和实践复杂度。

二值化操作过程

传统的Conv层:I*W
其中I是输入,W是权重,*是卷积操作

Binary-weight-Network的二值化操作:(I*B)α
其中B为二值化的权重矩阵,α是一个实数。
二值化网络的过程就是找到合适的B和α。使得W≈αB,这里a默认为正数。
我们希望尺度参数α和二值矩阵B替代原来的权重,就希望W和αB的差距尽可能小,这里使用来描述两者的差距,设: J ( B , α ) = ∣ ∣ W - B , α ∣ ∣ 2 J(B,α) = ||W-B,α||^2 J(B,α)=WB,α2这里W和B看作向量,用的是向量的2范数的平方,则这里的α和B的取值则为J最小时对应的α和B的值,记为:
α ∗ , B ∗ = a r g m i n J ( B , α ) α^*,B^*=argminJ(B,α) αB=argminJ(Bα)由于矩阵二范数符合分配律,得:
J ( B , α ) =

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值