
Caffe
文章平均质量分 94
图波列夫
这个作者很懒,什么都没留下…
展开
-
Caffe 中的 LRNLayer
Caffe 中的 LRNLayer 支持两种模式: CrossChannel:为人们所熟知的局部响应归一化,在 AlexNet 中提出,在一些早期网络中使用; WithinChannel: Caffe 中独有的实现,未见网络中应用。本文略过。ReLU 具有不需要输入归一化以防止其饱和的理想特性。但 AlexNet 论文中发现 LRN 有助于提高泛化性。LRN CrossChannel 模式公式如下:原创 2023-01-17 11:54:38 · 452 阅读 · 0 评论 -
Ristretto:面向硬件的卷积神经网络逼近
Ristretto是一个自动化的CNN近似工具,可以压缩32位浮点网络。Ristretto是Caffe的扩展,允许以有限的数字精度测试、训练和微调网络。Ristretto速览Ristretto Tool:Ristretto工具使用不同的比特宽度进行数字表示,执行自动网络量化和评分,以在压缩率和网络准确度之间找到一个很好的平衡点。Ristretto Layers:Ristretto重新实...翻译 2018-05-16 14:23:28 · 8485 阅读 · 22 评论 -
MegDet 与 Synchronized BatchNorm
深度学习时代的目标检测发展——从 R-CNN、Fast/Faster R-CNN 到最近的 MaskR-CNN 和 RetinaNet,主要来自新网络、新结构或损失设计。然而,作为深度神经网络训练的一个关键因素,mini-batch 的大小在目标检测方面还没有很好地进行研究。本文提出了一种大 mini-batch 目标检测器(MegDet),可以实现最大 mini-batch 为256的训练,从而...原创 2018-07-01 19:57:30 · 8114 阅读 · 0 评论 -
NVCaffe P2PManager
Caffe多GPU训练主要涉及4个类:P2PManager、P2PSync、Solver Net。 假设使用4个GPU进行训练,模块依赖图如下图所示: 值得注意的是,每个Solver会创建线程运行Solver::Reduce。而Solver::Reduce会借由Net::ReduceAndUpdate调用Net::Reduce和Solver::ApplyUpdate。这意味着Net::Fo...原创 2018-07-27 09:25:56 · 978 阅读 · 2 评论 -
Intel Caffe int8 推理校准工具
Intel int8 校准的代码源自 Ristretto,虽然没有 8-bit Inference with TensorRT 和 [MXNET-133] Model Quantization with Calibration 中使用 KL散度(Kullback-Leibler Divergence) 的功能高级,但仍可作为 Caffe 用户的福音。待 Tencent/ncnn int8 成熟...原创 2018-08-21 18:50:50 · 3876 阅读 · 6 评论 -
fb-caffe-exts:Facebook Caffe 推理多线程调用及内存优化
fb-caffe-exts 是 Facebook 在(主要)生产场景中使用 Caffe 时开发的扩展集合。predictor 是一个简单的 C++ 库,它封装了在共享权重的同时在多个线程中运行 caffe::Net 的常见模式。它还为推理情况提供了一个更方便使用的 API。该库主要由三个部分组成:可多线程调用的基本类 Predictor、线程池版本的 PooledPredictor 以及实现内存复...原创 2019-02-19 20:15:56 · 1407 阅读 · 6 评论 -
为 Caffe 添加 Python3 支持
python2已近生命终点,然而 Caffe 却受硬件厂商的拥护。于是我们尝试在 Python3 环境下编译 Caffe。Caffe Python 3.7 安装对于 Python 3.3+而言,需要搭配 Protobuf 3。因此不再需要 apt 安装libprotobuf-dev和protobuf-compiler,这二者是Protobuf 2 的。首先修改 CMakeLists.txt...原创 2019-04-20 17:54:58 · 6286 阅读 · 2 评论