
深度学习
文章平均质量分 82
Jimyang1ssa
这个作者很懒,什么都没留下…
展开
-
spconv中的SparseTensor中的常用数据结构说明
例如,如果稀疏张量的形状为 (B, C, D, H, W),则 indices 属性的形状为 (N, 5),其中每一行包含 5 个整数,表示非零元素在 (B, C, D, H, W) 这 5 个轴上的位置。每一行表示一个非零元素的特征向量,例如,如果稀疏张量的形状为 (B, C, D, H, W),并且每个非零元素需要一个 4 维的特征向量,例如表示物体类别和得分,则 features 属性的形状为 (N, 4)。对象中是一个表示稀疏张量空间维度大小的元组,通常用于描述图像数据的大小。原创 2023-04-18 23:01:25 · 2628 阅读 · 0 评论 -
LayerNorm的理解
LayerNorm计算公式:y=x−E(x)Var(x)+ϵ∗γ+βy=\frac{x-E(x)}{\sqrt{\operatorname{Var}(x)+\epsilon}} * \gamma+\betay=Var(x)+ϵx−E(x)∗γ+β一般有两种计算LayerNorm的方式,这两种方式的区别在与进行归一化操作的维度不同,假设输入的tensor维度为NxCxHxW,则两种计算方式分别如下:(1)计算一个batch中所有channel中所有参数的均值和方差,然后进行归一化,操作维度为C原创 2022-04-30 13:29:40 · 13493 阅读 · 0 评论 -
An Analysis of Scale Invariance in Object Detection-SNIP论文阅读笔记
提出问题深度学习方法提出后,目标分类任务性能急剧提升,top-5 error on ImageNet已经从15%降低到2%,这对于1000类目标分类任务已经超越了人类水平。但是在COCO数据集上的检测任务中(目标只有80类)检测器的mAP性能却只有62%(即使overlap设置只有50%)。为什么目标检测要比目标分类任务困难许多?检测目标的尺度范围变化很大(在COCO检测数据集中,最小的...翻译 2018-09-29 20:37:13 · 362 阅读 · 0 评论 -
darknet中YOLO分类损失梯度源码理解
之前一直对darknet中的分类损失梯度计算函数有些不太明白,不清楚为何在开始还有有一段对delta[index]是否为0的判断。后来思考了一下,觉得应该是这个原因。首先看一下这段代码:void delta_yolo_class(float *output, float *delta, int index, int class, int classes, int stride, float *...原创 2018-08-23 10:30:48 · 1941 阅读 · 10 评论 -
tensorFlow学习资源总结
持续更细中:实践强化学习应用于游戏:https://github.com/yenchenlin/DeepLearningFlappyBirdtensorFlow示例代码:https://github.com/aymericdamien/TensorFlow-Examples博客文章First Contact With TensorFlow学习笔记:https://gith...原创 2018-08-27 14:48:23 · 262 阅读 · 0 评论 -
MetaAnchor: Learning to Detect Objects with Customized Anchors
Abstract本文提出了一种灵活有效的anchor生成机制用于目标检测框架,我们取名为MetaAnchor,不同于之前的检测框架中,使用预先设定的Anchor,MetaAnchor可以从任意的自定义的预设box中动态生成。MetaAnchor可以适用于任何的基于anchor的目标检测框架,如RetinaNet。与之前的anchor预先定义的机制相比,我们发现MetaAnchor在anchor...翻译 2018-07-22 21:06:26 · 3019 阅读 · 0 评论 -
Training Region-based Object Detectors with On line Hard Example Mining阅读笔记
Training Region-based Object Detectors with On line Hard Example Mining1.Introduction目标检测经常转换为目标classification问题。这样做的后果就是导致标注的目标和背景的比例严重不均衡。 在使用滑动窗口时,背景与目标框的比例约为100000:1.虽然近年来的object-proposal-based方法翻译 2017-09-02 18:40:08 · 736 阅读 · 0 评论 -
python导入caffe模块的问题
出现如下问题:from caffe import layers as L, params as P, to_protoImportError: No module named caffe这是由于没有将caffe的python模块添加到python的引用目录中导致的,解决方法:sudo vim ~/.bashrc在文件最后写入如下内容:export PYTHONPATH=~/caffe/python原创 2017-08-30 20:30:28 · 15097 阅读 · 0 评论 -
Ubuntu16.04+CUDA8.0+openCV3.2配置
CUDA安装问题opencv安装问题安装过程中出现一些问题,记录一下:CUDA安装问题opencv安装问题CUDA安装问题安装CUDA时,选择使用CUDA安装包中的Nvidia驱动,但是在安装驱动的时候总是说驱动安装失败。 查看安装错误日志,发现是由于Nouveau driver已经安装的原因导致Nvidia driver无法安装(Nouveau driver是第三方开源driver):原创 2017-07-15 16:18:44 · 1484 阅读 · 0 评论 -
1*1卷积网络的作用
之前在看GoogLeNet中的Inception v1模型时,看到其中有很多1*1的卷积层,之前总是不太明白加这些有什么用啊?降维在认真学习后,发现自己忽略了一个重要的因素。就是卷积核的个数。1*1的卷积核主要是通过减少channel数量来实现特征维度降低,从而减少整个网络模型的参数的。原始的Inception module中,参数数量为:(64*192*1*1)+(128*192*3*3)+(32原创 2017-05-09 20:35:30 · 1333 阅读 · 0 评论 -
Caffe中的layer
在网上看到一张很好的关于Caffe中的layer type的梳理,记录一下:原创 2017-05-04 20:23:04 · 698 阅读 · 0 评论 -
Caffe windows踩坑
caffe model下载在caffe-master\script路径下执行下载脚本:python download_model_binary.py models/bvlc_reference_caffenet出现如下错误:ERROR:[Errno 2] No such file or directory:'models/bvlc_reference_caffenet\\readme.md'usa原创 2017-04-14 12:44:35 · 1170 阅读 · 0 评论 -
资源收集
深度学习,计算机视觉相关资源的收集整理原创 2016-01-11 23:43:13 · 957 阅读 · 0 评论