
目标检测
mrcoderrev
C
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AlexNet:ImageNet Classification with Deep Convolutional Neural Networks
这个神经网络有6000万参数,和650000个神经元,包含5个卷积层(某些卷积层后面带有池化层)和3个全连接层,最后一个是1000维的softmax。 为了防止过拟合,使用了dropout的正则化方法。 使用了120万高分辨率图像分到1000个不同的类别中。 使用了非饱和的神经元并对卷积操作进行了非常有效的GPU实现。 cnn的前面部分,卷积-激活函数-降采样-标准化。 AlexNet论文翻译—...原创 2019-12-01 10:14:16 · 273 阅读 · 0 评论 -
归一化/标准化/正则化
为什么要进行归一化和标准化? 因为特征间的单位尺度可能不同,可能会导致计算结果也不同,尺度大的会起决定性作用,为了消除特征间的单位和尺度差异和影响,以对每维特征同等看待,需要对特征进行归一化操作。 因尺度差异,其损失函数的等高线可能是椭圆形,梯度方向垂直于等高线,下降会走zigzag路线,而不是指向local minimum,通过对特征进行平均值为0方差为1的变换后,其损失函数的等高线更接近圆形,...原创 2019-11-18 23:59:00 · 398 阅读 · 0 评论 -
梯度下降法(全局gGD和随机gSGD)
梯度下降法分为全局梯度下降和随机梯度下降 全局梯度法训练的时候用的是所有的训练样本 gGD=1n∑i=1nΔθL(xi,yi,θt)g_{GD} = {{1} \over {n}}\sum_{i=1}^{n}\Delta_{\theta}L(x^{i},y^{i},\theta_{t})gGD=n1∑i=1nΔθL(xi,yi,θt) θt+1=θt−ηgGD\theta_{t+1} =...原创 2019-11-17 12:47:53 · 1114 阅读 · 0 评论 -
YOLOv3: An Incremental Improvement
摘要 (1)比V2体积更大,精度更高,但是速度仍有保障 (2)输入320/*320的图片后,v3能在22ms内处理完成,并取得28.2mAP,精度和SSD相当,但速度快上3倍。 介绍 更新 2.1边框预测 V3用逻辑回归预测每个边界框的objective score。如果当前预测的边界框比之前的更好的与ground truth对象重合,那他的分数就是1,如果当前的预测不是最好的但是和ground ...原创 2019-11-06 16:12:07 · 207 阅读 · 0 评论 -
softmax和交叉熵
softmax用于多分类过程中,往往加在神经网络的他将多个神经元的输出,映射到(0,1)区间内,看成概率来解,这些值的累和为1,在选取输出节点的时候选取概率最大的节点作为我们的预测目标,从而进行多分类。 Si=ei(∑jej)S_{i} = { \frac{e_{i}} {\choose\sum_{j}e^{j}} }Si=(∑jej)ei softmax 相关求导 当对分类的Loss进...原创 2019-11-04 15:48:46 · 549 阅读 · 0 评论 -
环境配置
找cuda:ls /usr/bin/cuda 查看GPU型号:nvidia-sml 下载与cpu对应的pytorch,例如: pip install https://download.pytorch.org/whl/cu90/torch-1.1.0-cp37-cp37m-linux_x86_64.whl pytorch下载网站:https://download.pytorch.org/whl/cu...原创 2019-10-31 20:03:00 · 234 阅读 · 0 评论 -
YOLO9000: Better, Faster, Stronger
1.介绍 (1)大多数检测方法受限于小目标 (2)YOLOv2可以检测9000多种不同的物体 更好 (1)由于YOLO的缺点,我们的目标是提高召回和定位,同时保持分类的准确性。 (2)我们不是扩展我们的网络,而是简化我们的网络,然后使表示更容易学习。 ...原创 2019-10-27 10:02:12 · 287 阅读 · 0 评论 -
目标检测20年
00原创 2019-10-18 10:47:57 · 299 阅读 · 0 评论 -
You Only Look Once: Unified, Real-Time Object Detection
摘要 (1)将目标检测的设计看做是一个回归问题,从空间上分割边界框和类别的概率。 (2)在一次评估中,仅用一个神经网络就能预测整张图像的边界框和类别概率。 (3)特点: 1.检测速度非常快。 2.与其他实时检测系统相比能实现较高的mAP。 3.与其他先进的检测模型相比,定位误差更高,但不太可能将背景检测成目标(FP)。 4.能够学到非常泛化的表示。 1 介绍 (1)RPN网络的一些弊端: 1.使用...原创 2019-10-13 23:52:59 · 432 阅读 · 0 评论 -
目标检测历史进展
早期目标检测流程 (1)候选框生成 (2)特征向量提取 (3)区域分类 DeepLearning 时代目标检测 (1)二阶检测器(如CNN,(R-CNN)及其变体) 首先使用候选框生成器生成稀疏的候选框集,然后使用深度卷积网络编码生成候选框的特征向量,最后使用区域分类器预测候选框区域类别 (2)一阶检测器(如YOLO) 直接对特征图像上的每个位置进行类别预测 二阶检测器性能更优,一阶...原创 2019-10-18 10:47:36 · 577 阅读 · 0 评论