
计算机视
白大力
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
人工智能专题-目标定位
引言 目标定位是图像处理或计算机视觉系统(如目标检测与分类,证件识别等)的第一步。任何计算机视觉系统都显性或隐性的包含着目标定位的步骤。目标定位的方法有传统方法和基于卷积神经网络的深度学习方法,本文主要讨论后者。深度学习方法有更好的鲁棒性(robustness),对各种问题实现形式统一,无需人为设定参数,无需太多的图像处理知识等优点。 问题的定义 目标定位解决的是在一张图像中找到我们感兴趣的原创 2018-01-28 12:58:58 · 3015 阅读 · 0 评论 -
非极大抑制算法-NMS
非极大抑制算法顾名思义就是抑制那些非极大的选项。 对于目标检测,非极大抑制算法根据两个条件来抑制候选窗口: 1. 同类预测条件下置信度低的窗口 2. 与置信度高的窗口IOU高的窗口 举例来说 上图中左边是候选窗口,右边是选出后的结果。左边候选窗口都以相对高的置信度预测出人脸,其中右图绿色对应的窗口置信度最高,这是满足条件1。并且置信度相对低的那些窗口与置信度高的绿色窗口的IOU高原创 2018-02-07 00:06:30 · 338 阅读 · 0 评论 -
卷积神经网络(CNN)
卷积层 从线性代数的角度看卷积层可看做是有强限制的全连层。这有助于理解梯度下降优化和反响传播。 从信号与系统的角度看卷积层相当于一个系统,卷积核就是系统的单位冲激响应。 激活函数 激活函数相当于放大器?二极管,三极管之类的东西? 池化层 信号与系统的角度看池化层就是抽样本。原创 2018-02-07 00:15:25 · 234 阅读 · 0 评论 -
【论文解读】MORAN: A Multi-Object Rectified Attention Network for Scene Text Recognition
MORAN: A Multi-Object Rectified Attention Network for Scene Text Recognition 这篇论文提出了自然场景下弯曲文字识别的一种网络MORAN。 MORAN 由两个部分组成:一个是弯曲矫正网络MORN,一个是识别网络ASRN。 弯曲矫正网络MORN MORN(Multi-Object Rectification...原创 2019-01-18 01:56:21 · 3444 阅读 · 0 评论 -
Stand-Alone Self-Attention in Vision Models
转自微信公众号 谷歌研究和谷歌大脑团队提出针对视觉任务的独立自注意力(stand-alone self-attention)层,用它创建的纯注意力(fully attentional)模型,在ImageNet分类任务和COCO目标检测任务中都超越了用卷积的基准模型,而且用了更少的浮点运算和更少的参数量。LearnX对具体内容整理如下。 在开始之前先对几个新的概念做一些解释。 独立自注...原创 2019-06-25 22:04:08 · 7355 阅读 · 1 评论 -
腾讯最新人脸检测模型DSFD: Dual Shot Face Detector
【LearnX导读】人脸检测是人脸相关应用中必不可少的一环。如我们熟悉的刷脸解锁,美颜相机,刷脸支付等都离不开人脸检测。这篇文章写的就是提高人脸检测准确度的方法。这篇文章从特征抽取,锚匹配(Anchor matching),损失函数三个方面研究人脸检测模型,相应的提出更强的特征学习模块EFM,更有效的锚匹配IAM,更有效的损失函数PAL来提高人脸检测的准确度。该方法在主流的人脸检测基准数据...原创 2019-06-28 22:22:52 · 3413 阅读 · 0 评论