
深度学习
文章平均质量分 89
分享深度学习相关算法
思绪零乱成海
静以修身,俭以养德。非淡泊无以明志,非宁静无以致远。
展开
-
RSDet论文解读
文章导读旋转框的目标检测任务通常出现在遥感数据,文本数据,以及点云鸟瞰图数据中。对旋转框的表达会采用中心点和长宽再加上旋转角,然后设计损失函数求学习误差。以下介绍一篇讲述旋转框回归引起的旋转敏感度误差以及如何解决该问题的文章《Learning Modulated Loss for Rotated Object Detection》。目录 前沿 核心思想 问题描述 解决方法 思考展望 前沿目标检测任务根据方向,通常可分为水平框检测和旋转..原创 2021-02-26 18:39:15 · 1109 阅读 · 0 评论 -
炼丹系列之原料储备
文章导读随着人工智能在各行各业的渗透,AI算法越来越受到人们的关注,目前大多数AI算法仍然采用有监督学习的方式进行训练,而数据的质量就成了算法能力的上限,因此对数据打标签就成了一项至关重要的工作内容。本文针对计算机视觉领域的数据标注类型及一些开源工具进行简要介绍。目录 数据标注简介 视觉标注类型 开源标注工具 标注难点分析 数据标注简介数据标注是对原始数据(图片、视频、语音、文本等)添加一个或多个有意义的信息标签以提供使机器学习模型能够从它进行学习。.原创 2021-02-24 12:55:10 · 967 阅读 · 1 评论 -
TANet论文解析
文章导读本文是一篇将注意力机制应用在点云目标检测中的文章《TANet: Robust 3D Object Detection from Point Clouds with Triple Attention》,通过三元注意力机制强化目标信息,并用二级回归的方法提高定位精确度。目录 前沿 核心思想 框架结构 实现细节 要点分析 思考展望 前沿3D点云目标检测通常采用三种策略:1. 基于原始点云的方法,设计网络提取特征,然后用两阶段.原创 2021-02-20 13:17:09 · 2525 阅读 · 0 评论 -
目标检测回归损失函数——IOU、GIOU、DIOU、CIOU
一、IOU Loss上一篇文章提到L1,L2及其变种只将Bounding box的四个角点分别求loss然后相加,没有引入box四个顶点之间的相关性并且模型在训练过程中更偏向于尺寸更大的物体。在此基础上旷视在2016文章《UnitBox: An Advanced Object Detection Network》中提出了IOU Loss将4个点构成的box看成一个整体做回归。文章链接:https:...原创 2020-12-25 14:59:57 · 4274 阅读 · 3 评论 -
深度学习——卷积块回顾
Bottleneck块Bottleneck模块的思想是通过1×1卷积先减少维度再增加维度,启到减少参数降低运算量的作用。def bottleneck_module(x, out_dim, ratio=4): conv = Conv2D(filters=out_dim // ratio, kernel_size=1)(x) conv = Conv2D(filters=o...转载 2018-12-12 13:41:53 · 4718 阅读 · 0 评论 -
tensorflow随笔——Yolo v1
Yolo背景Yolo的训练和检测均在一个端到端的网络中进行,将物体检测作为回归问题求解,输入图像经过一次Inference,便能得到图像中所有物体的位置和其所属类别及相应置信概率。这种直接选用整图训练模型的架构可以更好的区分目标和背景区域,相比于proposal的方法更少把背景区域误检为目标。Inference过程YOLO网络结构由24个卷积层与2个全链接层构成,卷积层用来提取...原创 2018-11-21 19:15:44 · 472 阅读 · 0 评论 -
tensorflow随笔——C++工程化
本文主要描述如何基于Tensroflow从线下训练到线上预测的整个流程。主要包括以下几步:使用Python接口搭建模型训练参数并固化成pb文件 使用Bazel编译Tensorflow源码得到tensorflow_cc.so的动态库 调用Tensorflow C++ API编写预测代码使用Python搭建模型训练mnist手写字符简单搭建2层CNN+2层FC的神经网络,保存网络图结构和...原创 2018-11-16 15:43:33 · 5758 阅读 · 2 评论 -
GANs之信息量、信息熵、交叉熵、KL散度、JS散度、Wasserstein距离
信息量也叫做香农信息量,常用于刻画消除随机变量X在x处的不确定性所需的信息量大小。假设只考虑连续型随机变量的情况,设p为随机变量X的概率分布,即p(x)为随机变量X在X=x处的概率密度函数值,随机变量X在x处的香农信息量定义为:信息量的单位为比特。上式只定义了随机变量在一个点处的香农信息量,衡量随机变量X在整个样本空间的总体香农信息量可以通过信息熵来表示,即香农信息量logp(x)的数学期...原创 2018-09-24 21:54:16 · 4235 阅读 · 3 评论 -
tensorflow随笔——深度学习中GPU型号对比
深度学习是机器学习的一个分支。深度学习通过深层神经网络自行寻找特征来解决问题,不同于传统方法需要告诉算法找什么样的特征。为获取数据的本质特征深度神经网络需要处理大量信息,一般有两种处理方式:CPU和GPU先抛出三个问题:1. 为什么深度学习需要使用GPU?2. GPU的哪些性能指标最重要?3. 如何选购GPU? CPU or GPU:CPU是基于延迟优化,更擅长快速获取...原创 2018-08-16 16:50:12 · 20110 阅读 · 4 评论 -
tensorflow随笔——图像分类、检测,语义分割综述
看到一篇关于目标分类/检测/风格的综述型文章,觉得写的挺好,收藏下。本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用,包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。图像分类(image classification)给定一张输入图像,图像分类任务旨在判断该图像所属类别。(1) 图像分类常用数据集以下是几种常用分类数据集,难度依次递增。h...转载 2018-08-16 13:49:01 · 2551 阅读 · 2 评论