
深度学习
文章平均质量分 94
星落秋风五丈原
胜败乃兵家常事 少侠请重新来过
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
旋转矩阵、欧拉角、轴角、四元数
旋转矩阵、欧拉角、四元数【如果有错的地方记得提醒我,感谢】一、左右手坐标系主要各种相机传感器坐标方向其实都不太一致,左手坐标系旋转90度还是左手坐标系,这里分左右手【关注的是三个坐标轴组合方式】。可以对照以上两张图自己转一下,图一来自网络,图二来自《视觉slam十四讲》。二、旋转矩阵2.1 什么是旋转矩阵?旋转矩阵:在乘以一个向量的时候有改变向量的方向但不改变大小的效果并保持了手性的矩阵。刚体上的任意一个点P(x1, y1, z1)绕过原点的轴(i, j, k)旋转θ,旋转后的点为P’(原创 2021-02-16 16:08:57 · 2586 阅读 · 0 评论 -
《AANet: Adaptive Aggregation Network for Efficient Stereo Matching》CVPR2020
AANet《AANet: Adaptive Aggregation Network for Efficient Stereo Matching》CVPR2020,针对双目匹配任务的论文。论文:https://arxiv.org/abs/2004.09548v1代码:https://github.com/haofeixu/aanet一、目的和贡献:目前最好的立体匹配模型基本都用3D卷积,计算复杂度高且占用大量存储空间,本论文的目的就是完全替代3D卷积;提出:尺度内代价聚合模块:基于稀疏点,缓解边原创 2020-06-25 08:42:27 · 2545 阅读 · 0 评论 -
《Dynamic Filter Networks》动态过滤网络
Dynamic Filter Networks《Dynamic Filter Networks》NIPS 2016论文链接:https://arxiv.org/abs/1605.09673一、目的卷积核参数训练完就是固定的,不够灵活,作者希望得到一个根据输入动态生成的过滤器。提出dynamic filter module(filter-generating network 、dynamic filtering layer).根据一个视角图预测其他视角(旋转人脸)、预测视频下一帧、2D变3D等等常原创 2020-06-05 00:49:54 · 4375 阅读 · 0 评论 -
SGM(Semi-Global Matching)算法笔记
SGM论文:《Stereo Processing by Semi-Global Matching and Mutual Information》半全局双目匹配算法:逐像素匹配;用互信息来做匹配代价;用多个一维平滑约束近似二维平滑约束进行“全局”优化。【全局匹配需要考虑所有像素,用一个全局能量函数;局部匹配需要针对局部区域做代价聚合;SGM不是只考虑像素局部区域,也没有考虑所有的像素,只考虑了非遮挡点。】逐像素匹配由平滑约束支持,该通常表示为全局代价函数。 SGM通过从各个方向的逐路径优化来快速近似原创 2020-05-11 16:25:56 · 6352 阅读 · 1 评论 -
相机标定笔记和python实现
摄像机标定【相机模型】和【相机参数】相关内容看这里:https://blog.youkuaiyun.com/qq_33278461/article/details/1010262591.什么是相机标定:图像测量和机器视觉里,为了能确定现实世界的任意一个点到图像上对应像素点的投影位置,需要建立一个相机成像的几何模型。几何模型的参数就是相机参数,包括内参、外参和畸变参数。得到这个参数的过程就叫相机标定。...原创 2020-04-21 17:10:45 · 2437 阅读 · 3 评论 -
几个目标检测loss对比:faster rcnn、ssd、yolov1、yolov2、yolov3的loss
目标检测loss一、faster rcnn:分为RPN和Fast rcnn两个部分,每个部分再分为分类和回归损失:RPN损失:L({pi},{ti})=1Ncls∑iLcls(pi,pi∗)+λ1Nreg∑ipi∗Lreg(ti,ti∗)\begin{aligned} L\left(\left\{p_{i}\right\},\left\{t_{i}\right\}\right)=\fra...原创 2019-09-11 23:54:54 · 2995 阅读 · 0 评论 -
PCA和LDA简介
PCA:PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法,可用于提取数据的主要特征分量。目的:在高维数据中找方差最大的方向, 将n维特征映射到k维上(k < n),k维特征是全新的正交特征,也叫主成分。步骤:1)将原始数据按列组成n行m列矩阵X;2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值...原创 2019-09-17 13:04:21 · 1237 阅读 · 1 评论 -
相机参数和相机模型各个坐标系(世界坐标系、相机坐标系、图像坐标系、像素坐标系之间变换)
坐标系变换几个坐标系:世界坐标系(world coordinate system):用户定义的三维世界的坐标系,为了描述目标物在真实世界里的位置而被引入。单位为m。相机坐标系(camera coordinate system):在相机上建立的坐标系,为了从相机的角度描述物体位置而定义,作为沟通世界坐标系和图像/像素坐标系的中间一环。单位为m。图像坐标系(image coordinate...原创 2019-09-19 16:14:41 · 8316 阅读 · 0 评论 -
轻量级网络:mobilnetv1,mobilnetv1,shufflenet v1,shufflenet v2笔记
轻量级网络本文大纲squeezenet: 还没写…mobilenet v1:《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications》mobilenet v2:《MobileNetV2: Inverted Residuals and Linear Bottlenecks》mob...原创 2019-09-22 17:09:37 · 505 阅读 · 0 评论 -
机器学习常用loss:L1 loss、L2 loss、smothL1 loss、huber loss
常用loss:L1:公式:L1=∑i=1n∣yi−f(xi)∣L1=\sum_{i=1}^{n}\left|y_{i}-f\left(x_{i}\right)\right|L1=i=1∑n∣yi−f(xi)∣导数:dL1(x)dx={1 if x≥0−1 otherwise \frac{\mathrm{d} L_{1}(x)}{\mathrm{...原创 2019-09-11 23:33:56 · 13844 阅读 · 2 评论 -
高斯卷积核C++实现
高斯滤波器:高斯滤波器是一种线性滤波器,能够有效的抑制噪声,平滑图像。其作用原理和均值滤波器类似,都是取滤波器窗口内的像素的均值作为输出。窗口模板的系数和均值滤波器不同,均值滤波器的模板系数都是相同的为1;高斯滤波器的模板系数,则随着距离模板中心的增大而系数减小。所以,高斯滤波器相比于均值滤波器对图像个模糊程度较小。公式:一维高斯函数:G(x)=1σ2πe−(x−x0)2/2σ2G(...原创 2019-09-03 22:20:24 · 689 阅读 · 0 评论 -
深度学习参数设置-CNN
训练技巧:1.数据增强:翻转,随机尺寸变换,裁剪,位置偏移,颜色抖动。 优点:可以提高网络泛化能力。2.预处理:零均值化(中心化)和标准化(归一化):取消由于量纲不同、自身变异或者数值相差较大所引起的误差。 优点:标准化加速梯度下降速度(加速收敛)、有可能提高精度。 零均值化:相当于平移到中心(0,0),变量减去均值。 标准化:使得不同的特征具有相同的尺度(Scale)...原创 2018-07-19 21:55:10 · 9031 阅读 · 0 评论 -
时序动作定位:CVPR2018-Rethinking the Faster R-CNN Architecture for Temporal Action Localization
一、摘要:密歇根大学和谷歌的工作,提出一个把Faster-rcnn思想从目标检测领域迁移到时序动作定位任务的方法,之前有直接改Faster-rcnn的R-C3D,本文对faster-rcnn做了修改,使之更适用于时序动作定位任务,目前是Thumos14的最好效果,tIOU=0.5的时候达到了42.8%(直接从去年最佳的CBR提高了11.8个百分点,很强)。 TAL-net(本文): 时序动...原创 2018-07-22 15:37:25 · 7290 阅读 · 6 评论 -
Domain Adaptive简介
https://blog.youkuaiyun.com/wydbyxr/article/details/82906939https://blog.youkuaiyun.com/gzmfxy/article/details/78905042https://blog.youkuaiyun.com/ltochange/article/details/78773476https://zhuanlan.zhihu.com/p/21441...原创 2019-05-23 14:56:43 · 2920 阅读 · 0 评论 -
Domain Adaptive在无监督语义分割上的应用
介绍几个域适应在分割上的比较好理解的应用:不了解Domain adaptive可以先看看简介:https://blog.youkuaiyun.com/qq_33278461/article/details/90480525以下几篇文章主要是用判别方法对域适应,有很多共性,主要讲一下第一篇,后面的作为对比参考,最后一篇ADDA是对利用判别方法作域适应的一个总结文章,它把这个过程抽象成了一个统一框架(推荐看一...原创 2019-05-23 15:03:13 · 1144 阅读 · 0 评论 -
深度学习中的label smoothing
label smoothing:交叉熵:H(p,q)=−∑i=1np(xi)log(q(xi))H(p, q)=-\sum_{i=1}^{n} p\left(x_{i}\right) \log \left(q\left(x_{i}\right)\right)H(p,q)=−i=1∑np(xi)log(q(xi))其中p(xi)是真值, q(xi) 是预测值。交叉熵的问题:交叉...原创 2019-08-03 18:32:53 · 1403 阅读 · 0 评论 -
双目立体匹配原理及流程简介
立体视觉:立体视觉:立体视觉是计算机视觉领域的一个重要课题,它的目的在于重构场景的三维几何信息.其应用包括移动机器人的自主导航系统,航空及遥感测量,工业自动化系统等。双目立体视觉:双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法...原创 2019-07-27 01:22:41 · 12356 阅读 · 2 评论 -
one class问题、few shot(one-shot)问题、异常检测问题
one class问题one class与2分类,多分类的区别?two class:"是"自行车,或者"不是"自行车,训练集里有自行车的数据和不是自行车的数据。模型判断是属于自行车类,还是others类。mutil class: 人脸识别等,每个人就是一个类别;COCO数据集包含80个class的数据;one class:"是"自行车,或者"不是"自行车,但是训练集里只给了自行车的数...原创 2019-08-07 21:18:29 · 1931 阅读 · 0 评论 -
信息熵、相对熵、交叉熵
信息论的一个基本想法一个不太可能的事件居然发生了,要比一个非常可能的事件发生,能提供更多的信息。信息量所谓信息量是指从N个相等可能事件中选出一个事件所需要的信息度量或含量,也就是在辩识N个事件中特定的一个事件的过程中所需要提问"是或否"的最少次数. 所以***信息量是指信息多少的量度,用一个信息所需要的编码长度来定义。*** 根据信息论的基本想法,信息量和事件发生的概率有关。假设X...原创 2019-08-26 17:36:16 · 500 阅读 · 0 评论 -
Temporal Action Detection (时序动作检测)综述
最近几年由于网络上视频量的急剧增多和神经网络的飞快发展,这项任务得到了更多的关注。目前这项任务的主要数据集有THUMOS2014、ActivityNet。评价指标为IOU,目前2017的大多数工作在IOU=0.5的情况下达到了20%-30%的MAP,虽然较2016年提升了10%左右,但是在IOU=0.7时直接降低到了10%以下,2018年IOU=0.5有34%的MAP。目前的趋势是寻找视频内活...原创 2018-06-17 18:40:38 · 34538 阅读 · 20 评论