
paper
文章平均质量分 85
Felaim
Hey, you're not a nobody. You're a somebody.
展开
-
Paper Reading:你真的了解Transformer了吗?
Attention is All You Need原创 2021-06-25 16:32:28 · 336 阅读 · 0 评论 -
Paper Reading: GELUs
Paper Reading: GELUs1. 简介文章全名: GAUSSIAN ERROR LINEAR UNITS (GELUs)这个激活函数是LZ在看BERT的时候,提及到的,因为对这个激活函数还不是很熟悉,于是就补充下对应的知识。主要想知道几个问题:激活函数是怎么实现的?与之前的激活函数相比,它的优势在什么地方?使用它对训练结果有什么影响?什么是GELUs?是指高斯误差线性单元(Gaussian Error Linear Unint, GELU),这是一种高性能的神经网络激活函数,原创 2021-06-03 14:29:54 · 527 阅读 · 0 评论 -
Paper Reading: STS-B
Paper Reading: STS-B1. 引言论文全名为:SemEval-2017 Task 1: Semantic Textual SimilarityMultilingual and Cross-lingual Focused EvaluationSTS是什么?Semantic Textual Similarity (STS) ,用来表示句子意义的相似性。主要有哪些应用呢?包括机器翻译(machine translation, MT),总结归纳(summarization),生成(gene原创 2021-05-31 16:25:18 · 2727 阅读 · 0 评论 -
Paper Reading: GLUE
Paper Reading: GLUE1. 引言最近看论文,突然脑子中蹦出了这么一个感觉,看论文是不应该先把论文看厚了,然后再把论文看薄了,这论文也就懂了O(∩_∩)O这篇论文是在看BERT的时候,里面有一个GLUE score的评价指标,因为刚开始接触NLP,算是NLP的小白吧,所以还是有很多要理解和学习的知识。进入正题,GLUE是什么?General Language Understanding Evaluation(GLUE) benchmark,用于评估各种现有不同的natural lang原创 2021-05-31 11:02:52 · 617 阅读 · 0 评论 -
Paper reading:A simple baseline for one-shot multi-object tracking(三):支持多分类多目标跟踪
A simple baseline for one-shot multi-object tracking(三)4.多分类背景在实际项目中可能需要不仅仅做行人的跟踪,实际上还有可能需要跟踪机动车,非机动车,所以就需要我们对代码进行修改,使得其支持多分类多目标跟踪。4.1 数据集制作格式还是按照[class] [identity] [x_center] [y_center] [width] [height]之前class这一类都是0,现在需要根据不同的情况进行修改,比如说LZ需要跟踪行人和非机动车原创 2020-11-10 16:44:32 · 1393 阅读 · 5 评论 -
Paper reading:CenterNet (Objects as Points)
CenterNet (Objects as Points)一、背景介绍先说下为啥要写着篇博客,这是2019年检测的一篇文章,非常的火,也非常的好用。就LZ目前接触的几个项目来说,基本上目标检测使用的都是CenterNet中这一套,DBFace,FairMOT等等一系列。可以看到如果检测能够做的很快很好,可以空下很多资源给其下游的应用,如安防、自动驾驶等任务中去。所以,对于现在AI可以落地的一些应用中,检测占了很大一部分的比例。这个结构为什么能够那么火呢?结论是它的速度很快并且精度也很高,所以用的小伙伴原创 2020-10-29 14:02:06 · 899 阅读 · 0 评论 -
Paper reading:A simple baseline for one-shot multi-object tracking(二)
A simple baseline for one-shot multi-object tracking(二)3. 代码精读原创 2020-10-13 13:57:29 · 1049 阅读 · 1 评论 -
Paper reading:A simple baseline for one-shot multi-object tracking(一)
A simple baseline for one-shot multi-object tracking1. 背景介绍作者来自华中科技大和微软亚亚研院,之前LZ是看过一点多目标跟踪的算法的,当时采用的是centernet+deepsort的的方法,速度呢在LZ的小笔记本上970m,在12fps左右,但是这篇论文中说速度已经是30fps,速度提升了一倍多,并且在2DMOT15,MOT16,MOT17,MOT20都是rank first,是个非常厉害的工作,并且速度和精度的提升,使得工业界也能够使用对应的思原创 2020-09-04 16:24:23 · 1344 阅读 · 1 评论 -
Paper reading:Deformable ConvNets v2(pytorch1.6编译)
Deformable ConvNets v22. pytorch1.6编译LZ其实是为了预研FairMOT论文,然后需要配置dcnv2的环境,期间当然不是一帆风顺的,已经习惯了。。。其中有几个报错还是很多小伙伴会遇到的,在github上也有很多类似的issue,所以就重新开一篇,毕竟也是一篇CVPR,它值得的。DCNv2_new/src/cuda/dcn_v2_cuda.cu(107): error: identifier "THCState_getCurrentStream" is undefin原创 2020-09-03 14:59:26 · 1798 阅读 · 1 评论 -
DBFace: 源码阅读(三)
7 推断部分推断部分主要是在test.py中主要函数其实很短,如下,代码其实被我改了一部分,和原始的github上可能有点区别mean = [0.408, 0.447, 0.47]std = [0.289, 0.274, 0.278]# trial_name = "small-H-dense-wide64-UCBA-keep12-noext-ignoresmall2"trial_name = "mv2-320x320-without-wf_20200811"jobdir = f"jobs原创 2020-08-15 14:27:00 · 736 阅读 · 0 评论 -
DBFace: 源码阅读(二)
上篇链接看LZ上篇博客的时间竟然是7月18日,着实是懈怠了,其实有很多东西需要总结归纳,这周末就补一下之前欠的债吧上篇主要介绍了DBFace的大体框架,这篇主要介绍数据的预处理部分5. 数据预处理pytorch数据一般是要写一个类函数来继承Dataset类的,需要定义三个函数__init__(self), len(self), getitem(self)这三个函数,在DBFace中的代码如下所示:class LDataset(Dataset): def __init__(self, lab原创 2020-08-15 11:27:52 · 859 阅读 · 0 评论 -
DBFace: 源码阅读(一)
DBFACE: 源码阅读1. 背景DBFace框架是可以同时获得人脸检测和关键点定位,相较与人脸检测和关键点定位分开的做法有一定的优势,减少了对原图的crop和resize操作,并且对多人脸的情况,这种操作是对人脸个数敏感的,后期倾向也是将人脸检测和关键点定位,甚至后期的segmentation放到一套代码中去完成了.使用DBFace的原因主要还是算法很快,精度也不错!2. 总体框架(App类)代码的主体是作者创建了一个App类,其中主要是超参数的设定,网络结构的设定,三个loss的定义,数据的下原创 2020-07-14 18:27:34 · 2467 阅读 · 8 评论 -
Pointet的读后感(CVPR2016):1.相关工作的介绍
最近看了一些点云处理的文章,因为机器一直在跑代码,差不多是一天能够训练两轮…服务器每天都得前一天晚上把代码实现好,早上抢占GPUO(∩_∩)O.哈哈~研究僧多,GPU少!接触到Pointnet其实非常偶然,LZ在slam里兜兜转转,一直想找一个好玩的方向,有数学大神做各种算法优化,提出各种BA方法,有MVG大神,对多视图几何了如指掌,凭直觉和坚强的数学功底,提出各种标定算法,还有图像处理大神提...原创 2018-11-23 21:43:49 · 800 阅读 · 3 评论 -
Pointet的读后感(CVPR2016):3.分类网络部分
先贴上pointnet原文当中的网络结构,后面再慢慢分析.可以看到图中有两个网络.一个是分类网络,另一个是语义分割网络.先说分类网络.可以看到分割网络只是在最后把全局信息重复了n次然后concat到nx64那层网络之后…呀,顺序有点问题,LZ连分类网络还没有解释呢?好了,从分类网络说起.我们可以看到输入是nx3,n代表的是输入点云的数量,一般取128/256/512/1024/2048/4...原创 2018-12-11 16:22:49 · 668 阅读 · 0 评论 -
Pointet的读后感(CVPR2016):2.点云输入的优劣
写文章肯定要motivation,既然说体素化方法,多视角的方法都有缺点,那么作者算是第一个使用点云作为输入的(≧▽≦)/啦啦啦那么问题来了,点云输入有什么好,又有什么不好(当然是使用其他方法的paper里说的)优点1.非常的简单,并且有非常统一的结构,避免组合的不规则性和复杂性.在通常情况下,作为点云的输入,是以(x, y, z)三个坐标作为输入,当然也有颜色信息和法线信息,现在就以最简单...原创 2018-12-11 14:43:23 · 1302 阅读 · 2 评论 -
美颜算法预研存在的问题(2020.03.26更新)
现有美颜算法问题汇总:时间效率: 通常需要进行face detection和landmarks localization (时间耗时)肤色检测: 容易检测不完全,或者误检的情况,导致出现边界效应美白: 现在通常的美白(包括添加滤镜)这些操作都是对整幅图片进行操作的,在手机端也是,但是如果在大场景且人在画面中的占比较小容易浪费资源光滑: 使用双边滤波,导向滤波,快速导向滤波效...原创 2020-03-26 14:25:59 · 812 阅读 · 3 评论 -
Paper reading: GhostNet核心解读(非翻译)
Paper reading: GhostNet:More Features from Cheap Operations1. 关于GhostNet的motivation这篇文章其实是一篇对于工业应用很实际的一篇文章,我们就不是单纯的从翻译文章来讨论这个问题,而是从实际应用加上理论这样可能更加直观一些。可以看到这篇文章是华为实验室完成的,华为的海思芯片如3559a等,是可以直接应用caffe模型...原创 2020-03-17 12:07:39 · 861 阅读 · 3 评论 -
Paper reading: SinGAN(ICCV 2019)
Paper还在读,先挖个坑,代码正在训练中。。。运行问题:LZ自己下载了一张Ruby的图片,按照官网的Train部分,结果报错,缺少模块。。。ModuleNotFoundError: No module named 'skimage'安装对应模块://更新下condaconda update -n base -c defaults condaconda install scikit...原创 2019-10-30 16:27:47 · 2285 阅读 · 28 评论 -
J-Linkage clustering算法的一点理解
1.J-Linkage算法的简介J-Linkage算法是一种自底向上的一种层次聚类的算法,当然还有很多评价每个聚类距离的算法,例如simple linkage, complete linkage and average linkage,这些感兴趣的小伙伴可以自己查阅相关的资料。原文题目’Robust Multiple Structures Estimation with J-linkage’。以论文原创 2017-07-31 16:00:09 · 3386 阅读 · 2 评论 -
使用层次聚类在结构点云中进行平面的快速提取
在许多机器人应用的领域,能够实时在三维点云中进行平面提取是非常困难的。在论文中提出了一个算法,能够在类似Kinect 传感器采集到的点云进行实时可靠的多平面的检测。具体的算法一共有三个步骤: 第一步:生成图模型(每一个节点都代表的是一个点集,每条边代表点集之间的关系); 第二步:在构建好的图模型上利用层次聚类的方法进行点集的的融合,直到平面拟合的均方误差超过设定的阈值; 第三步:使用像素级别的原创 2017-08-03 17:05:54 · 4172 阅读 · 0 评论 -
使用层次聚类的有组织点云的快速平面提取(续)
这是老师很久之前给的一篇paper,LZ还是有拖延症,到现在才想起来要把这篇paper的一些自己的思考或者说一些理解记录下来,如果有兴趣的,小伙伴可以看下原文“Fast Plane Extraction in Organized Point Clouds Using Agglomerative Hierarchical Clustering”。1.使用的数据按照原文的翻译是有组织的点云,其实这还是对原创 2017-10-13 17:09:02 · 2092 阅读 · 0 评论 -
PointSIFT尝鲜
之前也做过点云处理,但用的都是传统的方法,比如说进行平面拟和,有很老的region grow, random seed或者利用层次聚类进行,计算对应法线之类的,这个PointSIFT首先比较吸引LZ的是好多公众号都在报导,在Scannet数据集上效果非常好。二来,也有一定时间没接触深度学习了,tensorflow之类的了,找一个开源的代码读读,回忆回忆。有可能再修改改??贴出具体论文的信息:...原创 2018-07-17 21:31:57 · 8075 阅读 · 28 评论 -
Paper reading:Frustum PointNets for 3D Object Detection from RGB-D Data
标题:Frustum PointNets for 3D Object Detection from RGB-D Data作者:Charles R. Qi, Wei Liu, Chenxia Wu, Hao Su, Leonidas J. Guibas今天介绍的文章是”Frustum PointNets for 3D Object Detection from RGB-D Data”–用于从...原创 2018-08-12 15:30:20 · 2316 阅读 · 1 评论 -
Paper reading:PointGrid: A Deep Network for 3D Shape Understanding
标题:PointGrid: A Deep Network for 3D Shape Understanding 作者: Truc Le and Ye Duan又是一篇2018CVPR的文章。。。 今天介绍的文章是“PointGrid: A Deep Network for 3D Shape Understanding”—-点云网格:一个对于3D形状理解的深度网络。体素网格因为它的规律性...翻译 2018-09-19 17:42:15 · 2003 阅读 · 2 评论 -
Paper reading:BodyNet: Volumetric Inference of 3D Human Body Shapes
标题:BodyNet: Volumetric Inference of 3D Human Body Shapes作者:Gul Varol, Duygu Ceylan Bryan Russell Jimei YangErsin Yumer,z Ivan Laptev,Cordelia Schmid,Inria, France ,Adobe Research, USA今天介绍的文章是“Bod...翻译 2018-10-08 20:49:36 · 1040 阅读 · 1 评论 -
Paper reading:CubeNet: Equivariance to 3D Rotation and Translation
标题:CubeNet:Equivariance to 3D Rotation and Translation作者:Daniel Worrall and Gabriel Brostow,Computer Science Department, University College London,UK联系方式:{fd.worrall,g.brostowg}@cs.ucl.ac.uk今天介绍的...翻译 2018-11-20 20:16:01 · 938 阅读 · 0 评论 -
Paper reading SPLATNet: Sparse Lattice Networks for Point Cloud Processing(CVPR2018)
对SPLATNet的理解简要介绍SPLATNet为什么要直接处理点云呢?BCLs(bilateral convolutional layers)Step one: SplatStep two: convolveStep three: sliceBCL的一些性质SPLATNet网络结构总结参考文献:简要介绍SPLATNet其实,CVPR2019又出了很多关于点云的文章,SPLATNet是导师发给...原创 2019-04-01 15:02:27 · 814 阅读 · 3 评论 -
跟踪篇(3)--对于Object Tracking Benchmark的理解
文章主要是使用OTB作为评测时,会产生很多图,包括测试方法的选择,所以还是有必要对这些评测方法进行系统的梳理的。论文的下载链接:https://www.cv-foundation.org/openaccess/content_cvpr_2013/papers/Wu_Online_Object_Tracking_2013_CVPR_paper.pdf。主要是对Object Online Track...原创 2019-07-22 16:00:42 · 2070 阅读 · 1 评论 -
Paper reading: SSD (Single Shot MultiBox Detector)
项目需求,也要入检测的坑啦,SSD早已久仰大名,却始终没有仔细阅读过,今天LZ就做个入门级的paper reading吧,毕竟入坑不久,道行尚浅,如果有理解的不合理的地方,还请小伙伴们批评指正。还有,小伙伴经常会私信我,说对应问题如何解决,其实每个人电脑配置包括安装都不一样,所以可能不能一一解答,望小伙伴们谅解,毕竟个人精力有限。当然这个方法算是比较经典的算法,是2016 ECCV上的pape...原创 2019-10-04 15:39:45 · 232 阅读 · 0 评论 -
Paper reading: MobileNet: Efficient Convolutional Neural Networks forMobile Vision Applications
首先,在目标检测中常说到两个名词,“backbone”,“head”?如果小伙伴已经在这个领域摸爬滚打一阵,估计说,这也要说嘛,但是每个人都是从不会到会的,也许一句话,就可以解决别人心中很久的疑惑,对吗?LZ在网上找了个解释,还算是讲的比较清楚的。在许多计算机视觉任务中,backbone是作为一个特征提取器进行使用的,也就是我们常见的在ImageNet,或者COCO等数据集上进行预训练好的...原创 2019-10-05 17:35:30 · 313 阅读 · 0 评论 -
Paper reading: MTCNN的一些理解
原始论文名称很长:Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks,是深研院16年出的文章,论文短而精,还是非常值得一读的。单纯的翻译过来应该是:多任务级联卷积网络的联合人脸检测与校准。既然是多任务,网络结构通常情况下也不止一个了,所以整篇文章的framework如下图所示:...原创 2019-10-06 14:12:47 · 381 阅读 · 0 评论 -
Random Sample Consensus(RANSAC)的一点读后总结
RANSAC算法不同与传统的平滑过程,传统方法是利用尽可能多的数据来获得一个比较原始的解,然后尝试使用一些优化算法来消除invalid的数据点。对于RANSAC则是使用一个比较小的数据集,然后再尽可能的使用一致的数据来扩大原来初始化的数据集。举个例子来说,如果我们要拟合一段二维点中的弧线,RANSAC会选择三个点作为一个集合(确定一个弧线需要三个点),然后计算中心和半径,也就是说这样圆的弧线就基本确原创 2017-07-31 11:07:10 · 5529 阅读 · 0 评论