- 博客(61)
- 资源 (6)
- 收藏
- 关注

原创 目标检测论文核心思想,18-19-20年论文梗概
论文太多来不及看,有些论文用了很大篇幅印证了某种模块有用或者没用,对于不研究这部分的人来说了解一下结论,这个模块有什么优缺点就够了。因而记录一下2018-2019-2020这几年泛读的论文梗概:文章目录DetNet: A Backbone network for Object DetectionDetNet: A Backbone network for Object Detection论文...
2020-01-08 20:04:58
540

原创 深度学习中一些时而会忘的概念
Batch什么需要有 Batch_Size 这个参数?Batch 的选择,首先决定的是下降的方向。如果数据集比较小,完全可以采用全数据集 ( Full Batch Learning )的形式另一个极端:就是每次只训练一个样本,即 Batch_Size = 1。这就是在线学习(Online Learning)。使用在线学习,每次修正方向以各自样本的梯度方向修正,横冲直撞各自为政,难以达到收敛。...
2019-12-06 15:58:04
409

原创 学习Tensorflow Pytorch中的一些小Tips
Tensorflow中各种小trick和知识点。从版本对应,到模型生成等都有:(个人记录,快查表)版本问题tensorflow 1.13以上 要用CUDA10 对应CuDNN 7.41.5-1.12 CUDA9凸(艹皿艹 )了。查看cuda 版本cat /usr/local/cuda/version.txtcudnn 版本cat /usr/local/...
2018-11-25 09:41:34
599

原创 写Leetcode中C++一些基本语法和算法
文章由两部分组成 1.一些基础的语法 2.一些惊艳的算法小结构一些基础的语法C++中字符串操作排序sort(s)即将字符串s改变了顺序集合1容器std::vector <T> 定义时 vector <int> value; 也可以vecotr <i
2018-08-20 09:59:50
4014
原创 Sequence to Sequence 经典必读两篇论文
Sequence to Sequence Learning with Neural Networks 论文Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation论文第一篇是Quoc V. Le 大神的2014年经典文章,引用量14161,只要涉及序列2序列,肯定要引用这篇文章,应用包括不限于语言翻译,音频识别,字符识别,序列识别等我分别概括下两篇开山论文的梗概Seq
2021-03-12 16:21:09
2319
原创 JAVAscript高级编程(第四版)读书笔记
JAVAscript 第四版笔记概述JavaScript是一门用来与网页交互的脚本语言,包含以下三个组成部分。ECMAScript: 由 ECMA-262定义并提供核心功能。 (发音为“ek-ma-script”)文档对象模型(DOM): 提供与网页内容交互的方法和接口。浏览器对象模型(BOM): 提供与浏览器交互的方法和接口。JavaScript的这三个部分得到了五大 Web浏览器(IE、Firefox、Chrome、Safari和 Opera)不同程度的支持。所有浏览器基本上对 ES
2021-03-08 14:21:40
276
原创 Fast multi-language LSTM-based online handwriting recognition 在线手写识别
Fast multi-language LSTM-based online handwriting recognition 在线手写识别paper在线手写识别,是区别于离线手写识别,即带书写轨迹的字符识别,比如平板,写字板等触摸屏活着触控笔等。带有笔迹时许信息。也区分单字识别(触屏输入法)和行识别(一次性写一行直接识别出来,666)本文是2019年的论文,我写一下论文概要谷歌的在线手写识别系统,在IAM-OnDB英文在线行识别数据集上最好。该系统将来自序列识别的方法与使用贝塞尔曲线的新输入编码相
2020-12-28 20:50:43
1116
原创 字符识别,口算题识别论文小梗概
口算题批改,在教育领域是一个比较实际的应用场景,小学生各种练习册中五花八门的数学口算题,写好答案之后通过拍照,自动批改,挑出题目中算错的题,提高作业正确率,大人小孩都需要。在小猿搜题等在线教育app里功能基本已经比较完备。口算题识别,说白了也就是特殊场景的字符识别,其中包括印刷体(题干)和手写体(作答内容)的混合识别。通过检测模型把口算题抠出来,然后送入识别模型得到字符,再判断题目是否作答正确。市面上常见的两个技术路线,腾讯使用ANMT,是基于2D attention单行多行统一的口算题识别模型。另
2020-11-26 15:50:28
1707
原创 Ubuntu 使用上的一些小tip
总结记录下个人在使用Ubuntu上的一些小tips有段时间不用就容易忘,因而把小技巧写下来一来记录,二来也许能帮到别人呢标准输入输出重定向Terminal中运行的训练界面,即在界面中有显示,又将所有内容输入到一个log中,以便使用工具进行查找搜寻以Tendorflow中训练cifar10为例python cifar10_train.py 2>&am
2020-09-02 10:21:34
852
原创 模型部署架构,以Triton Inference Server(TensorRT)为例
模型训练只是DeepLearning的一小部分,模型部署有N种方式,由TensorRT改名升级来的Triton将成为Nvidia的主推,本文主要说下Triton的主要情况
2020-09-01 20:19:36
11135
7
原创 字符识别
公式识别首先基于文字序列识别,因而主体发展与文字识别有相近之处大多是检测+识别检测模型大多基于Faster R-CNN SSD FCN 等通用模型针对区域候选网络 、 多目标协同训练 、 特征提取 、 非极大值抑制 、 半监督式学习等方向进行改进字符识别,指的是对已分割出的文字区域进行识别文字内容CRNN( Convolutional Recurrent Neural Network)Shi Baoguang,Bai Xiang,Yao Cong. An end - to - end t
2020-09-01 19:28:32
5446
原创 为什么MobileNet及其变体(如ShuffleNet)会变快&什么时候会受限
Introduction在本文中,我概述了高效CNN模型(如MobileNet及其变体)中使用的组成部分(building blocks),并解释了它们如此高效的原因。特别地,我提供了关于如何在空间和通道域进行卷积的直观说明。在高效的模型中使用的组成部分在解释具体的高效CNN模型之前,我们先检查一下高效CNN模型中使用的组成部分的计算量,看看卷积在空间和通道域中是如何进行的。假设 H x W 为输出feature map的空间大小,N为输入通道数,K x K为卷积核的大小,M为输出通道数,则标准卷
2020-08-31 11:48:07
1158
1
原创 YOLOv5 解读版本1——2020.8.20
YOLOv4 vs. YOLOv5data augmentation传统增强+CutOut在CNN第一层随机扔掉某一块Hide and seekMixUp按权重把两张图加一起CutMixcutout的区域加入另一张图的目标,应对遮挡问题,识别堆叠的目标物体Mosaic马赛克四张图片随机拼接成大图,缩放识别小物体缓解;batch压力class label smoothing引入均匀分布的噪声,平滑label,把类间距离放得更远了(原本只关注类内,不关注类间)对比YOLOv3
2020-08-20 20:51:20
3508
原创 聚类有效性分析
概述有ground-truth时黄金标准(Gold Standard)作为Benchmark,是基于人工的判断制作而成。在有了这个Benchmark后,我们就可以定义出外部标准,通过簇和黄金标准之间类别的匹配的程度来评估聚类结果的好坏。聚类质量四个外部标准:1 纯度(Purity) 是一种简单而透明的评估手段;2 标准化互信息(NMI, Normalized Mutual Information) 是从信息理论方面来评估;3 兰德指数(RI, Rand Index) 能度量聚类过程中的假阳性和假
2020-06-30 11:20:04
3431
原创 CenterNet: Objects as Points论文解读 目标检测、关键点检测论文及代码
先占个坑,之后肯定补(和博客里其他人TODO list然后就消失的那种不一样的)2020.5.14论文https://arxiv.org/pdf/1904.07850.pdf
2020-05-15 08:57:36
1672
3
原创 谷歌的手势识别pipeline
论文https://arxiv.org/abs/1701.01779使用自上而下,Faster R-CNN改版进行行人检测。ResNet101+空洞卷积+更密集的feature map对检测区域进行单人姿态估计。其中有几个细节:不仅局限于行人包围框来预测关键点使用预测出的关键点对BBox重新打分高于0.3分的proposals才进行关键点计算,平均每张图3.5个proposals...
2020-05-06 15:41:34
1086
原创 MobileNet网络系列论文及模型V1-V2-V3
MobileNet V1基于一种使用深度可分割卷积去建立轻量型网络结构的流线型结构。引进了两个简单的超参数,这两个超参数在延迟和准确率方面达到了平衡,宽度因子和分辨率因子。之前的网络要么大模型压缩为小模型;要么训练小模型。我们可以通过超参可调网络大小(有些论文只考虑模型规模,没直接考虑模型速度)结构深度可分离卷积Depthwise Separable Convolution将标准卷积分...
2020-04-08 11:34:05
1886
原创 CVPR2020 实例分割
实例分割Hao Chen陈昊 CVPR2020 BlendMask实例分割COCO上评价指标 mAP 每个实例,每张图选100个结果AP:每个结果与GT算IOU 0.5:0.05:0.95 十个取平均COCO泛化性好,不容易过拟合缺:COCO标注不过精细但是这个评价指标没有对更关注边界像素的情况,只是检测的IOU迁移过来的Cascade R-CNN , Mask R...
2020-03-25 23:15:23
2664
原创 周博磊.Phd《强化学习》课程
视频课链接github链接纲要Overview一个【agent】在不确定的【环境】中极大化自己的【奖励】agent并没有立刻获得反馈(不像有监督学习一次分类后就能有正确错误的反馈)与监督学习的对比:是序列的数据,并不是iid分布learner不得不自己发现某些行为,因为很多步之后才能看出奖励需要不断试错(需要在exploration exploitation之间平衡)没有sup...
2020-03-18 17:28:33
671
转载 python多线程详解 Python 垃圾回收机制
python多线程详解一、线程介绍什么是线程线程(Thread)也叫轻量级进程,是操作系统能够进行运算调度的最小单位,它被包涵在进程之中,是进程中的实际运作单位。线程自己不拥有系统资源,只拥有一点儿在运行中必不可少的资源,但它可与同属一个进程的其它线程共享进程所拥有的全部资源。一个线程可以创建和撤消另一个线程,同一进程中的多个线程之间可以并发执行。为什么要使用多线程线程在程序中是独立的、...
2020-03-04 23:04:11
2482
原创 Batch Normalization论文翻译
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift五次面试有三次会问到BN层,这个点一定要从前世今生都吃透啊!论文超链接:https://arxiv.org/pdf/1502.03167v3.pdfAbstract通过要求较低的学习率和仔细的参数初始化减慢了...
2020-03-01 00:44:24
464
原创 旷世:高效准确的文字检测
EAST文字检测网络可以以很小的计算量,加在其他backbone之后改善检测效果主讲人赵明明具体,性能和准确率fscore 0.757 , fps 16.8 ,PVANet fps 16.8channel乘以2倍,fps13.2FCN+NMSEAST 详细 pipellinefeature mergingconv stage 包括conv pooling等、多层...
2020-02-28 23:42:25
511
原创 人脸对齐 旷世讲座
人脸识别系统应用:一人脸确认1V1确认是否是一个人二人脸ID1VN 大库里找到输入图片是谁人脸->特征向量想让不同的向量拥有“相似度”概念类内距离;类间距离单张图经过人脸识别的pipeline人脸检测人脸关键点定位Landmark人脸对齐Alignment(用来降低人脸几何形变,降低识别系统的复杂度)人脸识别(得到特征向量)要有这么一个函数图像空间->...
2020-02-27 21:01:58
563
原创 推荐系统在直播场景的应用(花椒直播)
推荐系统:帮助用户发现内容,克服信息过载通过分析用户行为,对用户兴趣建模,预测用户的兴趣早期,基于热度推荐:热度高的一般质量有保证,但是集中在头部,难以千人千面现代化推荐系统全样本,生成粗排序(百万),再生成精致排序(几百个),在推荐给用户(10量级)召回与排序。召回基于邻域的协同过滤1计算用户与物品的相似度矩阵2计算出用户对缺失物品的得分早期使用:基于主播的协同过滤由于是n...
2020-02-20 22:10:48
903
原创 NAS神经网络结构搜索简述
很多大厂针对具体任务已经开始普及NAS来定制网络了,因而总归要有所了解,不懂的话可以先快速上手概念和流程NAS虽然方法层出不穷,但基本都包括这三大部分:定义搜索空间;执行搜索策略采样网络;对采样的网络进行性能评估。接下来我们从这三个方面介绍NAS的发展现状。搜索空间大致分为:全局搜索空间、基于细胞的搜索空间前者搜索整个网络结构,后者搜索小的结构(通过堆叠、拼接等组成大网络)...
2020-02-14 23:38:59
1035
原创 手撕SVM
即便使用率已经不高了,但是面试时手推SVM依然是传统。百度三面时就问了SVM所以还是要手撕SVM三宝:间隔,对偶,和技巧1.1 线性可分:二维面上两类点可被直线完全分开(高维则是超平面)1.2超平面,最大间隔超平面wx+b=0二维里就是a1 x1+a2x2+ b=0两类样本分别在超平面两边两侧距离超平面最近的样本点到超平面距离最大化两侧距离超平面最近的样本点,就是支持向量S...
2020-01-24 01:10:15
518
2
原创 面试时如何回答:C++的多态
三次面试都遇到了这个问题我想必须把这个问题搞得引经据典的清楚才不愧对这三次被拒的offer让下一家再敢问这个问题的面试官,也能一下梳理出几种多态,提问者竟然学到了知识,他肯定好感大增简单讲,一个接口,多个方法。封装是代码重用,多态是接口重用。C++的多态性是通过虚函数来实现的子类重新定义父类的方法称为覆盖允许有多个同名的函数,这些函数的参数列表不同成为重载,但这并没有体现多态特性多态...
2020-01-14 16:15:41
367
原创 损失函数的学习与选择
深度学习中,从简单的分类任务,到复杂的检测任务,姿态估计等任何任务,都必须包含一个函数的定义:损失函数。直观意思就是,模型预测出来的东西和实际ground truth区别有多大,只要设置的损失函数符合二者之间差别越大损失函数越大,差别越小损失函数越小,就挺好...
2020-01-09 21:22:05
1322
原创 Distribution-Aware Coordinate Representation for Human Pose Estimation 姿态估计 CVPR2019
Distribution-Aware Coordinate Representation for Human Pose Estimation 姿态估计 CVPR2019 论文翻译,学习笔记,论文梗概论文原文点这这篇文章是该团队基于2018年工作的改进,2018年那个论文翻译点这Abstract姿态估计使用热度图来定位已成为惯例,但是据作者所知并没有文献对热度图进行系统的研究,本文将填补这个...
2020-01-07 10:52:41
4259
原创 FPD: Fast Human Pose Estimation 姿态估计cvpr2019论文阅读
from 电子科技大学姿态估计CVPR2019论文地址升级版论文Abstract姿态估计精度方面越来越好,但是网络越来越大。想通过减少少量精度得到一个可以在轻量级设备上运行的模型。使用一个 Fast Pose Distillation (FPD)。在强teacher network中学习一个小网络。在MPII和Leeds Sports Pose(LSP)上取得了很有效的效果Intro...
2020-01-04 18:01:14
2161
原创 图像对齐讲座—旷世成都研究院 & 数据策略产品经理——阿里讲座
刘帅成博士,旷世成都研究院,该院2018年成立,新加坡国立大学毕业目录:1基于传统算法2基于深度学习3基于硬件Image aligment methods图像对齐应用:图片拼接:不同视角拍的建筑拼成更大的一个画面,全景图去噪,防抖HDR不同曝光的同一场景,选取不同的曝光区域 拼接多摄像头协同工作,一个是长焦,一个是广角。视频防抖。挑战:1 重复特征:大厦窗口纹理很像,...
2019-12-18 21:21:29
1672
原创 HOG与SIFT特征学习
都点进这个链接了,我就不用再赘述这俩特征是干嘛的了吧。我就不用再说一遍:他们分别是通过精妙的手工设计的一些方法,来对图像的进行特征提取,将图像中一堆像素转换成具有其内容特征的数字向量,因而可以用来给各种模型(如SVM)进行处理的一些特征。HOG方向梯度直方图Histogram of Oriented Gradient,在行人检测领域用的较多,DPM中也用到了HOG特征主要思想:在一副图像...
2019-12-18 17:06:50
1324
原创 讲座笔记:模型量化-更小更快更强 Dance with Bit ———哈佛大学.董鑫PHD
Dance with Bitrecord in 2019/11/21Quantization定长和变长精度:两个数字之间最小差别能有多小 32位单精度: 1.2*12^-38量化:浮点数->定点数:压缩网络的方法 Quantization矩阵的分解X= TP X是大矩阵100100 ,一共10000个, T是1002 P是2100 , 一共400 个参数只是内存优...
2019-11-21 22:28:55
356
原创 Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting行人检测ECCV2018
Learning Efficient Single-stage Pedestrian Detectors by Asymptotic Localization Fitting 行人检测论文,ECCV2018代码地址论文地址Wei Liu 1,3(国防科大) , Shengcai Liao 1,2(中国科学院大学)原来是学长的论文呀,66666概要:虽然基于two-stage的检测器Fast...
2019-11-14 21:27:38
546
原创 数据结构 C++语言版 清华大学第三版 学习笔记
绪论绪论一道冒泡排序拍懵我了,我以为O(n2)O(n^2)O(n2) 复杂度的经典冒泡排序没有优化空间了,结果一个bool标识打脸,可以提前终止冒泡,如果已经是按顺序了的数组的话: void bubblesort1A(int A[], int n) { //起泡排序算法(版本1A):0 <= n bool sorted = false; //整体排序标志,首先假定尚未排序 ...
2019-10-29 22:50:55
973
1
原创 AlphaPose姿态估计论文翻译和代码解读RMPE: Regional Multi-Person Pose Estimation
姿态估计模型AlphoPose模型的论文 或者论文V3版 ICCV2017接收,上海交大和腾讯优图的妏代码 ,基于pytorch或者Tensorflow如果想了解姿态估计的简单概述,可以点击我的另一篇综述文章RMPE: Regional Multi-Person Pose EstimationAbstract自然场景的多人姿态估计是一个极大的挑战。虽然最好的人类检测器已经有很好的效果了...
2019-10-29 11:31:35
9379
3
cifar-10-binary,官网上有,但是下载速度慢
2018-04-12
cifar10-Python的数据集,官网上有,但是下载速度很慢
2018-04-12
windows系统修改mac地址
2018-04-12
文档相关性查询
2016-03-31
FormatDatalibsvm.xls
2016-01-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人