- 博客(56)
- 资源 (21)
- 收藏
- 关注

原创 【计算机视觉】《Light-Head R-CNN: In Defense of Two-Stage Object Detector》
Light-Head R-CNN: In Defense of Two-Stage Object Detector本文仅为仙道菜记录笔记之用,细节不对之处,欢迎批评指正。更多相关博客请猛戳:https://zhuanlan.zhihu.com/cyh24如需转载,请附上本文链接,谢谢!这篇 文章 从题目上看就一目了然: 捍卫two-stage object detector.
2018-01-21 23:41:49
1633

原创 【卷积神经网络-进化史】从LeNet到AlexNet
本系列博客是对刘昕博士的《CNN的近期进展与实用技巧》的一个扩充性资料。主要引用刘昕博士的思路,将按照如下方向对CNN的发展作一个更加详细的介绍:【从LeNet到AlexNet】、【进化之路一:网络结构加深】、【进化之路二:加强卷积功能】、【进化之路三:从分类到检测】、【进化之路四:新增功能模块】
2016-05-17 23:20:30
78206
2

原创 【机器学习】神经网络-激活函数-面面观(Activation Function)
日常 coding 中,我们会很自然的使用一些激活函数,比如:sigmoid、ReLU等等。不过好像忘了问自己: 1. 为什么需要激活函数? 2. 激活函数都有哪些?都长什么样?有哪些优缺点? 3. 怎么选用激活函数?本文正是基于这些问题展开的,欢迎批评指正!
2016-01-27 12:35:17
73694
3

原创 【深度学习&分布式】Parameter Server 详解
MXNet是李沐和陈天奇等各路英雄豪杰打造的开源深度学习框架(最近不能更火了),其中最吸引我的是它的分布式训练的特性;而提供支持其分布式训练特性的正是当年李少帅和 Alex Smola 等人开发的 parameter server. 本文从易用性、通信高效性、可扩展性等角度介绍 parameter server .
2016-01-20 01:34:02
44069

原创 【机器学习】Logistic Regression 的前世今生(理论篇)
Logistic Regression可以说是机器学习的入门算法。不过,你真的有把握能够把LR从头到脚讲一遍吗?你会现场建模,数学推导?你知道它的正则化的作用?你能讲清楚它跟MaxEnt最大熵模型的关系吗?ok,你说这些你都会?那你知道并它的行化怎么做吗?有几种并行化的方式呢?啥?!你说你还会?大神,请受我一拜!
2015-12-19 17:36:12
56289
6
原创 【深度神经网络压缩】Deep Compression (ICLR2016 Best Paper)
做过深度学习的应该都知道,NN大法确实效果很赞,在各个领域轻松碾压传统算法,不过真正用到实际项目中却会有很大的问题: 1. 计算量非常巨大;2. 模型特别吃内存;怎么办?使用网络压缩技术咯!《Deep Compression》 是 ICLR 2016 Best Paper,将AlexNet从200MB压缩到6.9MB,而且不降低准确率!
2016-06-19 01:51:39
27032
5
原创 【计算机视觉】Visual Tracking 领域最新进展(论文与源码)
最近在研究 tracking,所以总结了一些较新的 tracking 相关的论文和源码。希望能够为刚进入这个领域的同学节省一些时间。如您有其他优秀的paper或者code,欢迎在回复中留言~谢谢!
2016-06-05 22:48:15
17029
1
原创 【计算机视觉】《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》
本博客是《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》的阅读笔记。继 Object Classification、Detection 之后,Tracking 也"沦陷"啦,又一个被deep learning拿下的领域,这篇论文提出的 MDNet 在wuyi老师发布的OTB50和OTB100数据库上面取得了惊人的成绩。
2016-06-05 16:49:27
11186
原创 【深度学习】caffe 中的一些参数介绍
caffe 是非常强大的深度学习框架,作为使用者,我们当然要对它的一些配置参数有一定的认识,本文简单介绍了caffe中的一些参数,持续更新中...
2016-05-30 14:33:42
49402
1
原创 【pySpark教程】Big Data, Hardware trends, and Spark(二)
Big Data, Hardware trends, and Spark 本博客是【pySpark教程】系列的文章。 是 Berkeley 的 Python Spark公开课的学习笔记(see 原课程)。 由于个人能力有限,不免有些错误,还望各位批评指正。 更多相关博客请猛戳:http://blog.youkuaiyun.com/cyh24/article/category/6
2016-02-13 21:28:39
6794
原创 【pySpark教程】Introduction & 预备工作(一)
在这个课程中,我们会学习如何编写并且调试Python Spark(pySpark)程序。为了满足大家的需求,我们的软件开发环境是使用Virtual Machine(VM虚拟机)。本文将手把手教你安装该环境。
2016-02-08 20:13:40
11151
原创 【Spark 机器学习】K-means聚类算法(理论篇)
【机器学习】K-means聚类算法(理论篇) 本博客是【Spark-Python-机器学习】系列的文章。 该系列的文章主要讲解【机器学习】的一些通用算法的原理,并且使用【Python+Spark】来实现。 文章通常分为上下篇(理论篇 与 实践篇)。 如需转载,请附上本文链接:http://blog.youkuaiyun.com/cyh_24/article/details/50
2015-12-31 23:49:54
8013
原创 【论文笔记】SparkNET: 用Spark训练深度神经网络
这篇论文是 Berkeley大学 Michael I. Jordan 组的最新论文。训练深度神经网络是一个非常耗时的过程,比如用卷积神经网络去训练一个目标识别任务需要好几天来训练。因此,充分利用集群的资源,加快训练速度成了一个非常重要的领域。SparkNet 是基于Spark的深度神经网络架构。
2015-12-27 23:00:47
12710
2
原创 【机器学习】K-Means 聚类是特殊的矩阵分解问题
【机器学习】K-Means 聚类是特殊的矩阵分解问题。本博客是该论文《k-Means Clustering Is Matrix Factorization》的阅读笔记。论文证明了传统的K-Means算法的目标函数可以被表达成数据矩阵与其低阶数据矩阵之间差异的Frobenius范数。简单地说,K-Means 聚类是特殊的矩阵分解问题。
2015-12-26 15:59:27
8601
3
原创 【论文笔记】The Impact of Imbalanced Training Data for CNN
本文主要研究使用不平衡数据训练CNN对图像分类的影响。文中使用的数据集是CIFAR-10。使用这些生成的不同的训练集,分别去训练一个CNN。结果显示,不平衡训练集会对结果造成很大的负面影响,而训练集在平衡的情况下,能够达到最好的performance,同时oversampling是一个非常有效的解决imbalance的方法。
2015-11-16 20:35:58
7006
原创 使用docker安装部署Spark集群来训练CNN(含Python实例)
实验室有4台服务器(8个GPU/台),平日都只使用了其中的一个GPU,实在暴遣天物!于是决定使用docker安装部署Spark集群,将这些GPU都利用起来训练CNN。本文是博主含泪写出的踩坑总结,希望能够给各位提供了一些前车之鉴来避开这些坑。
2015-11-06 15:03:18
22515
4
原创 2015 SegmentFault 黑客马拉松记录
上周末,我们参加了由 segmentfault 组织的亚洲最大规模的黑客马拉松。这次的Hackathon在 北京 / 杭州 / 深圳 / 济南 / 武汉 多城同时联动。仅我们参加的北京赛区,就有30多个团队,150余人。
2015-10-31 08:45:37
3384
3
原创 【Python多进程库】一个函数让你设置CPU数和线程数
使用multicpu之后,你需要一个函数,就可以定义你程序运行时所需的CPU数量和每个CPU占用的线程数量。重点是,代码只有60行不到,你可以很轻松的阅读源码。
2015-10-21 23:59:20
12508
1
原创 【人脸识别】人脸验证算法Joint Bayesian详解及实现(Python版)
本文主要是针对[Bayesian Face Revisited: A Joint Formulation][3] 这篇文章的笔记。这篇论文仅通过LBP跟Joint Bayesian这两个方法结合,就把**LFW** 数据集上的人脸验证准确率轻松刷到了92.4%. 香港中文大学团队的DeepID2将七个联合贝叶斯模型使用SVM进行融合,最终达到了99.15%的结果。
2015-10-12 00:54:30
46695
116
原创 Game Programming Patterns-再探Flyweight模式
迷雾消散,一个古老而壮丽的原始森林呈现在了我们的面前。不计其数的古老的铁杉,像一座塔尖林立的绿色大教堂。在巨大的树干面前,以至于,你只有往后拉开一段距离,才能从树干之间的缝隙中辨认出这是一个巨大的森林。这是游戏开发者梦想中的世外桃源般的设计,而正是一个设计模式使得这一梦想中的场景得以在现实中得到实现。而这个模式的名字却再低调不过了:Flayweight(享元模式)。
2015-10-03 22:57:24
2143
原创 Game Programming Patterns-再探Command模式
可以说Command模式是我最喜欢的设计模式之一。在我写的大多数的大型程序,游戏和其他一些代码中,都随处可见这个模式。正确地使用这个模式,可以让一些原本很丑陋的代码变得更加整洁。然而,这样的一个优雅漂亮的模式,“Gof”却给出了一个非常抽象,晦涩难懂的描述:
2015-09-22 22:37:43
2620
原创 Game Programming Patterns-架构,性能与游戏
《Game Programming Patterns》游戏编程模式的第二篇;在我们埋头研究一堆的设计模式之前,我想先告诉你,对于软件架构,我个人是如何理解的。这样可以帮你对后续的文章有更好的理解。或者,当你跟别人争论一个软件架构或者设计模式是优秀还是糟糕的时候,这些都可以给你提供一些论据。
2015-07-19 20:25:59
3673
原创 Game Programming Patterns-简介
我在自己游戏开发的经验中,找到了一些好的设计模式,并把他们记录在这本书里。这样,我们就可以有更多的时间用在发明新东西上面,而不是用在重复造轮子了。
2015-07-13 22:05:17
3568
2
原创 Game Programming Patterns-目录
这本Game Programming Patterns游戏编程模式是由Bob Nystrom(一位在EA待过7年,有着20年游戏开发经历的工程师编写)。本书将告诉你,什么模式能够帮你理清和优化你的游戏,如何根据你的需求灵活的组织你所需要的设计模式。
2015-07-13 21:50:43
4642
原创 Cocos2d-x 的3D游戏制作官方教程(中文翻译)
Cocos2d-X 从版本3开始,已经将3D一些特性添加到了Cocos2d-x里面。因为3D游戏是一个巨大的市场,所以,为了方便您进行3D游戏的开发,Cocos2d-x向您提供了所有你开发3D游戏时所需要的特性。或许对你而言,3D开发是一个新的领域,这里有一些软件、工具是你所需要了解了。
2015-05-13 23:02:46
9222
原创 【人脸识别】初识人脸识别
如果你研究过人脸识别,或者对这方面有兴趣,那么你一定听说过Paul Viola。他可以算得上是人脸检测识别的始祖,他的一篇大作《RobustReal-time Object Detection》可以说是人脸识别领域最重要的一篇论文。本文主要就这篇论文展开,介绍Haar特征,积分图,Adaboost等内容。
2014-10-03 15:37:49
12015
转载 【人脸识别】人脸识别必读论文
一,人脸检测/跟踪人脸检测/跟踪的目的是在图像/视频中找到各个人脸所在的位置和大小;对于跟踪而言,还需要确定帧间不同人脸间的对应关系。1,Robust Real-time Object Detection. Paul Viola, Michael Jones. IJCV 2004.入选理由:Viola的人脸检测工作使得人脸检测真正变得实时可用。他们发表了一系列文章,这篇是引用率最高的一
2014-10-03 14:54:25
8225
原创 【Accelerated C++】重点回顾(续)
看了刘未鹏推荐过的C++入门经典《Accelerated C++》,读此书的过程中一再感叹“大师就是大师,他可以很轻松的把东西的本质呈现在你面前”,这本书采用了现实中与我们很接近的学生成绩信息管理这一例子,层层推进,一步一步引出C++中的知识点,根据任务提出解决方案,让你感受到C++中一些设计的比要性。一下是我读此书时做的笔记,谨用于记忆。ps:这篇是第二篇,之前的笔记
2012-12-09 23:21:31
8978
原创 【Accelerated C++】重点回顾
看了刘未鹏推荐过的C++入门经典《Accelerated C++》,读此书的过程中一再感叹“大师就是大师,他可以很轻松的把东西的本质呈现在你面前”,这本书采用了现实中与我们很接近的学生成绩信息管理这一例子,层层推进,一步一步引出C++中的知识点,根据任务提出解决方案,让你感受到C++中一些设计的比要性。一下是我读此书时做的笔记,谨用于记忆。第一章、使用字符串1、为什么需要缓
2012-11-29 15:56:52
3298
原创 将vim打造成IDE编程环境
昨天晚上,看了吴垠的这篇文章--手把手教你把Vim改装成一个IDE编程环境(图文),看的时候,各种激动啊!!!以前听过有牛人将vim打造成了IDE环境,总算是找到了具体的实现步骤----想大牛吴垠致敬~~ 这里贴出几张图片,让大家眼馋眼馋: 1、下面这张图:左上:工程文件左下:变量名右 :文本文件 2、可以直接显示出结构体或类的成员!!!
2012-11-10 16:23:24
2881
原创 KMP及其改进算法
本文主要讲述KMP已经KMP的一种改进方法。若发现不正确的地方,欢迎交流指出,谢谢!KMP算法的基本思想:KMP的算法流程:每当一趟匹配过程中出现字符比较不等时,不需回溯 i 指针,而是利用已经得到的部分匹配的结果将模式向右滑动尽可能远的一段距离后,继续进行比较。设S为目标串,T为模式串,设 i 指针和 j 指针分别指示目标串和模式串中正待比较的字符。开始时
2012-11-08 15:51:23
4437
2
原创 快排到底有多快?元芳,你还看吗?
大师级的文章,总是能够使你更接近于事物的本质。 最近看了pongba的数学之美番外篇:快排为什么那么快。文中提到了Mackay的一篇文章(这里是译文),里面提到了使用信息论来解释快排与堆排的速度差异的本质原因。看罢,内心有种莫名的激动。虽不懂信息论,但Mackay(大师毕竟是大师),最简单的解释,却直接触到了本质。有兴趣的可以看看Mackay的这篇文章。这里,只是我自己的一点感悟。
2012-10-28 01:27:28
5864
3
翻译 David MacKay:用信息论解释 '快速排序'、'堆排序' 本质与差异
这篇文章是David MacKay利用信息论,来对快排、堆排的本质差异导致的性能差异进行的比较。信息论是非常强大的,它并不只是一个用来分析理论最优决策的工具。从信息论的角度来分析算法效率是一件很有趣的事,它给我们分析排序算法带来了一种新的思路。运用了信息论的概念,我们很容易理解为什么快排的速度那么快,以及它的缺陷在哪里。 由于个人能力不足,对于本文的理解可能还是有点偏差。而
2012-10-21 00:25:46
5208
原创 四柱HanoiTower----是甜蜜还是烦恼
我想很多人第一次学习递归的时候,老师或者书本上可能会举汉诺塔的例子。但是今天,我们讨论的重点不是简单的汉诺塔算法,而是三柱汉诺塔的延伸。先来看看经典的三柱汉诺塔。 一、三柱汉诺塔(Hanoi_Three):我想大家对于三柱汉诺塔的理解以及算法的实现应该是很熟练了。我在这里简单的过一遍三柱汉诺塔的算法思想:有A、B、C三根柱子,A柱上有n个盘子,现在需要将A上所有的盘子转移到
2012-10-16 09:21:38
2910
2
原创 STL的红与黑--rb_tree
红黑树,作为一种广泛使用的数据结构,我想大家应该都不会陌生。谈到红黑树的用途,最广为人知的应该就是红黑树在C++ STL中的应用了,在set, multiset, map, multimap等中,都应用了红黑树。但是,rb_tree本身并不开放给外界使用。 今天,我将介绍,STL源码中,红黑树的具体实现(因为篇幅所限,这里不包括删除操作)。因为文章的主要目的是分析STL中的源码,所
2012-10-14 03:40:14
3547
原创 从编译ffmpeg/examples,进而了解pkg-config
在编译ffmpeg/doc/example的时候,发现该目录下只有一些.C文件和makefile,于是,很自然的输入:make。期待成功编译的结果,然而却报出了很多错误,主要错误如下:Package lib* was not found in the pkg-config search path.Perhaps you should add the directory cont
2012-10-03 22:01:47
11724
原创 ‘聪明的搜索算法’
A*算法 是一种启发式的搜索算法。 了解BFS、DFS或者Dijkstra算法的人应该知道。这些算法都是一种向四周盲目式搜索的方法。 启发式搜索: 启发式搜索就是在状态空间中的搜索对每一个搜索的位置进行评估,得到最好的位置,再从这个位置进行搜索直到目标。这样可以省略大量无畏的搜索路径,提到了效率。在启发式搜索中,对位置的估价是十分重要的。不同的估价可以有不同的
2012-09-29 22:58:23
2414
原创 使用automake来写makefile
将设现在的文件目录project是这样的: main.c src inc 在src中放入所有的.c文件:add.c 、hello.c。在inc中放入所有的.h文件:add.h 、hello.h。使用automake来写makefile的流程如下: 1、写makefile.am 有
2012-09-29 01:10:58
2450
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人