
ANN/DNN/纤维丛
文章平均质量分 62
wishchin
CV算法工程师:从事室内场景感知方面工作,完成算法实验和软件开发。
展开
-
基于3D模型的MaskRCNN的训练数据生成
在MaskRCNN的Mask分割或者FCN全图分割的数据收集过程中,初始数据可以使使用LabelMe手动标记,这是数据标记不可或缺的过程,需要耗费大量人力物力,也是值得的。 数据选取的过程中需要注意的是,标记的粒度控制、半自动化标记工具比如grubcut算法辅助等、数据的二次筛查、数据可靠性分级等等。 参考:三维重建PCL:点云单侧面正射投影_wishchinYang的专栏-优快云博客终于把点云单侧面投影正射投影的代码写完了,为一个阶段,主要使用平面插值方法,且只以XO...原创 2021-11-19 21:20:56 · 1931 阅读 · 0 评论 -
VS2015:安装适用于windows桌面的visual c++2015
在重新使用VS2015的时候,以前可以运行的工程已经无法载入,在新的系统重装VS2015社区版本,依然出现了此种状况。原创 2021-06-18 18:54:40 · 3023 阅读 · 0 评论 -
人工机器:深度学习CNN到底实现了什么
现在的归纳式和生成式深度学习离AI还很遥远,AI更需要深度强化学习。参考:作为归纳学习的深度学习-https://blog.youkuaiyun.com/wishchin/article/details/71195098从泛函分析里得出的结论:模式识别的数学表示--https://blog.youkuaiyun.com/wishchin/article/details/74644489对一维信号识别和变长模式分析,我不甚了解,对LSTM处理变长一维特征之外的更强的作用也不是特别了解:https://blog.csdn.ne原创 2020-11-18 21:37:21 · 480 阅读 · 0 评论 -
三维重建16:概率图模型 模板类编程
刚刷了一部分网络题,又出了个模板类编程。没人能从面试中得到自己想要的方法,只能得到能看得到的结果!!!一 概率图模型 贝叶斯模型,真是推导不出来了!贝叶斯函数貌似也写不出来了! 参考:斯坦福概率图模型-贝叶斯网络 -https://blog.youkuaiyun.com/wishchin/article/details/14136257 参考:ANN-生成式模型-https://blog.youkuaiyun.com/wishchin/article/de...原创 2020-11-18 20:51:38 · 373 阅读 · 0 评论 -
三维重建13X-2:FCN和MaskRCNN中Mask的获取
在添加检测的三维重建中,获取连续性图片区域是一个提高三维重建效果的重要方法。不管在稠密重建和稀疏重建,对特定的目标区域添加UV图,并可以对特定区域内的稀疏或者稠密点云深度进行优化。当然,使用较为传统的方法,作为一个耗时的工程,通过激光器扫描的稠密表面点云,然后经过图片传统经验方法进行分割贴图,是一个效果更好的方法。但在此不做讨论,只讨论使用单一方法提高三维重建的 可视化效果。FCN-DeepLab中的MASK获得严格地说,FCN系列目的并非形成Mask,而是基于分割的思路,而Mask是基于目标检原创 2020-11-06 16:08:18 · 618 阅读 · 0 评论 -
编译Caffe-Win错误集锦
Caffe在Windows下编译还是遇到不少麻烦的...1.visual studio 2013 error C2371: 'int8_t' : redefinition; 引入的unistd.h文件里面重定义了int8_t ,用记事本 打开文件注销之。2. error C3861: 'getpid': identifier not found原创 2015-04-28 18:45:39 · 11244 阅读 · 9 评论 -
caffe特征提取/C++数据格式转换
Caffe生成的数据分为2种格式:Lmdb 和 Leveldb 它们都是键/值对(Key/Value Pair)嵌入式数据库管理系统编程库。 虽然lmdb的内存消耗是leveldb的1.1倍,但是lmdb的速度比leveldb快10%至15%,更重要的是lmdb允许多种训练模型同时读取同一组数据集。原创 2015-04-05 20:33:43 · 2427 阅读 · 0 评论 -
深度学习的技术困难
DL甚至并不是AI的任一方法的一种.... 原文链接:深度学习算法的几个难点 1、局部最优问题。 深度学习算法的目标函数,几乎全都是非凸的。而目前寻找最优解的方法,都是基于梯度下降的。稍微有点背景知识的人都知道,梯度下降方法是解决不了非凸问题的。因此,如果找到最优解,将是深度学习领域,非常值得研究的课题。 andrew转载 2015-05-01 20:43:43 · 1328 阅读 · 0 评论 -
ubuntu安装-Caffe依赖
参考链接:http://my.oschina.net/u/939893/blog/1639211. 安装numpy相对简单,以下命令可以完成 apt-get install python-numpyapt-get install python-scipy2. 安装matplotlib相对复杂一些需要先安装其依赖的包libpng和freetype安装libp原创 2015-03-30 19:54:29 · 1186 阅读 · 0 评论 -
VS2013配置编译Caffe-Win10_X64
原文链接:http://blog.youkuaiyun.com/joshua_1988/article/details/45036993 有少量修改................ 2014年4月的时候自己在公司就将Caffe移植到Windows系统了,今年自己换了台电脑,想在家里也随便跑跑,本来也装了Ubuntu可以很方便的配置好,无奈在家的风格是“娱乐的时候抽空转载 2015-04-18 22:14:42 · 6154 阅读 · 0 评论 -
caffe学习笔记--跑个SampleCode
测试Caffe是否工作正常,不做详细评估。转载 2015-03-31 16:48:34 · 2190 阅读 · 0 评论 -
Reducing the Dimensionality of Data with Neural Networks:神经网络用于降维
High-dimensional data can be converted to low-dimensional codes by training a multilayer neural network with a small central layer to reconstruct high-dimensional input vectors. Gradient descent can be used for fine-tuning the weights in such "autoenc翻译 2015-04-26 20:18:39 · 20275 阅读 · 2 评论 -
Caffe: gflag编译出现问题汇总
1. 使用Unicode字符集:出现问题E:\CodeBase\ML\Caffe\ThirdPartySrc\gflags-master\src\gflags.cc(1340): error C2664: 'BOOL PathMatchSpecW(LPCWSTR,LPCWSTR)' : cannot convert argument 1 from 'const char *' to 'LP原创 2016-07-12 14:36:19 · 5247 阅读 · 0 评论 -
Caffe: Vs13添加CUDA支持
右键工程点击:Building Dependency右击:Build Customizations点击选项:CUDA 7.5原创 2016-07-11 18:43:08 · 973 阅读 · 0 评论 -
分布式机器学习框架:CXXNet
caffe是很优秀的dl平台。影响了后面很多相关框架。 cxxnet借鉴了很多caffe的思想。相比之下,cxxnet在实现上更加干净,例如依赖很少,通过mshadow的模板化使得gpu和cpu代码只用写一份,分布式接口也很干净。CXXNET:极致的C++深度学习库 cxxnet是一个并行的深度神经网络计算库,它继承了xgboost的简洁和极速的基因,并开始被转载 2016-07-08 11:04:44 · 1781 阅读 · 0 评论 -
MxNet : use the MxNet windows versioin
The MxNet needs the following thirdparties:1. lapack complie lapack-3.6.1: download the lapack-3.6.1 sourcecode: http://www.netlib.org/lapack/#_lapack_for_windows 1.2.原创 2016-08-01 15:02:13 · 836 阅读 · 0 评论 -
分布式机器学习框架:MxNet
MxNet官网: http://mxnet.readthedocs.io/en/latest/前言:caffe是很优秀的dl平台。影响了后面很多相关框架。cxxnet借鉴了很多caffe的思想。相比之下,cxxnet在实现上更加干净,例如依赖很少,通过mshadow的模板化使得gpu和cpu代码只用写一份,分布式接口也很干净。mxnet是cxxnet的下一代,目前实现了翻译 2016-07-12 09:57:48 · 3681 阅读 · 0 评论 -
CVPR2015深度学习回顾
ConvNet革命:一个网络预训练;计算机视觉的开源深度学习:Torch VS Caffe;嵌入大脑的视频游戏引擎:面向机器智能的不同路径;深度场景CNNs物体检测器;CVPR无意之事:ArXiv出版狂热 & 百度惨败。转载 2015-08-24 15:03:45 · 885 阅读 · 0 评论 -
On Tutorial with Caffe--a Hands DIY DL for Vision
Caffe作为DL的一个学习框架,Caffe is a deep learning framework made with expression, speed, and modularity in mind.It is developed by the Berkeley Vision翻译 2015-04-09 17:51:00 · 1617 阅读 · 0 评论 -
MxNet教程:使用一台机器训练1400万张图片
此方法描述了如何是使用一台机器 -4张GTX980互联在一台机器上,训练8.5天训练完整个ImageNet 数据集,此数据集有14,197,087张图片。 1.存储海量数据的方法。 2.最小化内存的计算代价。 3.如何快速训练模型。翻译 2016-07-21 19:24:14 · 4502 阅读 · 0 评论 -
VS2013(Win10X64)-配置编译Caffe
2014年4月的时候自己在公司就将Caffe移植到Windows系统了,今年自己换了台电脑,想在家里也随便跑跑,本来也装了Ubuntu可以很方便的配置好,无奈在家的风格是“娱乐的时候抽空学习”,所以移植到Windows还是很有必要的。但是,公司禁止将公司内部资料带出,很多地方又都忘记了,周末磨了一天终于移植完,本篇为记录将Caffe移植至Windows7 x64系统下的一些关键步骤。下面介绍如何从源码建立VS2013工程。转载 2015-04-19 13:11:24 · 5322 阅读 · 0 评论 -
VC维与DNN的Boundary
原文链接:解读机器学习基础概念:VC维来去 作者:vincentyao目录:说说历史 Hoeffding不等式 Connection to Learning 学习可行的两个核心条件 Effective Number of Hypotheses Growth Function Break Point与Shatter VC Bound VC dimens...翻译 2015-04-23 23:19:34 · 3231 阅读 · 0 评论 -
支持向量机的近邻理解:图像二分类为例(3)
在图像识别领域,灰度图像被称为传说中的2维张量,任意图像为由所有二类图像构成的这个二维张量空间内的一个点。由人类专家完成图像属性归纳,把二维张量空间图像的特征显式的归结为一维张量空间的n维向量上,被称为特征提取。一般提取的特征并不一定能在n维向量空间中线性可分,这就需要再由模型进行一次映射,把向量样本转换到新的空间实现线性可分。原创 2016-10-22 16:21:29 · 1333 阅读 · 0 评论 -
deeplearning4j – 分布式DL开源项目
Deeplearning4j是一个使用Java书写的商业级的深度学习库。有意思. 一定要完整的看看....Deeplearning4j is the first commercial-grade deep-learning library written in Java. It is meant to be used in business environments, rather than as a research tool for extensive data exploration. Deeple转载 2014-07-06 17:58:08 · 3111 阅读 · 0 评论 -
工厂模式-CaffeNet训练
RNN神经网络:http://nbviewer.ipython.org/github/BVLC/caffe/blob/master/examples/detection.ipynb模型定义中有一点比较容易被误解,信号在有向图中是自下而上流动的,并不是自上原创 2015-04-06 08:59:12 · 1802 阅读 · 0 评论 -
Caffe+UbuntuKylin14.04_X64+CUDA 6.5配置
在编译Caffe的漫长过程中,经过了一个又一个坑,掉进去再爬出来,挺有趣的。对比原文有修改! LInux下配置安装:(本文档使用同一块NVIDIA显卡进行显示与计算, 如分别使用不同的显卡进行显示和计算,则可能不适用。)转载 2015-01-14 11:03:43 · 1752 阅读 · 0 评论 -
子空间:群论的角度解释无监督深度学习
论文把DL的非监督学习映射为群,是为轨道——稳定集理论。DL的群映射:轨道——稳定集理论,貌似一种子空间理论。翻译 2015-04-23 22:24:10 · 3669 阅读 · 0 评论 -
DNN:DL讨论与DNN经典论文汇总
引言:达尔文的进化哲学:适者生存!其原因不是因为适者生存,而是因为不适者都会死去;没有免费的午餐定理:没有普适性的优越算法,如果一个算法对一个或一些应用相对其他算法表现极大的优越性,那么在特定领域必然也体验足够的弱势;纯科学的存在价值:不能转化为应用的科学是没有价值的,纯科学的存在价值,就是维持整个科学体系的严谨性;原创 2013-12-31 15:04:06 · 5280 阅读 · 0 评论 -
End to End Sequence Labeling via Bi-directional LSTM CNNs CRF
来看看今日头条首席科学家的论文:End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF使用LSTM方法进行序列标注,完成大规模标注问题翻译 2017-05-09 11:54:46 · 2971 阅读 · 0 评论 -
基于神经网络的混合计算(DNC)-Hybrid computing using a NN with dynamic external memory
常规计算机算法能够处理复杂的大型数据结构,比如英特网和社交网络,但必须经过人类“手动”编程。神经网络则能通过示例学习如何识别复杂模式,但很难解析或组织复杂的数据结构。Alex Graves、Greg Wayne及同事,开发了一种名叫可微分神经计算机(DNC)的混合型学习机器,它由能从外部存储结构(类似常规计算机的随机存取存储器)读写数据的神经网络组成。因此,DNC能在没有先验知识和专门编程的条件下,仅仅通过试错方法来学习规划伦敦地铁路线,还能完成方块拼图游戏。翻译 2016-11-12 13:50:26 · 3348 阅读 · 0 评论 -
人工机器:NDC-谷歌机器翻译破世界纪录,仅用Attention模型,无需CNN和RNN
NTM的成熟体DNC竟然达到了这种能力,不知道进化成完全体会是什么样子。竟然在机器翻译的准确率上超过了已经公布的所有模型,不愧是最接近现阶段最接近图灵机的有限图灵机。在数码宝贝中,我最喜欢的是阿和的加布兽进化的究极体数码宝贝——钢铁加鲁鲁,其使用的武器绝对冷冻气——就洋溢着极其欠揍的高冷味道。转载 2017-06-14 20:07:15 · 3526 阅读 · 1 评论 -
使用Caffe预测遇到的问题
在使用网络预测图像时,prediction = net.predict( [input_image] )出现: net.image_dims[0] 不是整数情况,原创 2015-04-07 14:06:55 · 4171 阅读 · 0 评论 -
DL for Vision:A Tutorial with Caffe 报告笔记
对机器学习、深度学习的一些介绍,包括若干深度学习的经典模型; Caffe 的 优势 (模块化、速度、社区支持等)、 基本结构 (网络定义、层定义、Blob等)和 用法 (模型中损失函数、优化方法、共享权重等的配置、应用举例、参数调优的技巧),以及 未来方向 (CPU/GPU 并行化、Pythonification、Fully Convolutional Networks等)。转载 2015-03-31 17:34:13 · 867 阅读 · 0 评论 -
cannot find Toolkit in /usr/local/cuda-8.0
使用apt-get进行安装sudo apt install nvidia-cuda-toolkit原创 2017-05-27 17:37:33 · 7746 阅读 · 0 评论 -
Caffe+Kubuntu16.04_X64+CUDA 8.0配置
前言: 经过尝试过几次Caffe,theano,MxNet之后,很长时间没有进行caffe的更新,此次在Ubuntu16.04下安装Caffe,折腾了一天时间,终于安装成功。 既然使用了最新版本,必然使用最新版本的CUDA,且只有CUDA8.0给了ubuntu16.04支持。原创 2016-08-26 12:51:09 · 6337 阅读 · 0 评论 -
图像压缩Vs.压缩感知
SparseCoding,压缩感知。对样本集合进行超完备重建,使用非监督学习方法,寻找样本特征集的超完备基,而对任一样本来说,使用此组基的表示稀疏是稀疏的,即只有少量的基向量非0。小品文压缩感知科普文两则:原文链接:http://www.cvchina.info/2010/06/08/compressed-sensing-2/ 这几天由于happyharry...转载 2013-09-23 09:50:13 · 5117 阅读 · 0 评论 -
各种流行深度学习构架的性能对比
知乎上对各种深度学习方法的对比: 在众多的神经网络框架如chainer, caffe, torch,mxnet等之间如何做选择?四个月前就有人提出更新对比,现在我看还没有对比更新过。 Evaluation of Deep Learning Toolkits原文: Abstract. In this study, I ev翻译 2016-07-07 19:34:38 · 7344 阅读 · 0 评论 -
AI: DL方法与问题空间探索
所谓问题的解决是生存参数空间的一种状态转移到另外一种状态,而目的状态恰好是主体所希望的。完成这种转换的一系列脚本变化过程叫做场景序列,也叫通路。驱动这一些列场景转换的主体参与过程,被称为主动执行。而主体参与执行过程所抽象出来的主动参与行为规则,被称为解决问题的方法。状态空间转换总有一条最短时间转换通路或者一条最短空间转换通路,被称为最优通路,而主体在参与过程中使用的方法为最优方法。原创 2015-07-30 09:15:01 · 629 阅读 · 0 评论 -
使用Eric构建Caffe应用程序-Baby年龄识别
训练好的Caffe网络结构,可以固定下来,直接载入程序作为数据库接口使用。本文使用Eric构建运行于Python环境下的图片识别应用程序。若从0开始,一般可以使用最简单的六层网络,使用Caffe可以仅配置参数就可以构建简单的CNN,一般的六层网络是这样设置的:InPut——>Conv层——>Pooling层——>Conv层——> Pooling层/ ReLU整流层+pooling层——>全链接层——>softMax层——>输出类别概率。原创 2015-04-09 17:34:02 · 1143 阅读 · 0 评论 -
DNN:逻辑回归与 SoftMax 回归方法
第四章:SoftMax回归UFLDL Tutorial 翻译系列:http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial简介:见 AI : 一种现代方法。Chapter21. Reinforce Learning p.703 Softmax函数为多个变量的Logitic函数的泛化. ...翻译 2016-05-18 18:59:20 · 8115 阅读 · 0 评论