- 博客(82)
- 收藏
- 关注
原创 欢迎使用优快云-markdown编辑器
Java基础数据类型: 原生类型:int,double等八种 reference/Object Type(是在哪里存的value、地址) -class object,array变量传引用还是传值 -java是pass by value的(就算是对象),对于dog本身copy了一份,除了用关键字形式定义的原生类型,剩下的都叫reference,copy dog时,把String name的
2017-04-09 20:40:26
398
转载 浅谈语义主题计算
浅谈语义主题计算文章来源:百度搜索研发部两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都
2017-03-13 16:58:54
529
原创 Blas 基本函数功能
CAXPYconstant times a vector plus a vector. //常数乘以一个向量加上一个向量。CCOPY copies a vector x to a vector y.//复制一个向量x到y的向量。CDOTCforms the dot product of two vectors, conjugating the first vector.//结合
2016-12-17 10:11:52
2338
原创 开平方实现
首先是最普通的CRT里自带的sqrt,只需要引用math.h就可以使用了:[cpp] view plain copy print?#include result = sqrt(number); 接下来是传统的牛顿迭代法,我们计算开方的时候就是手工不断尝试每一位最合适的数字,然后一步步收敛求得更精确的答
2016-12-16 17:09:58
1645
原创 word2vec源码解读
一、Word2Vec程序解析word2vec主要的层次结构vocab是一个结构体数组。*Vocab_hash是一个hash链表。vocab存入词的时候实际是按照先后顺序存储的。为了方便查找,在词存入的时候顺便把词在链表中的位置存入到vocab_hash中,而该词的vocab_hash位置有hash(word)决定,这样查找起来很快
2016-12-16 16:29:10
2540
原创 word2vec实现踩坑
xorshift算法生成随机数的原理是什么?https://www.zhihu.com/question/27951358float与double运行速率问题http://blog.youkuaiyun.com/xiaqian0917/article/details/53676644Yoshua Bengio等大神传授:26条深度学习经验http://www.csd
2016-12-15 21:42:20
715
转载 深度学习中的初始化
layer { name: "conv1" type: "Convolution" bottom: "data" top: "conv1" param { lr_mult: 1 } param { lr_mult: 2 } convolution_param { num_output: 32 pad: 2 kernel_s
2016-12-15 21:35:03
3189
转载 汇编学习float与double速率问题
X86处理器包含两种类型的浮点数寄存器。第一种使用8个浮点寄存器组成浮点寄存器栈,另一种为向量寄存器(XMM,YMM),它们对于单双精度的处理是不同的。本文将讨论两种模式下的浮点数计算速度问题。一、当我们编译32位程序时,使用的是x87指令集,即使用浮点寄存器堆栈进行浮点计算。此种情况下,单精度与双精度的处理是统一的,故计算速度上没有差异。我们可以做如下验证:[cs
2016-12-15 21:32:14
2779
原创 算法库:基础线性代数子程序库(Basic Linear Algebra Subprograms,BLAS)介绍
算法库:基础线性代数子程序库(Basic Linear Algebra Subprograms,BLAS)介绍 调试DeepFlow光流算法,由于作者给出的算法是基于Linux系统的,所以要在Windows上运行,不得不做大量的修改工作。移植到Windows平台,除了一些头文件找不到外,还有一些函数也找不到。这其中就涉及到三个函数:sgemv_,sgemm,saxpy_。百
2016-12-15 20:45:57
2734
转载 机器学习评价指标大汇总
http://www.zhaokv.com/2016/03/ml-metri点击打开链接c.html?utm_source=tuicool&utm_medium=referral总结、机器学习机器学习评价指标大汇总2016年3月2日 无影随想发表回复在使用机器学习算法的过程中,针对不同场景需要不同的评价指标,在这里对常用的指标进行一个简单的汇总。
2016-12-05 16:35:03
2669
转载 多类分类(Multi-label classification)性能评价之宏平均(macro-average)与微平均(micro-average)
通常,我们在评价classifier的性能时使用的是accuracy考虑在多类分类的背景下accuracy = (分类正确的样本个数) / (分类的所有样本个数)这样做其实看上去也挺不错的,不过可能会出现一个很严重的问题:例如某一个不透明的袋子里面装了1000台手机,其中有600台iphone6, 300台galaxy s6, 50台华为mate7,50台mx4(当然,这些信息分类器是
2016-12-03 15:43:57
17803
6
转载 Kaggle大数据竞赛平台入门
转载自http://www.cnblogs.com/zhao441354231/p/6061363.html大数据竞赛平台,国内主要是天池大数据竞赛和DataCastle,国外主要就是Kaggle.Kaggle是一个数据挖掘的竞赛平台,网站为:https://www.kaggle.com/.很多的机构,企业将问题,描述,期望发布在Kaggle上,以竞赛的方式向广大的数据科学家征集解决方案,
2016-12-01 10:03:36
1168
转载 数据科学的完整学习路径(Python版)
本文由 伯乐在线 - 笑虎 翻译,艾凌风 校稿。未经许可,禁止转载!英文出处:analyticsvidhya。欢迎加入翻译组。从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台)假如你想成为一个数据科学家,或者已经是数据科学家的你想扩展你的技能,那么你已经来对地方了。本文的目的就是给数据分析方面的Python新手提供一个完
2016-11-23 10:44:47
860
转载 九章算法6:Linked List
九章算法6:Linked List内容基于九章算法课件 (http://www.jiuzhang.com/)链表的结构 如果我进行两个操作: 1.node1 = node2; 2.print head具体代码 结果仍是 1 2 3因为node1只是一个地址信息,如果把内存比作一个大数组, 这个node1
2016-11-21 22:33:47
455
转载 Data Structure
Data Structure内容基于九章算法课件 (http://www.jiuzhang.com/)Linear and treeLinear Data Structure,通常用数组实现 -Queue -Stack -HashTree Data Structure,通常用指针 -TreeQueue : BFSO(1) Push
2016-11-21 22:32:41
289
转载 九章算法7:Array & Numbers
九章算法7:Array & Numbers内容基于九章算法课件 (http://www.jiuzhang.com/)Merge two sorted arrayGiven two sorted integer arrays A and B, merge B into A as one sorted array. A = [1, 2, 3, empty, empty]
2016-11-21 22:31:27
500
转载 九章算法5:动态规划II
九章算法5:动态规划II内容基于九章算法课件 (http://www.jiuzhang.com/)单序列动态规划 题目:Palindrome Partitioning Given a string s, cut s into some substrings such that every substring is a palindrome.Return th
2016-11-21 22:30:22
1524
1
转载 九章算法4:动态规划I
http://blog.youkuaiyun.com/github_30242787/article/details/50819414递归和动态规划内容基于九章算法课件 (http://www.jiuzhang.com/)从Triangle这个问题说起:题目:Given a triangle, find the minimum path sum from top
2016-11-21 22:29:15
1221
转载 6 linkedlist
前言又是很长时间才回来发一篇博客,前一个月确实因为杂七杂八的事情影响了很多,现在还是到了大火燃眉毛的时候了,也应该开始继续整理一下算法的思路了。Linked List大家应该是特别熟悉不过的了,因为这个算是数据结构了里面基本上最开始讲的结构吧。这块内容也没有太多需要琢磨的技巧,可以考量的东西也不多,所以考的就是一些小的trick来完成,面试中链表考得特别多,算是面试官对面试者的基础的考查,
2016-11-21 22:17:30
225
转载 4 dynamic programming
前言时隔这么久才发了这篇早在三周前就应该发出来的课堂笔记,由于懒癌犯了,加上各种原因,实在是应该反思。好多课堂上老师说的重要的东西可能细节上有一些急记不住了,但是幸好做了一些笔记,还能够让自己回想起来。动态规划算是我的一道大坎了,本科的时候就基本没有学过,研一的时候老师上课也是吃力的跟上了老师的步伐,其实那个时候老师总结的还是挺好的:把动态规划的题目都分成了一维动规、二维遍历、二维不遍历等
2016-11-21 22:16:03
293
转载 3 Binary Tree & Divide Conquer
前言第一天的算法都还没有缓过来,直接就进入了第二天的算法学习。前一天一直在整理Binary Search的笔记,也没有提前预习一下,好在Binary Tree算是自己最熟的地方了吧(LeetCode上面Binary Tree的题刷了4遍,目前95%以上能够Bug Free)所以还能跟得上,今天听了一下,觉得学习到最多的,就是把Traverse和Divide Conquer分开来讨论,觉得开启了
2016-11-21 22:13:54
300
转载 2 Binary Search
前言先说一些题外的东西吧。受到春跃大神的影响和启发,推荐了这个算法公开课给我,晚上睡觉前点开一看发现课还有两天要开始,本着要好好系统地学习一下算法,于是就爬起来拉上两个小伙伴组团报名了。今天听了第一节课,说真的很实用,特别是对于我这种算法不扎实,并且又想找工作,提高自己的情况。 那就不多说废话了,以后每周都写个总结吧,就趁着这一个月好好把算法提高一下。具体就从:课堂笔记、leetcode和li
2016-11-21 22:12:04
236
转载 机器学习资源博客链接
机器学习与数据挖掘网上资源搜罗——良心推荐2016-03-18 要学习更多点这→ 数据挖掘入门与实战作者: 左飞著有《算法之美——隐匿在数据结构背后的原理(C++版)》原文 http://blog.youkuaiyun.com/baimafujinji/article/details/50467970做机器学习和数据挖掘方面的
2016-11-20 12:15:36
355
原创 经典刷题
大公司笔试面试有哪些经典算法题目?牛妹小号最新回答】牛妹帮大家整理了65道面试经典编程题目,求点赞哦https://www.zhihu.com/question/19805213/answer/131897390?from=profile_answer_card
2016-11-19 11:50:03
338
转载 程序员不得不知道的技术面试资料大全
本文由yuanbin和九章算法协同著作。网站推荐GeeksforGeeks.org 非常著名的漏题网站之一。上面会时不时的有各种公司的面试真题漏出。有一些题也会有解法分析。CareerCup.com CC150作者搞的网站,也是著名的漏题网站之一。大家会在上面讨论各个公司的面试题。Glassdoor.com 一个给公司打分的网站,类似yelp的公司版。会有一些人在上面讨论面试题
2016-11-09 15:07:57
304
转载 Java,C++中的容器类
说到容器, 学习C++的都会想到STL库,曾经把STL源码剖析看了两遍,每次头昏脑胀不想再看,现在回想起来,STL库的东西忘的差不多了,就剩几个容器的使用方法了。关于Java的容器,大二的时候就开始学习过,但是却懵懵懂懂,这次把两种语言的容器做个对比,记录下来,希望能够做到帮助自己记忆,同时帮助别人。1、C++容器标准STL序列容器:vector、string、deque和list。
2016-11-01 22:12:40
456
转载 word2vec源码思路和关键变量
最近在看word2vec,虽然看了几位大神些的pdf,但是感觉对于更细的代码思路解释不是特别的到位,尤其对于菜鸟来说,看到这篇博客些的还比较直白和浅显易懂,果断转了转自:http://blog.youkuaiyun.com/zshunmiao/article/details/171423891一个输入层 ; 1 个隐含层; 1个输出层syn0 input ->
2016-10-07 19:59:51
294
原创 欢迎使用优快云-markdown编辑器
http://blog.youkuaiyun.com/itplus/article/details/37969635 原始的skip-gram是一种计算语言模型。看题目中说要训练得到词向量,猜测题目里的skip-gram指的是类似于word2vec中的skip-gram 。那么就以word2vec中的经典模型skip-gram negative sampling来举例说明:word2vec中的skip-gra
2016-07-21 11:46:50
283
原创 A Neural Probabilistic Language Model
A Neural Probabilistic Language Model,这篇论文是Begio等人在2003年发表的,可以说是词表示的鼻祖。在这里给出简要的译文 A Neural Probabilistic Language Model一个神经概率语言模型摘 要 统计语言模型的一个目标是学习一种语言的单词序列的联合概率函数。因为维数灾难,
2016-07-18 23:25:46
9585
1
原创 storm数据流分组
数据流分组定义了一个数据流中的tuple如何分发给topology中不同bolt的task。Shuffle grouping(随机分组):这种方式会随机分发 tuple 给 bolt 的各个 task,每个bolt 实例接收到的相同数量的 tuple。Fields grouping(按字段分组):根据指定字段的值进行分组。比如说,一个数据流根据“word”字段进行分组,所有具有相同“
2016-07-05 11:24:19
3224
原创 Topology各种方法生命周期
1、在定义Topology实例过程中,定义好Spout实例和Bolt实例2、在提交Topology实例给Nimbus的过程中,会调用TopologyBuilder实例的createTopology()方法,以获取定义的Topology实例。在运行createTopology()方法的过程中,会去调用Spout和Bolt实例上的declareOutputFields()方法和getCompone
2016-07-05 11:16:23
503
原创 git使用笔记
构建远程仓库并与本地的文件夹绑定首先我默认大家已经明白在本地建立版本库,github上创建项目和共钥私钥的问题在这里我们能看到项目的地址在我们自己电脑的版本库里[html] view plain copy git remote add origin git@github.com:xiaoqiannju/hello-world.git
2016-07-05 11:13:21
263
转载 Scala学习笔记(3): 面向对象与容器
面向对象编程这个通过一个例子来解释Scala面向对象编程的基本概念,这里我们需要为MongoDB(一种NoSQL数据库,详见我的另一篇博客)编写一个简单的API。MongoDB官方提供了Java API,而我们要做的是使用Scala对其进行简单的封装。Class先来搭建一个叫MongoClient的类作为建立数据库连接的入口,定义一个MongoClient类,并指定主构造函
2016-05-31 10:44:41
335
转载 CRF学习
刚才写了半天的文章,因为不小心点了舍弃,一切都要重来。怪自己不小心,不过这优快云的自动保存功能做的有点弱。迅速进入正题。这些天在研究CRF的东西,由于之前对机器学习的方面接触比较少,看CRF比较费力,现在把看到的一些想法分享出来,理解不到位的地方希望大牛过来指点指点。一、CRF的概念和原理参考《条件随机场理论综述》(韩冬雪、周彩根),这篇文章里面对CRF的基本理论都做了介
2016-05-25 23:12:16
778
原创 Storm源码分析--Nimbus-data
nimbus-datastorm-core/backtype/storm/nimbus.clj(defn nimbus-data [conf inimbus] (let [forced-scheduler (.getForcedScheduler inimbus)] {:conf conf :inimbus inimbus
2016-04-05 20:19:13
1026
转载 Storm Topology的并发度
Storm Topology的并发度Understanding the parallelism of a Storm topologyhttps://github.com/nathanmarz/storm/wiki/Understanding-the-parallelism-of-a-Storm-topology 概念一个Topology可以包含一个或多个worker(
2016-04-05 13:51:15
298
转载 Storm 简介
Storm 简介https://github.com/nathanmarz/storm/wiki/Documentation 安装和配置Storm的安装比较简单, 下载storm的release版本, 解压, 并且把bin/目录加到环境变量PATH里面去, 就ok了. 参考配置storm开发环境 当然为了运行Storm, 需要装一些其他的依赖的包, 可以参考Twit
2016-04-05 13:49:03
336
转载 worker启动executor源码分析-executor.clj
worker启动executor源码分析-executor.clj在"supervisor启动worker源码分析-worker.clj"一文中,我们详细讲解了worker是如何初始化的。主要通过调用mk-worker函数实现的。在启动worker时,需要启动属于该worker的executor。executor是通过worker执行mk-executor函数进行初始化的。在m
2016-03-26 16:44:55
420
转载 storm启动supervisor源码分析-supervisor.clj
storm启动supervisor源码分析-supervisor.cljsupervisor是storm集群重要组成部分,supervisor主要负责管理各个"工作节点"。supervisor与zookeeper进行通信,通过zookeeper的"watch机制"可以感知到是否有新的任务需要认领或哪些任务被重新分配。我们可以通用执行bin/storm supervisor >/
2016-03-26 16:43:47
1177
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人