- 博客(25)
- 资源 (3)
- 收藏
- 关注
转载 主流nosql数据库对比
转自:http://asyty.iteye.com/blog/1202106主流nosql数据库对比博客分类: NOSQLnosql数据库对比 目前开源的NOSQL数据库有,Redis,Tokyo Cabinet,Cassandra,Voldemort,MongoDB,Dynomite,HBase,CouchDB,Hypertable, Riak,Tin, Fl
2016-02-23 10:52:18
1642
原创 关于概率图的一点理解
什么是概率图,顾名思义,肯定是和概率有关的,它存在的基础是是如何快速利用计算机从看似错综复杂的事物中找出我们想要的答案,而且得保证答案是正确的,那么怎么做呢。如何让一个问题、一堆杂乱的数,以可视化的、有序的方式表示呢?而且还得保证计算机能读懂,能对其进行操作、挖掘内容。这大概就是发掘它的初衷吧。详述起来它可以分为三种表示形式,一种叫贝叶斯网络,一种叫马尔科夫网络,还有就是他俩的混合形式。整体都是由
2015-12-24 14:01:37
1528
转载 HBase 超详细介绍
转自:作者:奥特man,发布于2012-12-14,来源:优快云1-HBase的安装HBase是什么?HBase是Apache Hadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据 存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作,如右侧的图所
2015-12-24 11:21:11
1221
原创 查找过的LaTex命令记录
1. LaTex 对于正文可以分栏,设置两栏间距的命令为: \setlength{\columnsep}{宽度}设置两栏间分隔线的宽度的命令为: \setlength{\columnseprule}{宽度}两栏间分割线宽度的默认值是0,表示不显示分割线。表示栏宽的参数:\columnwidth其值不能自行设定,
2015-02-24 01:44:48
1205
原创 Markov chain马氏链名词理解
irreducible:是指链从状态空间里一个位置经过有限步转到任何一个位置的概率大于0, 即说的是 马氏链里任何两个状态都是互通的(communicate)!(区别去规则链:这里ij,不同ij取值经过的使它们互通的步骤可能是不同的。而规则链意思就是肯定存在一个统一的步数,此时所有状态完全互通)%reducible:即可约的意思就是至少存在一个 i到j是不通的!(注意有可能j到i是通的)%
2014-11-19 01:00:08
9430
转载 最易懂的 先验概率、后验概率与似然估计 解释
比较有意思的文章http://hi.baidu.com/hi9394/blog/item/7e5132638102aa760c33faf2.html先验概率、后验概率与似然估计本文假设大家都知道什么叫条件概率了(P(A|B)表示在B事件发生的情况下,A事件发生的概率)。先验概率和后验概率教科书上的解释总是太绕了。其实举个例子大家就明白这两个东
2014-06-11 04:16:27
882
原创 Collections.unmodifiableMap()的简单解释
使用例子 protected Map parseArgs(String[] args) { if (args == null || args.length % 2 != 0) { throw new IllegalStateException("Cannot convert args!"); } Map parsedArgs = new HashMap(
2014-06-02 18:22:18
10552
原创 hadoop jar singlnode下运行的命令行输出
[hadoop@aaa ~]$ hadoop jar /opt/workspace/PGMdriver.jar GibbsSamplingDriver /output14/05/22 20:39:13 INFO client.RMProxy: Connecting to ResourceManager at /0.0.0.0:803214/05/22 20:39:13 WARN mapredu
2014-05-23 03:02:54
1193
转载 [Hadoop源码详解]之一MapReduce篇之InputForma
原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 、作者信息和本声明。否则将追究法律责任。http://shitouer.cn/2013/02/hadoop-source-code-analyse-mapreduce-inputformat/1. 概述我们在设置MapReduce输入格式的时候,会调用这样一条语句:?1jo
2014-05-16 05:07:36
738
原创 hadoop 程序遇到的问题
java.lang.Exception: java.lang.RuntimeException: java.lang.NoSuchMethodException: Hadoop_FPTree$MRMapper.init>() at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:403)
2014-05-16 04:18:38
6503
转载 hadoop各种输入方法(InputFormat)汇总
mapreduce中,一个job的map个数,每个map处理的数据量是如何决定的呢?另外每个map又是如何读取输入文件的内容呢?用户是否可以自己决定输入方式,决定map个数呢?这篇文章将详细讲述hadoop中各种InputFormat的功能和如何编写自定义的InputFormat. 简介: mapreduce作业会根据输入目录产生多个map任务,通过多个map任
2014-05-16 00:32:02
1171
原创 centos网络显示已连接但无法打开网页
系统centos6.4,桌面系统,使用Networkmanager配置网络已显示连接,但就是ping不通,
2014-05-12 07:52:52
7444
转载 Hadoop技术原理总结
转自1、Hadoop运行原理 Hadoop是一个开源的可运行于大规模集群上的分布式并行编程框架,其最核心的设计包括:MapReduce和HDFS。基于 Hadoop,你可以轻松地编写可处理海量数据的分布式并行程序,并将其运行于由成百上千个结点组成的大规模计算机集群上。 基于MapReduce计算模型编写分布式并行程序相对简单,程序员的主要工作就是设计
2014-05-11 19:01:05
897
转载 Log4j笔记 第一章 简单用上Log4j
Log4j笔记 第一章 简单用上Log4j博客分类:Log4jlog4jXMLApacheEclipse编程 第一节 概述Log4j诞生,为减轻对成千上万的Java代码 System.out.println(); System.err.println(); e.printStackTrace(); (e为Throwable
2014-05-07 01:31:24
672
转载 Hadoop 2.x的DistributedCache无法工作的问题
现象:和这个帖子描述的一样,简单说来就是,在Hadoop 2.x上,用新的DistributedCache的API,在mapper中会获取不到这个cache文件。下面就详细地描述一下新旧API的用法区别以及解决办法。『1』旧API将HDFS文件添加到distributed cache中:12Configuration conf = j
2014-05-03 05:43:57
1018
原创 hadoop distributed cache
distributed cache使用的流程总结如下:1.在HDFS上准备好要共享的数据(text、archive、jar)2.在distributed cache中添加文件3.在mapper或者reducer类中获取数据4.在map或者reduce函数中使用数据
2014-05-03 03:39:07
794
转载 hadoop常用命令
分类: 原文地址:hadoop常用命令 作者:gray1982启动Hadoop进入HADOOP_HOME目录。执行sh bin/start-all.sh关闭Hadoop进入HADOOP_HOME目录。执行sh bin/stop-all.sh 1、查看指定目录下内容hadoop dfs –ls [文件目录]e
2014-05-02 05:53:55
661
原创 Gibbs Sampling简单总结
Gibbs Samping 是MCMC中最常用的方法,基本的原理就是构造一条马尔可夫链,已知变量间的条件概率,求变量的联合概率分布。通常若按数学公式是可以直接求出联合概率的,但随着变量数量的增大,公式求解,变得异常复杂,遂通过采样的方式求得联合概率分布。基本过程:比如我们已知变量A,B,C,并知p(A|B,C),p(B|A,C),p(C|A,B),step1:给ABC随机赋值,即随
2014-03-15 18:34:38
1170
转载 [Java]读取文件方法大全
转自http://www.cnblogs.com/lovebread/archive/2009/11/23/1609122.html[Java]读取文件方法大全1、按字节读取文件内容2、按字符读取文件内容3、按行读取文件内容4、随机读取文件内容 public class ReadFromFile { /** * 以字节为
2014-03-12 03:42:28
655
转载 贝叶斯网络应用实例一:胸部疾病诊所
转自:http://blog.sciencenet.cn/blog-82650-255141.html 以下内容摘录自www.norsys.com,根据实例内容意译译文。贝叶斯网络应用实例一:胸部疾病诊所(Chest Clinic)假想你是Los Angeles一名新毕业的医生,专攻肺部疾病。你决定建立一个胸部疾病诊所,主治肺病及相关疾病。大学课本已经中告诉你了肺癌、肺结核
2014-03-11 20:04:34
6272
原创 csdn牛人太多
csdn的牛人太多了,好东西也太多了,可是看了消化之后,最好自己能做些笔记,这样便于之后忘记的时候迅速的复习回忆!希望我之后也能添些新东西进去。最近在看有关LDA隐含狄利克雷分布和Gibbs采样以及概率图模型,概念不是太清晰,有些模糊,还是没太明白,LDA到底是干嘛用的,还有就是LDA建模哪个是已知的量,可以求出哪个量?没太懂!继续探求!
2014-03-04 02:22:02
778
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人