- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 disconf-web的搭建
disconf-web搭建 第一步首先是disconf-web在windows下的搭建 1、软件安装(tomcat,mysql,zookeeper,nginx,redis) 2、将disconf-web打成war包 在IDE中打开disconfig-web项目,通过maven package打包(在打包的过程中本人遇到一些坑,打包可能出现一些乱码情况,错误主要在pom.xml里,定位到打包的
2017-10-12 18:48:45
838
1
原创 spark和hadoop的区别
Spark只是分布式计算平台,而hadoop已经是分布式计算、存储、管理的生态系统。 与spark相对应的是hadoop mapreduce。我认为spark是可以取代mapreduce的,从而成为hadoop系统中不可或缺的一部分。 Spark和mapreduce的对比: 1、更快 2、更加容易使用 3、好用的库 4、运行方便
2017-06-15 09:52:59
615
原创 java,scala通过ansj分词 并做去除停词处理
下载ansj jar dependency> groupId>org.ansjgroupId> artifactId>ansj_segartifactId> version>0.9version> dependency>java版本List parse = NlpAnalysis.parse("山东威海隧道发生交通事故 造成9死1伤3人失踪");new NatureR
2017-05-17 15:25:59
2096
原创 朴素贝叶斯分类sparkmllib测试
贝叶斯分类的基础——贝叶斯定理 每次提到贝叶斯定理,我心中的崇敬之情都油然而生,倒不是因为这个定理多高深,而是因为它特别有用。这个定理解决了现实生活里经常遇到的问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率: P(A|B) 表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基
2017-05-15 14:51:04
1336
1
原创 IDEA 打jar,提交spark集群运行
1、idea打开file,选择projectstructure,点击Artifacts,如下图 选择add JAREmpty 然后点击OK 2、选择bulid Artifacts 点击bulid 就会打成jar 3、通过winSCP把jar上传到服务器/var/lib/hadoop-hdfs/application/bash/jar/testjjp.jar 4
2017-05-15 14:18:11
2194
原创 hbase基于solr的实时索引
实时查询方案 Hbase -----> Key Value Store ---> Solr ------->Web前端实时查询展示 1.Hbase 提供海量数据存储 2.Solr提供索引构建与查询 3. Key Value Store 提供自动化索引构建(从Hbase到Solr) 使用流程 前提: CDH5.3.2Solr集群搭建好,CDH5.3.2 Key-Value St
2017-05-12 11:49:35
2342
ik 2012FF_hf1.zip
2017-04-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人