
大数据
chang_ge
这个作者很懒,什么都没留下…
展开
-
hive为什么与hbase整合
1.hive为什么与hbase整合?2.hive整合hbase的优缺点是什么?网上很多hive与hbase整合文档,但是为什么要整合,下面给大家对照一下,就能看出其中的原因了。转载 2016-08-20 15:11:11 · 2229 阅读 · 0 评论 -
Spark Streaming与Storm的对比分析
Spark Streaming与Storm的对比分析一、Spark Streaming与Storm的对比二、Spark Streaming与Storm的优劣分析事实上,Spark Streaming绝对谈不上比Storm优秀。这两个框架在实时计算领域中,都很优秀,只是擅长的细分场景并不相同。Spark Streaming仅仅在吞吐量上比Storm要优秀,而吞吐量这一点,也是历来挺Spark Str...转载 2018-05-14 09:45:14 · 826 阅读 · 0 评论 -
HBase总结 LSM理解
讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来:哈希存储引擎 是哈希表的持久化实现,支持增、删、改以及随机读取操作,但不支持顺序扫描,对应的存储系统为key-value存储系统。对于key-value的插入以及查询,哈希表的复杂度都是O(1),明显比树的操作O(n)快,如果不需要有序的遍历数据,哈希表就是your Mr.RightB树存储引擎是B树(关于B树的由来,数据结...转载 2018-04-12 09:57:47 · 607 阅读 · 0 评论 -
Intellij IDEA 14.1.4 Scala开发环境搭建
主要内容Intellij IDEA开发环境简介Intellij IDEA Scala开发环境搭建Intellij IDEA常见问题及解决方案Intellij IDEA常用快捷键1. Intellij IDEA开发环境简介具体介绍请参见:http://baike.baidu.com/link?url=SBY93H3SPkmcmIOmZ8H60O1k4iVLgOmdqoKdGp转载 2017-08-09 14:13:21 · 443 阅读 · 0 评论 -
IDEA的查询引用、调用关系图的功能
Eclipse的"Call Hierarchy"可以查看一个Java方法或类成员变量的调用树(caller和callee两个方向),非常方便。 在IDEA中类似功能被划分到了三个命令。 IntelliJ IDEA中可以在主菜单中选择Navigate | Call Hierarchy命令查看一个Java方法调用树(caller和callee两个方向),但是不像Eclipse那样可以查看类转载 2017-07-07 11:11:52 · 3057 阅读 · 0 评论 -
转Intellij支持Eclipse的代码格式化文件
对于一个团队来说,使用统一的代码格式是非常重要的,否则在使用版本控制工具时,会出现大量的冲突。在Eclipse里,我们可以通过一些xml来进行代码格式的统一,但是这些文件要应用在Intellij里,还是要费一点周折的。不过如果你跟博主一样,有过合并一个文件出现200个冲突的惨痛经历之后,就会觉得这个工作是值得的了。方法一般我们使用Eclipse会统一的code-style.xml文转载 2017-06-28 09:43:21 · 1272 阅读 · 0 评论 -
IntelliJ Idea 常用快捷键 列表
IntelliJ Idea 常用快捷键 列表(实战终极总结!!!!) 1. -----------自动代码-------- 常用的有fori/sout/psvm+Tab即可生成循环、System.out、main方法等boilerplate样板代码 例如要输入for(User user : users)只需输入user.for+Tab 再比如,要输入Date birth转载 2017-07-06 15:12:39 · 374 阅读 · 0 评论 -
使用IntelliJ IDEA 配置Maven(入门)
1. 下载Maven 官方地址:http://maven.apache.org/download.cgi解压并新建一个本地仓库文件夹2.配置本地仓库路径 3.配置maven环境变量 4.在IntelliJ IDEA中配置maven 打开-File-Settings 5.新建maven WEB转载 2017-06-26 15:12:51 · 634 阅读 · 0 评论 -
centos 安装sbt
centos 安装sbt标签:1.yum install sbt2.如果不行,则 curl https://bintray.com/sbt/rpm/rpm > bintray-sbt-rpm.reposudo mv bintray-sbt-rpm.repo /etc/yum.repos.d/sudo yum install sbt转载 2016-09-28 10:42:53 · 873 阅读 · 0 评论 -
SparkNET: 用Spark训练深度神经网络
SparkNet: Training Deep Network in Spark原文是:《SparkNet: Training Deep Network in Spark》本博客是该论文的阅读笔记,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。更多相关博客请猛戳:http://blog.youkuaiyun.com/cyh_24如需转载,请附上本文转载 2016-09-28 08:30:11 · 3786 阅读 · 1 评论 -
Hadoop中HDFS优缺点
HDFS的优点: 1、处理超大文件 这里的超大文件通常是指百MB、甚至数百TB大小的文件。目前在实际应用中,HDFS已经能用来存储管理PB级的数据了。 2、流式的访问数据 HDFS的设计建立在“一次写入、多次读写”任务的基础上。这意味着一个数据集一旦由数据源生成,就会被复制分发到不同的存储节点中转载 2016-08-24 10:41:32 · 10826 阅读 · 1 评论 -
各种编程模型,hadoop,pig,tez,spark
作者:用心阁链接:https://www.zhihu.com/question/26568496/answer/41608400来源:知乎著作权归作者所有,转载请联系作者获得授权。Hadoop首先看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。HDFS,在由普通PC组转载 2016-08-24 10:04:31 · 2877 阅读 · 0 评论 -
闲聊Oracle Exadata与Hadoop
在文章开始前先作个声明,本人并非专业技术人员,充其量只能算IT从业人员和技术爱好者。本文也不是写给专业技术人员看的技术类文档,只是本人因为工作需要,在学习Oracle Exadata系统架构的过程中,自己的一些感触和体会,只是想分享给对Oracle Exadata和其他计算机技术感兴趣的人们,希望大家能一起探讨。因此本文在谈到技术细节问题时,一定漏洞百出,敬请专业人士指正。 Orac转载 2016-08-23 20:34:08 · 4528 阅读 · 0 评论 -
Storm介绍及与Spark Streaming对比
1 Storm介绍Storm是由Twitter开源的分布式、高容错的实时处理系统,它的出现令持续不断的流计算变得容易,弥补了Hadoop批处理所不能满足的实时要求。Storm常用于在实时分析、在线机器学习、持续计算、分布式远程调用和ETL等领域。在Storm的集群里面有两种节点:控制节点(Master Node)和工作节点(Worker Node)。控制节点上面运行一个名为Nimbus的进程,它用...转载 2018-05-14 09:52:12 · 204 阅读 · 0 评论