
大数据
文章平均质量分 94
简一_hz
我拥有我的姿态!
展开
-
Hadoop和大数据:60款顶级开源工具
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。IBM更是非常看好开源大数据转载 2017-07-20 11:20:10 · 536 阅读 · 0 评论 -
HBase配置及API运行
昨天和今天我主要学习了下HBase,在此记录下自己的学习心得。初次接触HBase,发现它有自带的zookeeper;我原先是完全分布式安装了hadoop的,三台机器,不过我运行的时候暂时只开了两台,所以下面出现的例子都是只起了两台的哈。按理是要分开另外安装zookeeper比较好,而不是使用HBase自带的内部的zookeeper,原因大概就是如下所述(摘自百度知道一用户的回答,个人觉得他原创 2017-07-18 11:25:38 · 793 阅读 · 0 评论 -
Ubuntu16.04 Hive安装配置
说来自己断断续续自学大数据Hadoop已经有一段时间了,不过觉得还是晕乎乎的,各种看了就忘,好记性不如烂笔头,还是记录下吧,也希望能对后面自学的人能有所帮助。我的系统环境是Ubuntu16.04我安装的软件: Mysql Jdk1.8.0_121 apache-hive-2.1.1-bin mysql-connector-java-5.1.原创 2017-07-14 09:59:44 · 6350 阅读 · 0 评论 -
Hadoop/Eclipse - Exception NoClassDefFoundError: org/apache/hadoop/fs/FileSystem解决方法
今天在学习日志网站分析项目案例的时候遇上了一个问题,在此记录下解决方法。PS:具体项目操作大家请看Hadoop学习-日志网站分析项目案例里面讲的很具体项目,伟一步步照着来成功在自己的分布式hadoop环境下实现了,很感谢那个博客的作者。下面我讲下当我们遇到下面错误时该如何解决Exception in thread "main" java.lang.NoClassDefFoundEr原创 2017-07-19 17:32:57 · 6981 阅读 · 0 评论 -
在Docker上使用Weave搭建Hadoop和Spark跨主机容器集群
转载自http://www.dockone.io/article/1047,感谢作者方圆小生功能和环境说明实际环境是开发使用的两台服务器,每个服务器上是三个集群容器节点,总共六个节点,使用weave实现跨主机的通信,并且利用小插件可以实现在局域网或者是在外网查看监控集群的webUI和开放7077等关键端口进行程序远程调试功能。目前网上跨主机的工具很多,我挑选的是使用普遍点和资料转载 2017-07-26 13:38:05 · 1198 阅读 · 1 评论 -
Hadoop2.8.0+Zookeeper3.4.8+Hbase1.2.6完全分布式配置
准备环境三台Ubuntu系统的电脑同一局域网Java1.8.0_121Hadoop2.8.0Zookeeper3.4.8Hbase1.2.6大家可以自行取官网下载各工具的最新版本.Hadoop完全分布配置安装JDK解压java1.8.0_121.tar.gz到/opt/jvm下,编辑 vim /etc/profile文件,添加jdk环境变量:source /etc/profile命令使配置生效ja...原创 2018-04-12 17:21:01 · 614 阅读 · 0 评论 -
[转载]亿级Web系统搭建——单机到分布式集群
本文转载自徐汉彬前辈的博文,原文地址:点击打开链接自己通过这篇博文学到了很多,谢谢原文作者,特此转发分享下当一个Web系统从日访问量10万逐步增长到1000万,甚至超过1亿的过程中,Web系统承受的压力会越来越大,在这个过程中,我们会遇到很多的问题。为了解决这些性能压力带来问题,我们需要在Web系统架构层面搭建多个层次的缓存机制。在不同的压力阶段,我们会遇到不同的问题,通过搭建不同的服务和架构来解...转载 2018-04-26 09:53:52 · 259 阅读 · 0 评论