
Hadoop
文章平均质量分 92
冷月宫主
性格:温和
爱好:读书、听音乐、玩游戏、编程、聊天
生活态度:随缘
工作状况:一般
受教育状况:大学
展开
-
Spring Boot项目中使用最新版HDFS Java API操作Hadoop 3.x详解
(1)在Spring Boot/Spring Cloud项目中添加以下依赖: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 <!-- Apache Hadoop --> <dependency> <groupId>org.apache.hadoop<...转载 2020-11-17 18:54:21 · 1632 阅读 · 0 评论 -
Java API操作Hadoop可能会遇到的问题以及解决办法
Could not locate Hadoop executable: xxx\bin\winutils.exe 1 2 3 4 5 6 Caused by: java.io.FileNotFoundException: Could not locate Hadoop executable: D:\hadoop-3.0.3\bin\winutils.exe -see https://wiki.apache.org/hadoo..转载 2020-11-17 18:53:01 · 831 阅读 · 0 评论 -
[Hadoop] 实际应用场景之 - 百度
百度在2008年就开始使用Hadoop作为其离线数据分析平台,从Hadoop v0.18/0.19开始,300台机器,2个集群,现在的规模为2W台节点以上,最大集群接近4,000节点,每日处理数据20PB+,每日作业数120,000+Hadoop在百度主要用于如下场景:日志的存储和统计;网页数据的分析和挖掘;商业分析,如用户的行为和广告关注度等;在线数据的反馈,转载 2013-06-24 09:07:52 · 891 阅读 · 0 评论 -
基于Hadoop的云盘系统上传和下载效率优化及处理大量小文件的解决方法
基于任何平台实现的云盘系统,面临的首要的技术问题就是客户端上传和下载效率优化问题。基于Hadoop实现的云盘系统,受到Hadoop文件读写机制的影响,采用Hadoop提供的API进行HDFS文件系统访问,文件读取时默认是顺序、逐block读取;写入时是顺序写入。一、读写机制 首先来看文件读取机制:尽管DataNode实现了文件存储空间的水平扩展和多副本机制,但是针对单个具体文件的转载 2013-06-18 11:31:43 · 1227 阅读 · 0 评论 -
Hadoop资料汇总
http://tianhailong.com/hadoop-forums/topic/hadoop%E8%B5%84%E6%96%99%E6%B1%87%E6%80%BBHadoop视频汇总(陆续补充…….)——————–下载视频前,请好好读读下面的话———–我还是那个观点 我们的学习资料实在是太多了 大家没了解什么是hadoop 就盲目学习 而且还过分依赖视频 什么时转载 2013-06-08 10:08:21 · 949 阅读 · 0 评论 -
【hadoop视频】【2套】单个视频可以直接下载----方便下载
http://bbs.itheima.com/thread-52744-1-1.html目前找到的2套 hadoop 视频,【炼数成金-hadoop】【hadoop实战】讨厌TMD只放一两个视频吊人胃口的,本着黑马共享精神,为 hadoop 爱好者提供学习资料。就算TMD被封杀也要共享!!!这不是一个几个G的单独文件。可以直接下载一个视频,不用等个几转载 2013-06-16 23:49:53 · 1486 阅读 · 1 评论 -
Hadoop视频下载地址收藏
Hadoop实战:http://pan.baidu.com/share/link?shareid=354989&uk=1778669877hadoop视频教程下载:http://bbs.2cto.com/read.php?tid=295716&page=ehttp://pan.baidu.com/share/link?shareid=4981转载 2013-06-16 23:20:38 · 988 阅读 · 0 评论 -
Hadoop版本选择探讨
http://dongxicheng.org/mapreduce-nextgen/how-to-select-hadoop-versions/转载 2013-05-12 10:01:07 · 632 阅读 · 0 评论 -
hadoop-for-windows
http://dongxicheng.org/mapreduce/hadoop-for-windows/转载 2013-05-12 09:24:59 · 719 阅读 · 0 评论 -
10个Hadoop的应用场景
谁在用 Hadoop这是个问题。在大数据背景下,Apache Hadoop已经逐渐成为一种标签性,业界对于这一开源分布式技术的了解也在不断加深。但谁才是 Hadoop的最大用户呢?首先想到的当然是它的“发源地”,像Google这样的大型互联网搜索引擎,以及Yahoo专门的广告分析系统。也许你会认为, Hadoop平台发挥作用的领域是互联网行业,用来改善分析性能并提高扩展性。其实 Hadoop的应用转载 2013-05-19 23:01:05 · 812 阅读 · 0 评论 -
[Hadoop] 实际应用场景之 - 阿里
http://blog.youkuaiyun.com/u010415792/article/details/9151475Hadoop在淘宝和支付宝的应用从09年开始,用于对海量数据的离线处理,例如对日志的分析,也涉及内容部分,结构化数据等。使用Hadoop主要基于可扩展性的考虑,规模从当初的3-4百节点增长到今天单一集群3000节点以上,2-3个集群,支付宝的集群规模也达700台,使用H转载 2013-06-24 09:11:21 · 1007 阅读 · 0 评论 -
Hadoop Hbase 升级
Hadoop HDFS 与Hbase升级笔记由于之前使用了hadoop1.0.2,hbase 使用的是hbase-0.92.1 但是一次事故导致元数据丢失,且修复元数据的类本身有BUG 所以摆在眼前的只有两条路:1、修改hbase源码重新编译 hbase 修复BUG 2、升级到下一个版本,且这个版本已经修复了此BUG 从release node中看到 0.92.2及以后版本均修转载 2013-07-09 14:45:50 · 1037 阅读 · 0 评论 -
Required field 'serverProtocolVersion' is unset
java.sql.SQLException: Could not establish connection to jdbc:hive2://localhost:10000: Required field 'serverProtocolVersion' is unset! 测试live连接的时候出现上面的错误。package com.cn.whr.HiveTestJdbc;i...转载 2018-08-07 17:48:08 · 7398 阅读 · 2 评论 -
HBase各版本对JDK和Hadoop版本的支持情况(官方发布的)
http://hbase.apache.org/book.html#configuration Java support by release line HBase Version JDK 7 JDK 8 JDK 9 JDK 10 2.0 Not Supported yes Not Su...转载 2018-08-02 17:59:59 · 9472 阅读 · 0 评论 -
Hadoop版本选择
刚开始学习Hadoop时就曾经一直抱怨Hadoop的安装部署为什么这么麻烦,对于一个新手需要捯饬一天才能把分布式环境安装配置好。而对于一个自学Hadoop而周围又没人交流的菜鸟来说,我对Hadoop的理解一直停留在很肤浅的层面,能应用,但对内部的原理知之甚少。最近和一个做这方面的朋友聊天,他问我你学习Hadoop是用的什么版本搭建环境,我说Hadoop版本那么多我也记不太清了,他只是笑笑就没再多问...转载 2018-08-02 17:36:33 · 406 阅读 · 0 评论 -
ZooKeeper学习之路 (九)利用ZooKeeper搭建Hadoop的HA集群
https://www.cnblogs.com/qingyunzong/p/8634335.html 讨论QQ:1586558083目录Hadoop HA 原理概述 为什么会有 hadoop HA 机制呢? 那如何解决呢? 集群规划 集群服务器准备 集群安装 1、安装 Zookeeper 集群 2、安装 hadoop 集群 Hadoop HA集群的...转载 2018-07-26 09:48:29 · 600 阅读 · 0 评论 -
Memcached常用命令及使用说明
一、存储命令存储命令的格式:12 参数说明如下:set/add/replace查找关键字客户机使用它存储关于键值对的额外信息该数据的过期时间,0表转载 2014-04-12 20:14:24 · 703 阅读 · 0 评论 -
三种memcached的JAVA客户端比较
Memcached客户端程序Memcached的java客户端已经存在三种了:* 官方提供的基于传统阻塞io由Greg Whalin维护的客户端* DustinSallings实现的基于java nio的Spymemcached* XMemcached1. 三种API比较 1) memcached client forjava较早推转载 2014-04-12 20:13:38 · 707 阅读 · 0 评论 -
Memcached与Redis的性能对比
最近有个项目需要用no-sql数据库来保存大量的数据,插入和查询都比较频繁,相对而言查询更加频繁。是选择Memcached、还是Redis呢?对Memcached与Redis做个相关测试,就知道了。Memcached与Redis测试对比:1) 性能方面:相同的写入和读取数据次数,key为uuid, value为模拟的终端信息约600字节 单线程:转载 2014-04-12 20:12:11 · 2712 阅读 · 0 评论 -
Redis on Windows
Redis on Windows 是 Redis 在 Windows 下的原型版本,基于 Redis 2.4.11,支持 64 位 Windows。编译方法:使用 Visual Studio 10 打开 msvs\redisserver.sln 文件并进行构建构建成功后将在 msvs\$(Configuration) 目录下生成如下可执行文件:redis-server.ex转载 2014-02-27 22:03:09 · 926 阅读 · 0 评论 -
hadoop视频
http://pan.baidu.com/share/link?shareid=401307&uk=2365950612转载 2013-05-05 09:59:45 · 918 阅读 · 0 评论 -
【珍藏版】 2012Java开发工程师必备精品资料(115个)
Java应用广泛,涉及个人PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网等领域,同时拥有全球最大的开发者专业社群。小弟精心整理了115个精品资料,包括11个Java开发专题和104个热门资源。网上的资料众多,参差不齐,然而这批资料确实经过精心整理的,下载量高,好评众多。附件较多,无法将附件一一分享给大家,只能提供资料地址了。希望对大家有帮助!14个Java企业开发技术实训实验转载 2013-05-04 21:35:13 · 2551 阅读 · 1 评论 -
关于授时
http://ntp.buptnet.edu.cn/ntp_chinese/以前用公网的不知名 NTP Server ,一直很稳定。不过上次一次不稳导致一次重大事故,哎。。想都没想到会这个地方出问题,这种基础服务还是自己搞比较好。想做成只允许公司的服务器对时间。如果用ip段来划分会没效率而且会漏掉,想做成客户端用key的方式认证再同步时间的方式。查了些文档,自己总结转载 2013-03-21 16:36:29 · 812 阅读 · 0 评论 -
[博文精选] 怎样向妻子解释MapReduce
http://www.youkuaiyun.com/article/2011-08-26/303688摘要:印度Java程序员Shekhar Gulati在自己的博客发表了How I explained MapReduce to my Wife?一文,比较通俗地阐述了MapReduce的概念。译文如下,译者是伯乐在线的 黄慧谕 。 昨天,我在Xebia印度办公室发表了一个关于MapReduce的演转载 2013-03-21 13:22:08 · 784 阅读 · 0 评论 -
在Hadoop上运行SQL:程序员需知晓的13种数据工具
摘要:对SQL支持并不是Hadoop最核心的技术理念,但这一特性确实能帮助很多传统企业,尤其是已经明白下一代分析的重要性但又不想迈向MapReduce的企业,迅速走向大数据分析。为此,本文特别列举了13种从Hadoop内部可以运行SQL查询的,高水平、可用性程度很高的工具。在GigaOM安排Structure: Data的日程的时候,就意识到很有必要讨论在Hadoop上运行SQL查转载 2013-03-21 11:25:43 · 645 阅读 · 0 评论 -
那些年Google公开的大数据领域论文
摘要:Google于2004年公布了MapReduce论文,为数据领域工作者开启了大数据算法之门。然而Google的大数据脚步显然不止于此,其后公布了Percolator、Pregel、Dremel、Spanner等多篇论文。没有止步的不仅是Google,很多公司也跟随其脚步开发了很多优秀的产品,虽然其中不乏模仿。Mikio L. Braun柏林工业大学机器学习学博士后,TWIMPAC转载 2013-03-21 11:33:54 · 1116 阅读 · 0 评论 -
Apache Hadoop集群的安全性架构
摘要:HadoopSphere.com公布了一个可以适用于Apache Hadoop集群的安全性架构。虽然各家公司使用的工具可能有所不同,但是部署必不可少的“警卫”和检查,进而来保护Hadoop节点的安全性却都是至关重要的,文章列举了部署Apache Hadoop安全性架构的10个关键性组件。这么多年以来,一直有一个声音在“呼唤”健壮的Apache Hadoop安全性架构。考虑到这些节转载 2013-03-21 11:15:08 · 647 阅读 · 0 评论 -
十张图带你入门Map/Reduce
摘要:博主Aurelien,从13岁开始编程。曾在荷兰、比利时、法国、硅谷等多个国家从事网站开发,现效力于Terracotta公司。本篇文章来自Aurelien博客,用一个很简单的用例为初学者介绍了Map/Reduce的使用方法;希望为广大初学者带来帮助。你可能已经知道:Map/Reduce是一种模式,非常适合令人烦恼的并行算法。但是什么是令人烦恼的并行算法?答案:这个算法非常适合被多转载 2013-03-21 11:11:56 · 593 阅读 · 0 评论 -
下代MapReduce预览 节点数翻倍最大达10000
大数据革命正以Apache Hadoop为中心如火如荼的进行着。自从开源分布式数据处理平台在5年前发布时讨论之声就不绝于耳。在过去的一年中,Hadoop赢得了客户的认可,并得到众多商业化的支持以及众多数据库和数据集成软件商的整合。Hadoop可以管理结构化数据,以及诸如服务器日志文件和Web点击流的数据。同时还可以管理以非结构化文本为中心的数据,如Facebook和Twitter。这种处理转载 2013-03-21 11:05:11 · 814 阅读 · 1 评论 -
将OpenStack私有云部署到Hadoop MapReduce环境
摘要:随着企业开始同时利用云计算和大数据技术,现在应当考虑如何将这些工具结合使用。在这种情况下,企业将实现最佳的分析处理能力,同时利用私有云的快速弹性和单一租赁的特性。本文将帮助您了解云计算和大数据技术以及如何将OpenStack 私有云部署到Hadoop MapReduce环境。私有云简介私有云 指企业内部的云计算部署,在私有云中,企业利用了数据中心内的各种云计算技术的细微差转载 2013-03-21 11:20:07 · 884 阅读 · 0 评论 -
Windows 下配置 Eclipse 连接 Hadoop 开发环境
Windows 下配置 Eclipse 连接 Hadoop 开发环境个人小站,正在持续整理中,欢迎访问:http://shitouer.cn小站博文地址:Windows 下配置 Eclipse 连接 Hadoop 开发环境,欢迎原站访问~ 学习更多,请访问系列文章:1. VMware Redhat网络配置2. Hadoop 三台主机 集群搭建 详解3. Windo转载 2013-03-23 02:27:48 · 849 阅读 · 0 评论 -
Hadoop 三台主机 集群搭建 详解
Hadoop 三台主机 集群搭建 详解个人小站,正在持续整理中,欢迎访问:http://shitouer.cn小站博文地址:Hadoop 三台主机 集群搭建 详解,欢迎原站访问~ 学习更多,请访问系列文章:1. VMware Redhat网络配置2. Hadoop 三台主机 集群搭建 详解3. Windows 下配置 Eclipse 连接 Hadoop 开发环境转载 2013-03-23 02:28:37 · 802 阅读 · 0 评论 -
Hadoop+Hbase+ZooKeeper 安装配置及需要注意的事项
http://blog.youkuaiyun.com/franklysun/article/details/6443027本文重点讲解Hbase的安装、配置、问题解决关于hadoop和zookeeper的安装配置及相关问题,可以参考:hadoop:http://blog.youkuaiyun.com/FranklySun/archive/2011/05/13/6417984.aspx转载 2013-04-29 21:38:22 · 774 阅读 · 0 评论 -
Go语言资料收集
说明发布站点 GitHub 优快云 新浪最后更新 2012-03-31 Go1正式发布,更新相关资料,详见 变更记录缘起说明 想学习称手的新语言,发现Go后非常感兴趣,也把接触到的一些资料整理共享出来。 资料若有错误或缺漏,或者大家有更好的建议,欢迎 邮件联系 可看 已收集建议收集原则 尽量收集原创链接,有时会记录一些学习心得,或摘录一些启发自己的原文 如果同学们觉得内容转载 2013-05-04 22:38:31 · 2031 阅读 · 0 评论 -
90个JavaScript资料免费下载【合集】
为了方便大家学习,小弟最近整理了一批免积分下载的JavaScript,共90个,整理了这批资料的下载地址,大家可以根据自己的需要选择性下载。希望大家喜欢~ JS刷新页面【源码】http://down.51cto.com/data/45292667.成绩表排序(2)-CJ-JavaScript视频教程http://down.51cto.com/data/4转载 2013-05-04 21:35:44 · 1633 阅读 · 0 评论 -
Apache HBase™ 参考指南
http://hbase.apache.org/http://abloz.com/hbase/book.htmlhttp://archive.apache.org/dist/http://mirrors.cnnic.cn/apache/转载 2013-05-04 09:00:30 · 888 阅读 · 0 评论 -
hadoop资料汇总贴
一、 Hadoop快速入门分布式计算开源框架Hadoop_入门实践福布斯:Hadoop——你不得不了解的大数据工具 用 Hadoop 进行分布式数据处理---- 入门Hadoop入门一图解说Hadoop的发展历程讨论:Hadoop社区与中国云计算开源展望 用Hadoop进行分布式数据处理入门篇Hadoop入门简介hadoop入门语录 二、 Hadoop集转载 2013-05-03 23:39:52 · 1796 阅读 · 1 评论 -
Hadoop实战视频分享_2013年完整版学习视频种子下载
Hadoop实战视频分享_2013年完整版学习视频种子下载http://pan.baidu.com/share/link?shareid=354989&uk=1778669877本人有一套hadoop视频教程,30课时,结合三个实战项目,话不多说,先分享再说。 第一节:http://kuai.xunlei.com/d/xmBrDwIB-wAJ9-1Q017 第二节:转载 2013-05-03 14:41:46 · 13083 阅读 · 19 评论 -
hadoop、hbase、zookeeper环境搭建(详细)
一 机器192.168.0.203 hd203: hadoop namenode & hbase HMaster192.168.0.204 hd204: hadoop datanode & hbase HRegionServer & zookeeper192.168.0.205 hd205: hadoop datanode & hbase HRegionServer & zookeep转载 2013-04-29 21:31:37 · 1109 阅读 · 0 评论 -
Hadoop+HBase+ZooKeeper三者关系图
http://blog.youkuaiyun.com/zhaonanemail/article/details/6654558这里有几个主要关系:1.经过Map、Reduce运算后产生的结果看上去是被写入到HBase了,但是其实HBase中HLog和StoreFile中的文件在进行flush to disk操作时,这两个文件存储到了HDFS的DataNode中,HDFS才是永久存储。转载 2013-04-29 21:25:13 · 1262 阅读 · 0 评论