
Hadoop
没去过埃及的法老
偶尔更新
展开
-
HDFS常用方法 JAVA代码
获取指定路径所有文件public static void listStatus() throws Exception { //该类的对象封转了客户端或者服务器的配置 Configuration conf=new Configuration(); //该类的对象是一个文件系统对象 FileSystem hdfs=FileSystem.get(new URI...原创 2019-11-26 11:51:16 · 582 阅读 · 5 评论 -
SNameNode工作原理
介绍由于edits记录了集群运行期间所有对HDFS的相关操作,所以这个文件会很大。集群关闭后再次启动时会将Fsimage,edits加载到内存中,进行合并,恢复到集群的。由于edits文件很大所有,集群再次启动时会花费较长时间。为了加快集群的启动时间,所以使用secondarynameNode辅助NameNode合并Fsimage,editsfsimage与edits的合并时机取决于两个参数...原创 2019-11-07 17:15:49 · 745 阅读 · 2 评论 -
退役旧数据节点
1.创建dfs.hosts.exclude配置文件在指定目录下创建dfs.hosts.exclude文件,并添加需要退役的主机名称cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoopvim dfs.hosts.exclude2.编辑namenode所在机器的hdfs-site.xml编辑namenode所在的机器的hdfs-s...原创 2019-11-06 16:52:44 · 366 阅读 · 3 评论 -
HDFS新增节点
准备新节点将纯净的虚拟机复制一台出来,作为新的节点,并完成对应配置1.修改mac地址以及IP地址2.关闭防火墙,关闭selinux3.更改主机名4.更改主机名与IP地址映射5.生成公钥与私钥,并完成ssh免密登录6.安装jdk并配置环境7.配置Hadoop环境8.解压Hadoop安装包9.将主节点关于Hadoop的配置文件全部拷贝到当前节点2.创建dfs.hosts文件并...原创 2019-11-06 16:44:23 · 445 阅读 · 0 评论 -
HDFS数据写入流程
1. 建立通讯,检测是否可以上传client发起文件上传请求,通过RPC与NameNode建立通讯,NameNode检查目标文件是否已存在,父目录是否存在,返回是否可以上传RPC指的是远程过程调用。是集群中多个组件、多个模块进行数据通信的一 种方式。2 .请求block该传输到哪些位置client请求第一个block该传输到哪些DataNode服务器上3.获得block可以传...原创 2019-11-05 14:40:09 · 496 阅读 · 1 评论 -
HDFS数据读取流程
1.读取文件客户端通过调用FileSystem对象的open()来读取希望打开的文件。2. 发送请求,确定文件block所在的位置Client向NameNode发起RPC请求,来确定请求文件block所在的位置;RPC指的是远程过程调用。是集群中多个组件、多个模块进行数据通信的一种方式。3. 获取文件block所在的位置NameNode会视情况返回文件的部分或者全部bloc...原创 2019-11-04 21:08:05 · 463 阅读 · 0 评论