
Hadoop
文章平均质量分 72
hadoop相关
鸿12321
这个作者很懒,什么都没留下…
展开
-
mapreduce集成springboot使用
Data@Override@Override@Override@Override//将job.addCacheFile缓存里的字典拿出来转为map= null){@Override//将每一行数据拿出来切分@Override@Override@Override@Overridesum+=1;原创 2024-04-06 16:29:33 · 651 阅读 · 2 评论 -
hdfs集成springboot使用
1)方法1:通过将hdfs的两个配置文件(hdfs-site.xml、core-site.xml)放到resources文件夹下后,新建Configuration的时候设置为true会自动读取,也可以通过conf.set(“配置”,“值”)来修改配置项。11)递归查询目录所有文件信息,比listStatus多了文本大小,副本系数,块大小信息。3)创建文件夹并设置权限为文件所有者可读可写,文件所有组可读可写,其他人可读。10)输出所有列表所有文件和文件夹信息。13)查询文件块信息并跳转读取。原创 2024-03-29 01:55:15 · 846 阅读 · 1 评论 -
hadoop(3):搭建hadoop-HA
NameNode启动时,会去Zookpper里争抢一个锁,并设置一个通过事件机制设置回调事件,成功抢到的NameNode就是ActiveNameNode,其他的NameNode就是StandbyNameNode,如果ActiveNameNode故障,Zookpper会通过事件机制触发回调事件,通知ZKFC,告诉ZKFC需要转移ActiveNameNode,然后ZKFC会去看ActiveNameNode是否真的故障了,如果确认真的故障了,才会将StandbyNameNode变成ActiveNameNode。原创 2024-03-10 02:35:42 · 908 阅读 · 1 评论 -
hadoop(2):搭建hadoop完全分布式
日志保存的信息比较完全但恢复启动慢,镜像的恢复启动比较快但更新速度有限,所以要周期性地将日志的信息更新到镜像中,然后删除日志,最后使用镜像+日志进行NameNode的启动。:需要3台服务器节点,一台NameNode节点,两台DataNode节点,另外还需要一个SecondaryNameNode,可放在DataNode节点里。三个节点分别命名分别为master01,node01,node02,并配置对应ip,启动对应的节点服务。原创 2024-03-07 01:06:00 · 1691 阅读 · 1 评论 -
hadoop(1):搭建伪分布式
jdk8下载地址:https://www.oracle.com/java/technologies/downloads/#java8。下载地址:https://www.oracle.com/downloads/graalvm-downloads.html。5)可以通过http://192.168.132.101:50070查看hdfs管理页面,ip是对应服务器的ip。1)修改hadoop-env.sh文件,添加启动的java路径,分布式部署后,每个地方的java路径不一定相同。2)格式化namenode。原创 2024-03-02 11:58:09 · 283 阅读 · 1 评论