
Hadoop
文章平均质量分 87
loftiest
这个作者很懒,什么都没留下…
展开
-
致那时那刻,所犯下的错——Hadoop错误集合
看日志(很重要) 日志在hadoop根目录下logs目录下,根据出错时间找到时间相符的文件cat DataNode未启动 删除core-site.xml中hadoop.tmp.dir指定的目录,集群机器全都删除,使用hdfs namenode -format重新格式化,再启动集群。 Namenode未启动 非高可用 删除core-site.xml中hadoop.tmp.dir指定的目录,集群机器全都删除,使用hdfs namenode -format重新格式化,再启动集群。 高可用 删除core-site.原创 2021-11-18 14:20:57 · 2877 阅读 · 0 评论 -
Hadoop--MapRecude入门
什么是MR MR是一个分布式运算程序的编程框架,核心功能是将用户编写的业务逻辑和自带默认组件整合为一个分布式运算程序,并发的运行在集群中。 MR的优点 易于编程 简单的实现一些接口,就可以完成一个分布式运算程序 良好的扩展性 资源不足时可以增加集群中的机器来增强运算能力 高容错性 当集群中的一台机器挂掉时,MR可以把上面的任务转移到其他机器上继续执行 适合PB/TB级的海量数据处理 MR的缺点 不擅长实时的计算 毫秒/秒级的运算 不擅长流式计算 动态的任务原创 2021-12-21 19:33:19 · 1063 阅读 · 0 评论 -
舍友的Hadoop环境搭建失败,为了让他能继续学习,我把他的虚拟机加入我的集群(跨电脑)bushi
k原创 2021-11-24 19:52:48 · 1938 阅读 · 0 评论 -
Hadoop--完全分布式
完全分布式 Hadoop 运行模式包括:本地模式、伪分布式模式以及完全分布式模式。 本地模式:单机运行,只是用来演示一下官方案例。生产环境不用。 伪分布式模式:也是单机运行,但是具备 Hadoop 集群的所有功能,一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试,生产环境不用。 完全分布式模式:多台服务器组成分布式环境。生产环境使用。 *完全分布式一般要扩展为HA完全分布式 虚拟机网络配置 配置虚拟机的NAT模式 在vm的编辑中找到虚拟网络编辑器,确定vmnet8的网络模式为NAT模式;设置一个子网,原创 2021-12-15 13:30:25 · 1700 阅读 · 0 评论