配置hadoop伪分布式模式

本文详细介绍了Hadoop集群的配置过程,包括core-site.xml、hdfs-site.xml和yarn-site.xml的修改要点,如文件系统访问地址、副本数、shuffle功能、日志聚集功能等关键参数的设置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.修改core-site.xml添加:

文件系统访问地址,其中vv.com在etc/hosts中配置

<property>

<name>fs.defaultFS</name>

<value>hdfs://vv.com:8020</value>

</property>

为分布式文件系统访问路径

<property>

<name>hadoop.tmp.dir</name>

<!-- 伪分布配置路径 -->

<value>/opt/cdh/hadoop-2.5.0-cdh5.3.6/data/tmp</value>

</property>

 

2.修改hdfs-site.xml:

<!--配置副本数,为文件在hdfs中存储的份数,默认为3-->

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

配置namenode访问的http路径

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>vv.com:50090</value>

</property>

 

 

3. 配置yarn-site.xml:

//启用mapreducer 的shuffle 功能 

<property>

<name>yarn.nodemanager.aux-services </name>

<value>mapreduce_shuffle</value>

</property>

 

指定yarn服务器的IP 0.0.0.0为自己 最好不要设置为0.0.0.0 应该设置为hosts里面配置的别名

<property>

<name>yarn.resourcemanager.hostname</name>

<value>0.0.0.0</value>

</property>

 

是否启用日志聚集功能。默认是false不启动

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

 

在HDFS上聚集的日志最多保存多长时间。默认是-1不保存

<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>640800</value>

</property>

 

 

 

 

 

内容概要:本文深入探讨了Kotlin语言在函数式编程和跨平台开发方面的特性和优势,结合详细的代码案例,展示了Kotlin的核心技巧和应用场景。文章首先介绍了高阶函数和Lambda表达式的使用,解释了它们如何简化集合操作和回调函数处理。接着,详细讲解了Kotlin Multiplatform(KMP)的实现方式,包括共享模块的创建和平台特定模块的配置,展示了如何通过共享业务逻辑代码提高开发效率。最后,文章总结了Kotlin在Android开发、跨平台移动开发、后端开发和Web开发中的应用场景,并展望了其未来发展趋势,指出Kotlin将继续在函数式编程和跨平台开发领域不断完善和发展。; 适合人群:对函数式编程和跨平台开发感兴趣的开发者,尤其是有一定编程基础的Kotlin初学者和中级开发者。; 使用场景及目标:①理解Kotlin中高阶函数和Lambda表达式的使用方法及其在实际开发中的应用场景;②掌握Kotlin Multiplatform的实现方式,能够在多个平台上共享业务逻辑代码,提高开发效率;③了解Kotlin在不同开发领域的应用场景,为选择合适的技术栈提供参考。; 其他说明:本文不仅提供了理论知识,还结合了大量代码案例,帮助读者更好地理解和实践Kotlin的函数式编程特性和跨平台开发能力。建议读者在学习过程中动手实践代码案例,以加深理解和掌握。
Hadoop伪分布式模式是在一台机器上模拟分布式环境,使得开发人员可以在单个机器上完成Hadoop程序的开发和测试。下面是Hadoop伪分布式模式配置过程: 1. 安装Java和Hadoop:首先需要安装Java和Hadoop。Java的版本需要与Hadoop版本匹配。安装完成后,需要设置JAVA_HOME和HADOOP_HOME环境变量。 2. 修改配置文件:Hadoop伪分布式模式需要修改以下配置文件: - core-site.xml:配置Hadoop的核心参数,如文件系统、端口等。 - hdfs-site.xml:配置Hadoop分布式文件系统的参数,如副本数量、块大小等。 - mapred-site.xml:配置Hadoop的MapReduce参数,如任务最大尝试次数、任务跟踪器等。 - yarn-site.xml:配置Hadoop的YARN参数,如节点管理器、资源管理器等。 3. 创建HDFS目录:在Hadoop伪分布式模式中,需要手动创建HDFS目录。可以使用以下命令创建目录: ``` hdfs dfs -mkdir /user hdfs dfs -mkdir /user/<用户名> ``` 4. 启动Hadoop:使用以下命令启动Hadoop: ``` start-dfs.sh start-yarn.sh ``` 5. 验证Hadoop:使用以下命令验证Hadoop是否正常运行: ``` jps ``` 如果输出中包含ResourceManager、NodeManager、DataNode、NameNode等进程,则说明Hadoop已经成功启动。 6. 运行Hadoop程序:在Hadoop伪分布式模式下,可以使用以下命令运行程序: ``` hadoop jar <程序.jar> <输入路径> <输出路径> ``` 以上就是Hadoop伪分布式模式配置过程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值