- 博客(2)
- 收藏
- 关注
原创 搭建Hadoop伪分布式
验证hdfs:可以登录浏览器地址:192.168.20.10:50070 (ip地址是master的地址)export JAVA_HOME=/opt/jdk #这里是opt目录。修改 hdfs-site.xml 将dfs.replication设置为1。在最后加上export JAVA_HOME=/opt/jdk。切换到spark安装目录的/sbin目录下启动spark集群。source /etc/profile使环境变量生效。修改文件yarn-site.xml。如果进入以下界面代表成功。
2024-04-25 17:26:17
659
2
原创 重生之我在湖科学大数据
Hadoop是一个开源的分布式计算平台,主要用于存储和处理大规模数据。它是基于Google的MapReduce和Google文件系统的设计思想而开发的。要学习Hadoop入门,你需要掌握以下几个基础概念和技术:1.HDFS(分布式文件系统)理解HDFS的基本架构和工作原理是学习Hadoop的第一步。HDFS主要用于存储大规模数据,并提供了高可靠性和高可扩展性。HDFS是整个hadoop体系的基础,负责数据的存储与管理。HDFS有着高。
2024-03-07 17:31:16
780
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅