
Hadoop
Hadoop学习
静听山水
Just do it
展开
-
基于ECS实例搭建Hadoop环境
环境搭建:【ECS生长万物之开源】基于ECS实例搭建Hadoop环境-阿里云开发者社区原创 2024-11-08 09:14:09 · 503 阅读 · 0 评论 -
2023版最新最强大数据面试宝典
2023版最新最强大数据面试宝典转载 2024-10-07 22:39:55 · 57 阅读 · 0 评论 -
大数据要求
熟悉业界主流大数据平台数据架构、技术架构、业务架构、以及海量数据采集与集中技术是一个综合性的要求,涵盖了大数据领域的多个方面。转载 2024-09-28 14:05:30 · 156 阅读 · 0 评论 -
YARN介绍
1、YARN简介2、YRAN基本架构3、YARN高可用4、Yarn调度策略5、Yarn运维与监控转载 2024-09-04 11:26:11 · 81 阅读 · 0 评论 -
HDFS介绍
转载 2024-09-03 23:58:01 · 80 阅读 · 0 评论 -
Python 操作大数据使用 Hadoop
参考:https://blog.youkuaiyun.com/wuShiJingZuo/article/details/135620018。原创 2024-09-03 11:30:22 · 483 阅读 · 0 评论 -
Hadoop常用命令
【代码】Hadoop常用命令。原创 2024-08-29 22:30:58 · 468 阅读 · 0 评论 -
Hadoop报错:Permission denied: user=dr.who, access=WRITE xxxx
修改:core_site.xml。转载 2024-09-02 14:26:48 · 223 阅读 · 0 评论 -
Hadoop介绍
转载 2024-08-31 21:46:55 · 206 阅读 · 0 评论 -
mac安装hadoop
2】hadoop的文件配置比较多,注意理解 路径、端口的配置(网上的不一定适合自己的电脑环境,需要多尝试);3】中间会遇到一些包未安装的情况,可直接安装,如果最后还是有问题,基本都出在配置文件;1】jdk和hadoop的版本需要兼容,建议jdk选择1.8 版本;(可参考流程、具体配置需要自己摸索设置)原创 2024-08-31 07:16:53 · 593 阅读 · 0 评论 -
hadoop常用地址
java:"/opt/homebrew/Cellar/openjdk/22.0.1/libexec/openjdk.jdk/Contents/Home"原创 2024-08-30 01:36:04 · 428 阅读 · 0 评论 -
hadoop日志文件
路径:/opt/homebrew/Cellar/hadoop/3.4.0/libexec/logs从你提供的输出信息来看,你正在查看 Hadoop 的日志文件目录 (logs目录)。这里列出了 Hadoop 各个组件的日志文件。原创 2024-08-30 01:29:11 · 660 阅读 · 0 评论 -
YARN ResourceManager 的 Web 界面
上述显示的是Hadoop YARN的Web界面,具体来说是“所有应用程序”页面。这个页面提供了关于Hadoop集群的详细信息,包括集群度量节点度量和调度器度量。原创 2024-08-30 01:14:59 · 777 阅读 · 0 评论 -
NameNode 的 Web 界面
这些选项允许用户访问Hadoop集群的不同方面,以便监控和管理集群的状态和性能。图片显示的是Hadoop的Web界面导航栏。对于Utilities的下拉菜单。功能,帮助用户监控和优化集群的性能和稳定性。这些工具选项提供了对Hadoop集群的。原创 2024-08-30 01:13:54 · 650 阅读 · 0 评论 -
hadoop配置文件
Hadoop 的配置文件对于正确设置和运行 Hadoop 集群至关重要。它们定义了集群的各个方面,包括文件系统的配置、资源管理器的配置、MapReduce 的配置等。确保这些文件正确配置对于集群的稳定运行非常重要。如果你需要进一步的帮助或有关于具体配置的问题,请随时提问!原创 2024-08-29 22:46:51 · 1006 阅读 · 0 评论 -
hadoop的sbin
Hadoop 的sbin目录下包含了一系列 shell 脚本,用于启动、停止和管理 Hadoop 的各个组件和服务。原创 2024-08-29 22:36:17 · 1355 阅读 · 0 评论 -
Hadoop组件
Pig、Hive和Mahout等工具则提供了更高层次的功能,使开发者更容易利用Hadoop的强大功能。Hive:一个数据仓库工具,可将结构化的数据文件映射为一张数据库表,并提供SQL样式的查询能力。Map/Reduce:Hadoop的核心计算模型,将大任务分解为小任务并在集群上的多台计算机上并行运行。HDFS(Hadoop Distributed File System):Hadoop的分布式文件系统,设计用来存储非常大的文件,具有高容错性和高吞吐量的特点。的大数据处理框架,由。原创 2024-08-29 18:12:59 · 854 阅读 · 0 评论 -
DataNode 和 NameNode
NameNode是 HDFS 的核心管理和控制中心,负责维护文件系统的元数据和命名空间信息。DataNode负责存储实际的数据块,并响应客户端的读写请求。这种设计使得 HDFS 能够在大量廉价硬件上构建大规模的分布式文件系统,同时保持数据的可靠性和高可用性。原创 2024-08-27 21:35:38 · 1005 阅读 · 0 评论 -
Spark on YARN
Spark 在 YARN 上运行是一种常见的部署方式,特别是在企业环境中。这种方式充分利用了 YARN 的资源管理和调度能力,同时让 Spark 应用程序能够高效地运行在 Hadoop 集群上。如果你需要进一步的帮助或有关于具体配置的问题,请随时提问!原创 2024-08-27 21:09:18 · 1187 阅读 · 0 评论 -
JPS查看进程
Apache Hadoop YARN (Yet Another Resource Negotiator) 的核心组件之一。这些进程的存在表明你的 Hadoop 集群正在运行,并且各个组件都在正常工作。如果你需要停止集群,你可以使用。Hadoop 分布式文件系统 (HDFS) 的工作节点。如果想单独停止某个进程,可以使用。整个集群中的资源(如 CPU 和内存)命令终止相应的进程 ID。命令列出了当前运行的。远程 JDBC 服务器。原创 2024-08-27 20:34:11 · 634 阅读 · 0 评论