Hadoop【使用篇】10:【常见使用命令总结】Hadoop、Flume、Hive、Zookeeper、Hbase、Spark、Kafka、Redis、Flink

本文详细介绍了Hadoop生态系统的常用组件命令,包括Hadoop的启动、停止及日志查看,Flume的任务启动方式,Hive的连接与执行命令,Zookeeper的启动与连接,Hbase的操作,Spark的standalone和on Yarn模式,Kafka的管理,Redis的启动验证,Flink的standalone和on Yarn部署,以及Elasticsearch的启动验证。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Hadoop

(1)启动

start-all.sh

(2)停止

stop-all.sh

(3)查看进程

jps
jps -m
ps -ef |grep 进程名称

在这里插入图片描述

(4)查看History

1)启动historyserver进程
mapred --daemon start historyserver
2)开启日志聚合功能

vi yarn-site.xml 新增如下内容:

    <property> 
        <name>yarn.log-aggregation-enable</name>  
   
### 大数据平台搭建指南 #### 一、Docker容器基础 Docker是一种轻量级虚拟化技术,用于构建和运行应用程序的独立容器。通过使用Docker,可以快速部署Hadoop集群和其他大数据组件[^1]。 ```bash docker pull hadoop-base-image docker run -it --name hadoop-cluster hadoop-base-image /bin/bash ``` #### 二、Hadoop完全分布式安装配置 Hadoop是一个开源框架,支持大规模数据集的分布式存储和处理。以下是其基本配置步骤: 1. **环境准备** 安装Java JDK并设置`JAVA_HOME`环境变量。 2. **下载与解压Hadoop** 将Hadoop压缩包上传至服务器,并解压到指定目录。 3. **修改核心配置文件** 编辑`core-site.xml`, `hdfs-site.xml`, 和`yarn-site.xml`以适应分布式模式的需求[^2]。 4. **格式化NameNode** ```bash hdfs namenode -format ``` 5. **启动Hadoop服务** 使用脚本启动HDFS和YARN服务: ```bash start-dfs.sh && start-yarn.sh ``` #### 三、Hadoop高可用(HA) 为了提高系统的可靠性,可以通过ZooKeeper实现Hadoop NameNode的高可用性。主要涉及Active/Standby切换机制以及JournalNodes的日志同步功能。 #### 四、Spark on Yarn & Flink on Yarn 两者均作为强大的批处理引擎,在YARN上运行可充分利用资源调度优势。需调整相应参数来优化性能表现。 #### 五、其他常用工具介绍 - **Flume**: 日志收集系统,负责将日志流式写入Kafka或者直接进入HDFS。 - **Kafka**: 分布式的消息队列解决方案,适用于实时数据分析场景。 - **Hive**: 提供SQL接口访问底层HDFS上的结构化数据。 - **ClickHouse/Hudi**: 新兴OLAP数据库选项之一,适合复杂查询需求。 - **Redis/Memcached**: 高效缓存层,加速频繁读写的业务逻辑。 #### 六、离线&在线数据处理流程设计 对于批量作业采用MapReduce编程范式完成ETL过程;而对于低延迟要求则依赖Flink/Kafka Streaming API进行增量更新操作。 #### 七、机器学习实践案例分享 利用Scala编写自定义UDF函数扩展Spark SQL能力范围;借助Maven管理项目依赖关系并通过POM文件声明版本控制策略。针对特定领域问题选取合适的算法模型比如LR, RF等训练预测效果评估指标ACC/AUC等等。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

做一个有趣的人Zz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值