上面这张思维导图喜欢就拿走,2021年,决定写大数据了。
文章目录
@Author:Runsen
大数据常用技术词汇
未来的竞争,是数据之争。大数据本质上是Hadoop的生态群,下面是常用技术词汇
- ETL:代表提取、转换和加载。
- Hadoop:分布式系统基础架构
- HDFS:分布式文件系统
- HBase:大数据的NoSQL数据库
- Hive:数据仓库工具
- DAG :第二代计算引擎
- Spark:第三代数据处理引擎
- Flink:第四代数据处理引擎
- MapReduce: 最初的并行计算框架
- Sqoop:nosql数据库和传统数据库之间传输数据的工具
- Hive:数据仓库工具
- Storm:分布式实时计算系统
- Flume:分布式的海量日志采集系统。
- Kafka:分布式发布订阅