大数据 Hive spark Flink 关系
大数据分为离线和实时数据Hive仅是离线数据sparkStreaming 和 Flink 是实时数据工具spark衍生出各种工具,其核心是mr的优化Hive(核心功能:SQL=>Spark、对象(databases,table,column/type)) SQL => MapReduce/sparkHDFSMySQL(MR 和 Spark比较) MR 有优势 =>稳定 spark =>内存计算(贵) Hadoop(HDFS Yarn MapReduc.
原创
2021-04-27 11:27:49 ·
3237 阅读 ·
0 评论