- 博客(5)
- 收藏
- 关注
原创 认识Hadoop
Hadoop由Apache基金会开发, 开源的、可靠的 、可拓展的、用于分布式计算 的分布式系统基础架构或框架。MapReduce是Hadoop的核心计算框架——是用于大规模数据集(大于1TB)并行运算的编程模型,主要包括Map(映射)和Reduce(规约)两个阶段。MapReduce的核心思想是——当启动一个MapReduce任务时,Map端将会读取HDFS上的数据,将数据映射成所需要的键值对类型并传至Reduce端。
2024-05-03 22:31:52
2257
10
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人