分布式 分步 + 并行处理 + 汇总结果 Hadoop分布式 一台计算机存储不了了,也计算不了了 Hadoop把多台计算机资源(存储资源:硬盘;计算资源:CPU,内存)连接在一起,形成集群 输入文件,拆分成块,多个节点存储 计算任务,拆分成小任务,多个节点并行计算,汇总结果