



附:2004-2006年间,Google陆续发表了Google File System、MapReduce和BigTable三篇革命性技术的文章,奠定了分布式系统理论基础。随后以这三项技术为核心的开源框架如雨后春笋般涌现出来,Apache基金会开发的分布式系统基础架构Hadoop便是其中之一。由于Hadoop能够在开发者不了解分布式底层细节的情况下,利用集群的计算和存储能力,对大量数据进行可靠、高效、可伸缩的分布式高速运算,成为了大数据分析时代驱动数据价值挖掘和变现炙手可热的技术之一。
本文以图文趣说的形式带大家了解大数据这段历史,从中可以看到大数据十余年的创新脉络,以及中国厂商在大数据创新浪潮中的努力。
2004年至2006年,Google的GoogleFileSystem、MapReduce和BigTable开创了分布式系统的新纪元。这些技术催生了Hadoop等开源框架,使得大数据分析得以高效进行。Hadoop允许开发者在不了解分布式系统底层细节的情况下,利用集群处理大规模数据,成为大数据时代的热门技术之一。本文以趣味方式回顾这段历史,展示中国厂商在大数据创新中的贡献。
770

被折叠的 条评论
为什么被折叠?



