
分布式存储
yindarui
这个作者很懒,什么都没留下…
展开
-
分布式存储学习——HDFS
简介 HDFS(Hadoop Distributed File System)是一种分布式文件系统,属于非结构化的分布式存储类型。其前身是GFS(Google File System),作为一款优秀的分布式文件系统,其集成了传统文件存储的优点,且具备很多创新的地方,是整个Hadoop生态默认的文件存储策略,非常值得学习。值得一提的是,很多大公司的文件系统都是从开源的HDFS中修改的企业版。 作为Hadoop生态圈的一个重要的成员,HDFS可以说是为了大数据存储和计算而设计的。作为一个分布式存储系统,原创 2020-11-14 17:13:59 · 634 阅读 · 0 评论 -
分布式入门——MapReduce数据处理框架(上)
MapReduce 简介 MapReduce是google于2004年提出的一种计算模型,用Matei(MIT分布式系统课程的讲师,强烈推荐)的话来说,MapReduce为编程人员提供了一个简单的接口,这个接口让他们可以像是在编写一般程序一样(当然你编写的程序必须符合MapReduce规定的编程规范),由MapReduce框架为整个任务进行划分、分发,在一个大型的商务集群中(MapReduce的初衷是这样的)运行你庞大计算量的任务,最后再由MapReduce收集你的计算结果,存储在文件系统中。原创 2020-11-09 20:06:58 · 1461 阅读 · 0 评论