
2021软件工程应用与实践
文章平均质量分 90
码农小菜鸡ya
这个作者很懒,什么都没留下…
展开
-
2021SC@SDUSC hadoop源码分析(六)
2021SC@SDUSC本次我将对tools中的DisCp Guide进行分析DistCp概念DistCp(分布式拷贝)是一种用于大型集群间/集群内拷贝的工具。它使用MapReduce来实现其分发、错误处理和恢复以及报告。它将文件和目录列表展开为映射任务的输入,每个任务将复制源列表中指定文件的一个分区。使用DistCp最常见的调用是集群间复制:bash$ hadoop distcp hdfs://nn1:8020/foo/bar \hdfs://nn2:8020/bar/fo原创 2021-11-07 19:06:34 · 265 阅读 · 0 评论 -
2021SC@SDUSC hadoop源码分析(一) 项目综述
2021SC@SDUSC hadoop是一个分布式系统基础架构,它可以使用户在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。hadoop的框架最核心的设计就是HDFS和MapReduce,HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。在Hadoop中HDFS和MapReduce是同一个项目,Hadoop中包的依赖关系十分复杂,分布式文件系统的底层的实现,依赖于某些类似高层的功能一.下载hadoop源码并编译1.下载ha.原创 2021-09-30 13:29:50 · 162 阅读 · 0 评论