MapReduce
Unauthorized_
是一个非常菜的小菜鸡orz
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大数据管理技术实习——MapReduce之WordCount(去标点符号)
大数据管理技术实习——MapReduce 文章目录大数据管理技术实习——MapReduce要求:基础代码1.map部分2.Reduce部分改进代码运行过程(命令行shell相关)1.开启hdfs2.初始化/格式化(以前的输入输出 没有可略过)3.打包jar4.运行程序5.部分bug5.1 HDFS Corrupt block5.2 正则表达式中的“-”问题5.3 retry policy is...5.4 SLF4J: Class path contains multiple SLF4J bindings.原创 2020-07-18 22:18:44 · 2961 阅读 · 1 评论 -
大数据管理技术实习二——PageRank
文章目录大数据管理技术实习二——PageRank实验目的编程思路实验步骤注意事项 大数据管理技术实习二——PageRank 实验目的 本实验为Map Reduce小组作业实习一项目,目的为给定风筝网络图为输入时实现PageRank算法,算出该图的值分布。 编程思路 参考:https://blog.youkuaiyun.com/u010414589/article/details/51404971 输入与输出: 将给定网络图转化为文档,其中格式为: node_name_i pagerank_i i_link_1 i_原创 2020-07-24 16:58:33 · 394 阅读 · 0 评论
分享