跟师傅xugg经过一个多月的努力,在基于erlang的mapreduce框架下面排序终于有了点小成果.
先上结果:
10M数据排序6s
200M数据排序111s.
注:以耗时(从SDFS上读取数据,排完序,写回SDFS).
测试环境:
master:centos 6 / 2G内存 /Pentium(R) Dual-Core CPU E6600 @ 3.06GHz
slave1:centos 6 / 2G内存 /Pentium(R) Dual-Core CPU E6600 @ 3.06GHz
slave2:centos 6 / 2G内存 /Pentium(R) Dual-Core CPU E6600 @ 3.06GHz
目前才排到200M,距离1TB还很遥远啊,继续努力!
以上做个记录留作纪念.

通过一个多月的努力,在基于Erlang的MapReduce框架下实现了数据排序优化,10M数据可在6秒内完成排序,200M数据排序耗时111秒。测试环境采用CentOS 6系统及Pentium Dual-Core E6600 CPU。
708

被折叠的 条评论
为什么被折叠?



