数据生成:
hadoop jar hadoop-mapreduce-examples-2.0.3-alpha.jar teragen 10000000 /liuqiang/terasort/1G/
排序:
hadoop jar hadoop-mapreduce-examples-2.0.3-alpha.jar terasort /liuqiang/terasort/1G/ /liuqiang/1G/output/
本文介绍使用 Hadoop 进行大规模数据生成及排序的具体步骤。通过 hadoop-mapreduce-examples 工具包,演示如何生成 1GB 的测试数据,并使用 TeraSort 对这些数据进行高效排序。
数据生成:
hadoop jar hadoop-mapreduce-examples-2.0.3-alpha.jar teragen 10000000 /liuqiang/terasort/1G/
排序:
hadoop jar hadoop-mapreduce-examples-2.0.3-alpha.jar terasort /liuqiang/terasort/1G/ /liuqiang/1G/output/
1558
861

被折叠的 条评论
为什么被折叠?