自己分别用Java和Scala写了一个词频统计的例子,自己找了一个1000万的数据,然后模拟的是4个进程,读取的本地txt文件,然后统计两种语言的运行时间,做了十组对比,具体如下:
| 组数/语言 | Java语言(ms) | Scala语言(ms) |
| 1 | 18270 |
9070 |
| 2 | 17917 |
8476 |
| 3 | 17599 |
9297 |
| < |
通过对比Java和Scala实现的Spark词频统计程序,发现在处理1000万数据的4进程任务中,Scala的运行时间显著短于Java,显示出更优的性能。实验证明了在Spark中使用Scala的优势,不仅速度快,还能减少代码量。
自己分别用Java和Scala写了一个词频统计的例子,自己找了一个1000万的数据,然后模拟的是4个进程,读取的本地txt文件,然后统计两种语言的运行时间,做了十组对比,具体如下:
| 组数/语言 | Java语言(ms) | Scala语言(ms) |
| 1 | 18270 |
9070 |
| 2 | 17917 |
8476 |
| 3 | 17599 |
9297 |
| < |
1157
2825

被折叠的 条评论
为什么被折叠?