spark
文章平均质量分 51
Utopia_1919
最恨成仙难。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
RDD编程中的RDD连接(表连接)问题
在spark的rdd编程的时候,我们经常想做一些表连接的操作。 对rdd理解不深的时候我们可能会写出如下代码: val temp1 = sc.textFile("C://Users/802/Desktop/1.txt").map(_.split(",")).map(k => (k(0).toInt,k(1).toInt)) val temp2 = sc.textFile("C原创 2016-07-26 17:58:18 · 2018 阅读 · 0 评论 -
Spark读写S3(AWS亚马逊中国区beijing)
Spark读写S3(AWS亚马逊中国区)因为中国区的region相对于其他国家是隔离的,所以在中国使用亚马逊S3需要单另设置endpoint来指定地区。首先我们需要引入hadoop-2.7.2的lib中的hadoop-aws-2.7.2.jar,以及aws自己提供的sdk包:aws-java-sdk-1.7.4.jar使用2.7.2的原因是由于hadoop2.7.2才支持s3。接下来我们在程序中定义原创 2016-09-06 14:11:33 · 6658 阅读 · 1 评论 -
IDEA开发Spark提示failed to locate the winutils binary in the hadoop binary
今天整理电脑删了一些没用的东西,回过头开发spark的时候发现spark提示错误:16/09/06 17:20:43 ERROR Shell: Failed to locate the winutils binary in the hadoop binary pathjava.io.IOException: Could not locate executable D:\hadoop-2.6.4\b原创 2016-09-06 17:29:17 · 6513 阅读 · 0 评论
分享