
spark
mas2005
数据挖掘
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark运行出现的错误案例
1.错误描述:org.apache.spark.SparkException: Only one SparkContext may be running in this JVM (see SPARK-2243). To ignore this error, set spark.driver.allowMultipleContexts = true. The currently running ...原创 2018-07-21 16:06:31 · 2790 阅读 · 1 评论 -
用IntelliJ IDEA :park和hive整合编写代码实现
代码:package sparksql_hiveimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.sql.hive.HiveContextobject test { def main(args: Array[String]): Unit = { System.setProp...原创 2018-07-30 21:43:25 · 913 阅读 · 0 评论 -
NBA之spark-hive解析答案
这里的两份数据是NBA 2017-2018赛季 的比赛结果nba_game.csv和比赛详情nba_game_detail.csv关于NBA,需要了解一个背景知识: NBA总共有30支球队 NBA的每支球队在每个赛季的常规赛,都会有82场比赛 NBA的每支球队在赛季初都会有场次不等的季前赛,但是按照时间的先后顺序排序之后,最后的82场比赛是常规赛,其余的都是季前赛 ...原创 2018-07-30 21:42:59 · 2213 阅读 · 1 评论 -
大数据编程犯的错误系列
1.两个路径的区别1) /home/cry/zookeeper.out 这个路径,在spark编程中,系统会认为是在从进群取这个文件。相当于这个路径:hdfs://bd1803/home/cry/zookeeper.out 2) file:///home/cry/zookeeper.out 这个路径是从本地中取出文件。本地可以理解为:windows 和linux,看编写代码的...原创 2018-07-30 20:29:56 · 878 阅读 · 0 评论 -
并发架构
画了一张目前公司刚设计的基础图,热点并发情况下的架构图原创 2019-07-09 11:44:03 · 318 阅读 · 0 评论