
spark
文章平均质量分 87
TheManOfCoding
计算机java初级程序员,正在往大数据方向转型!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark on Yarn的运行原理
一、YARN是集群的资源管理系统1、ResourceManager:负责整个集群的资源管理和分配。2、ApplicationMaster:YARN中每个Application对应一个AM进程,负责与RM协商获取资源,获取资源后告诉NodeManager为其分配并启动Container。3、NodeManager:每个节点的资源和任务管理器,负责启动/停止Container,并监视资源使用情况。4、...转载 2018-03-23 10:23:36 · 409 阅读 · 0 评论 -
spark submit参数及调优
park submit参数介绍你可以通过spark-submit --help或者spark-shell --help来查看这些参数。使用格式: ./bin/spark-submit \ --class <main-class> \ --master <master-url> \ --deploy-mode <deploy-mode> \ --conf ...转载 2018-03-27 10:39:18 · 280 阅读 · 0 评论 -
将DataFrame数据如何写入到Hive表中
1.将DataFrame数据如何写入到Hive表中?2.通过那个API实现创建spark临时表?3.如何将DataFrame数据写入hive指定数据表的分区中?从spark1.2 到spark1.3,spark SQL中的SchemaRDD变为了DataFrame,DataFrame相对于SchemaRDD有了较大改变,同时提供了更多好用且方便的API。DataFrame将数据写入hive中时,默...转载 2018-06-28 11:02:36 · 8304 阅读 · 0 评论 -
执行spark sql 遇到的问题
运行环境:用图形更直观点。在 spark cluster 和 yarn cluster 两种方式运行spark sql, 操作hive中的数据,另外,hive 是独立的,可以直接运行hive处理数据。spark sql的程序比较好写,直接看spark的example的例子HiveFromSpark ,很容易理解首先,在spark cluster上运行:将hive的 hive-site.xml ...转载 2018-06-28 22:09:23 · 2668 阅读 · 0 评论 -
Spark SQL读取hive数据时报找不到mysql驱动
Exception:Caused by: org.datanucleus.exceptions.NucleusException: Attempt to invoke the "BoneCP" plugin to create a ConnectionPool gave an error : The specified datastore driver ("com.mysql.jdbc.Drive...转载 2018-06-28 22:49:10 · 527 阅读 · 0 评论 -
spark遇到的一些坑
1.spark的cluster模式参数问题spark-submit \--master yarn \--deploy-mode cluster \--class com.zctt.bigdata.Education \--name cluster_test3 \--executor-memory 5g \--driver-memory 5g \--executor-cores 4...原创 2018-11-26 10:28:44 · 544 阅读 · 0 评论 -
Error while instantiating 'org.apache.spark.sql.hive.HiveSessionState'
我在windows下面用idea运行spark-sql程序的时候,报了上面的那个错误,我尝试了很多方法,都没有啥效果,后来我往下继续阅读错误,发现了这个实质性错误Exception in thread "main"java.lang.UnsatisfiedLinkError。如果是报Error while instantiating 'org.apache.spark.sql.hive.Hiv...原创 2019-08-10 13:26:07 · 9940 阅读 · 3 评论