spark读取外部配置文件

最新推荐文章于 2024-08-12 02:59:53 发布

原创最新推荐文章于 2024-08-12 02:59:53 发布 · 1.2k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#spark #spark读取配置文件

spark 专栏收录该内容

8 篇文章

订阅专栏

本文介绍如何在Spark程序中使用properties或YAML文件进行配置参数管理，通过实例演示了从YAML文件读取配置并应用于Spark程序的方法，解决实际部署中遇到的路径问题。

配置参数可以写在项目中的properties.xml中也可以在spark-submit上面写上你的配置参数，如果配置参数足够多，写到spark-submit后面很麻烦可以把这些配置参数写到一个文件中，直接读取配置文件获取配置。
建一个property.yml，配置如下

es.nodes: 127.0.0.1
es.port: 9356

spark程序如下

 def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("justForTry")
    val sc = new SparkContext(conf)
   // val session = SparkSession.builder().config(conf).getOrCreate()
    val props = new Properties();
    props.load(new FileInputStream("property.yml"));
    val nodes = props.getProperty("es.nodes");
    val port = props.getProperty("es.port");

  println(nodes+"--"+port)
  sc.stop()
  }

将配置文件放到你的服务器上，提交命令

spark-submit --master yarn --deploy-mode cluster --class readFile --files /root/property.yml Monkey-1.0-SNAPSHOT.jar

中间遇到的问题：我在root目录下执行的。jar包和配置文件也在root下，结果–files 时候我直接写property.yml 发现报错说找不到这个文件，后来我改成/root/property.yml 就可以了。一定要把路径写完整

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

怎么全部重名了

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Spark(scala)动态读取properties配置文件

hyj

02-14

2426

目录 1、在项目中先新建一个properties配置文件 2、编写动态加载属性的util类 3、疑问点 1、在项目中先新建一个properties配置文件 2、编写动态加载属性的util类 import java.io.FileInputStream import java.util.Properties object LoadParameter { //动态获取prop...

【spark基础】之client模式下--conf读取外部文件

珉辰大数据

06-27

1068

本文以spark on yarn下的client为例进行说明

参与评论您还未登录，请先登录后发表或查看评论

spark配置文件

09-23

官网下载的源码，需要进行相应配置才能运行

spark从外部获取参数

weixin_35926446的博客

08-12

183

Spark从外部获取参数的实现指南在大数据分析和处理的过程中，我们经常需要根据外部的输入参数来控制Spark应用的行为。此文将为刚入行的小白详细说明如何实现Spark从外部获取参数的流程与具体代码实现。整体流程我们可以将整个过程分为四个主要步骤，如下表所示：步骤描述 1 创建一个Spark应用 ...

Spark加载外部配置文件

热门推荐

guohecang的博客

08-02

3万+

Spark中addFile加载配置文件 我们在使用Spark的时候有时候需要将一些数据分发到计算节点中。一种方法是将这些文件上传到HDFS上，然后计算节点从HDFS上获取这些数据。当然我们也可以使用addFile函数来分发这些文件。注意，如果是spark程序通过yarn集群上加载配置文件，path必须是集群hdfs的绝对路径，如：viewfs://58-cluster//home/hdp_lbg_supin/resultdata/zhaopin/recommend/config/redis.p

Spark读取配置文件的探究

xiongyi111222的博客

06-18

732

在Cluster模式下进行SparkStreaming整合kafka时有个小需求，就是需要在KafkaUtils.createDirectStream 之前通过--files上传的配置文件来获取topic，之前在Executor中直接使用SparkFiles.get(文件名)就可以得到配置文件，可是现在SparkFiles.get要写在Dirver中，就会报FileNotFound的错误，这是为什么呢? 通过分别打印Executor中和Dirver中SparkFiles.get(文件名)的地址发现，二者不同

Spark 读取外部配置文件（各种提交模式、使用 typesafe.config）

空藍性忘的博客

11-26

4559

Spark 读取外部配置文件（各种提交模式、使用 typesafe.config） 1.使用 typesafe.config 读取外部配置文件 使用 com.typesafe.config 的方式 STEP1.导入 typesafe 依赖 <dependency> <groupId>com.typesafe</groupId> <artifactId>config</artifactId> <version>R

spark on yarn-cluster在生产环境部署 spark 任务，同时支持读取外部可配置化文件

u012447842的博客

09-29

1618

spark on yarn-cluster在生产环境部署读取外部可配置化文件

Spark Streaming 动态读取配置

qq_36998916的博客

03-17

758

Spark Streaming 动态读取配置为什么要动态读取配置? 在Spark 流式计算业务中, 比如通常复杂事件处理 (CEP) 的规则或者黑白名单一些配置数据. 当application 在运行期间读取相应的配置文件, 这个时候当这些名单发生改变时, 怎样能让application 动态的获取配置. 目前一般采用采用两种实现方式: 轮询拉取方式，即作业算子定时或其他方式检测在外部系统的配置是否有变更，若有则同步配置。控制流方式，即作业除了用于计算的一个或多个普通数据流以外，还有提供一个用

Spark通过读取配置文件连接数据库 java.lang.NullPointerException报错

m0_47135938的博客

05-31

591

先说答案：新版的IDEA要将配置文件放入resources目录下运行前确保已经打开了虚拟机连上了数据库运行结果： -----------------------------------分割线-------------------------------------- 用jdbc连接MySql数据库通常是这样写的 val conn: Connection = DriverManager.getConnection( "jdbc:mysql://node01:3306/product?

Spark_Spark on YARN 提交配置文件，读取配置文件

迎难而上

11-09

4292

Spark ON YARN 的官方文档，基于Spark 2.1.1 http://spark.apache.org/docs/2.1.1/running-on-yarn.html To use a custom log4j configuration for the application master or executors, here are the options: upl...

spark使用外部配置文件yarn cluster模式提交sparkstructedstreaming任务，解决流式日志过大问题

LZX的博客

02-15

1321

spark 提交脚本： nohup /opt/soft/spark3/bin/spark-submit \ --master yarn \ --deploy-mode cluster \ --driver-memory 1g \ --num-executors 3 \ --total-executor-cores 2 \ --executor-memory 2g \ --queue spark \ --conf spark.eventLog.enabled=false \ --conf spark.dri

【Spark】SparkStreaming-加载外部配置文件

weixin_34218890的博客

01-11

815

SparkStreaming-加载外部配置文件 spark加载配置文件_百度搜索Spark加载外部配置文件 - 优快云博客spark读取配置文件中的配置 - 优快云博客spark加载properties配置文件方法 - u013013024的博客 - 优快云博客Spark 官方文档（4）——Configuration配置 - bigbigtree - 博客园Spark三种属性配置方式详细说...

Spark 读取多套环境的配置文件数据

liuwei0376的专栏

07-09

803

思路一通过jvm 参数传入环境信息, 并根据环境信息, 拼接出适配该环境的配置文件. . -Dactive_env=test -DXss=100m 1.1 工具类清单 import com.typesafe.config.{Config, ConfigFactory} /** * 项目环境对应的配置信息获取工具类 */ object ConfigTools { /** * 获取用户自定义的jvm环境配置参数 * * test环境: -Dactive_env=test

spark读取外部配置文件的方法

weixin_30588827的博客

10-18

1437

spark读取外部配置文件的方法 spark-submit --files /tmp/fileName /tmp/test.jar 使用spark提交时使用--files参数,spark会将将本地的文件上传的hdfs,然后分发给每个executor 在程序中只需要使用文件名获取数据 val filePath ="fileName" val props...

spark读取文件注意事项

ADCadc123456789的博客

02-08

364

local模式下默认就是读取本地文件，在standlone或者yarn-client,或者cluster模式下默认读的都是hdfs文件系统 local: 文件路径写法： 1. linux 上写法 var localPath= sc.textFile("file:///usr/test_file/test.json") // 读取本地本地系统文件需要注意文件路径必须是全路径 // 所有的集群节点上相同的path下上传该文件 2.windows 上写法 var windowsLocalPath= .

spark环境创建

qq_34772375的博客

07-13

217

spark版本2.3.0 创建获取session环境要想操作spark集群，必须获取相应的session环境，具体的spark基本概念见spark技术原理透视在spark中获取 session环境的方法比较简单，代码相对固定 private val conf = new SparkConf().setMaster("local")//.set("spark.num.executors","3").set("spark.executor.cores","1") private val sessi

java读取yml文件属性_java工具类11-读取yml配置文件

weixin_35785186的博客

02-25

870

import com.alibaba.fastjson.JSON;import com..common.ProjectConfig;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.util.HashMap;import java.util.Map;...

spark 配置文件

最新发布

06-05