Spark设置日志打印级别

皮皮虾的倔强

已于 2023-08-25 16:27:31 修改

阅读量1.5k

点赞数

CC 4.0 BY-SA版权

文章标签： spark 大数据分布式

于 2023-08-25 15:58:03 首次发布

本文链接：https://blog.youkuaiyun.com/Wolves_howl/article/details/132497099

本文介绍了如何在Spark中修改默认的日志级别，包括全局配置（修改log4j.properties），以及在JavaSparkContext和Maven项目中设置特定日志打印级别。重点在于如何使日志输出更专注于错误级别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、修改Spark-core包默认的日志级别

spark中提供了log4j的方式记录日志。可以在$SPARK_HOME/conf/下，将 log4j.properties.template 文件copy为 log4j.properties 来启用log4j配置。但这个配置为全局配置，不能单独配置某个job的运行日志。Spark-core包设置默认的日志级别为info。将文件中的log4j.rootCategory=INFO, console修改为log4j.rootCategory=ERROR, console即可，如下图所示：
在这里插入图片描述
此时，在控制台调试spark程序就没有了INFO信息。

二、在Spark程序中设置日志打印级别：

        JavaSparkContext sc = new JavaSparkContext(conf);
        //设置日志输出级别
		sc.setLogLevel("ERROR");
		JavaRDD<String> lines = sc.textFile("input.txt");

三、在maven项目中设置Spark程序的日志打印级别：

引入logger4j和slf4j的依赖

        <dependency>
            <groupId>log4j</groupId>
            <artifactId>log4j</artifactId>
            <version>1.2.17</version>
        </dependency>
        <dependency>
            <groupId>org.slf4j</groupId>
            <artifactId>slf4j-api</artifactId>
            <version>1.7.21</version>
        </dependency>

在代码中加入

        Logger.getLogger("org").setLevel(Level.ERROR);

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

皮皮虾的倔强

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Spark 通过 spark-submit 设置日志级别

主要分享大数据相关的知识，如Spark、Hudi

11-16

1万+

Spark有多种方式设置日志级别，这次主要记录一下如何在spark-submit设置Spark的日志级别。1、如果在自己的测试集群上，直接修改$SPARK_HOME/conf下的log4j.properties即可2、如果在Eclipse里，将log4j.properties放在项目的src/main/resources即可3、如果在生产环境的集群，又不允许修改配置文件的话，用上面讲的spark-submit --conf 即可。...

Spark 3 设置日志级别详解

ByteHackerX的博客

08-31

659

在上面的示例中，我们将根日志级别设置为 INFO，这意味着只会输出 INFO 级别及以上的日志信息。例如，我们将 Apache Spark 包的日志级别设置为 DEBUG，这意味着会输出 DEBUG 级别及以上的日志信息。通过适当设置日志级别，我们可以控制 Spark 应用程序输出的日志信息的详细程度。通过以上两种方法之一，我们可以在 Spark 3 中设置日志级别。请注意，以上示例是使用 Scala 编程语言编写的，但类似的方法也适用于其他支持 Spark 的编程语言，如 Java 和 Python。

1 条评论您还未登录，请先登录后发表或查看评论

Spark 设置日志级别

houzhizhen的专栏

02-23

731

查看是否有文件 ${SPARK_HOME}/conf/log4j2.properties，如果没有，则执行以下创建 log4j2 配置文件。

Spark缓存

热门推荐

啊策策大数据社区

07-21

1万+

1. Spark设置日志级别 前言 Spark有多种方式设置日志级别,这次主要记录一下如何在Spark-submit设置Spark日志级别,本文介绍三种方式需求因为Spark的日志级别默认为INFO(log4j.rootCategory=INFO, console),这样在运行程序的时候有很多我不需要的日志信息都打印出来了，看起来比较乱，比较烦，抓不住重点，而我只想把warn和error打印...

Spark通过修改日志文件信息显示级别来避免其他信息的干扰

哇咔咔哇咔的博客

03-23

720

Spark修改日志信息级别

spark设置日志级别的4种方式

炼数成器

10-31

6328

建立用户画像首先需要建立数据仓库，用于存储用户标签数据。Hive是基于Hadoop的数据仓库工具，依赖于HDFS存储数据，提供的SQL语言可以查询存储在HDFS中的数据。开发时一般使用Hive作为数据仓库，存储标签和用户特征库等相关数据。 “数据仓库之父” W.H.Inmon 在《Building the Data Warehouse》一书中定义数据仓库是“一个面向主题的、集成的、非易失的、随时间变化的、用来支持管理人员决策的数据集合”。面向主题：业务数据库中的数据主要针对事务处理...

Spark设置日志级别

jiangnianwangluo的博客

04-12

667

【代码】Spark设置日志级别。

修改Spark-shell日志打印级别并使用Spark-shell和Spark-submit提交Sparkstream程序

zhaoguowei的博客

11-20

1792

1. 修改Spark-shell日志打印级别如果觉得 shell 中输出的日志信息过多而使人分心，可以调整日志的级别来控制输出的信息量。你需要在 conf 目录下创建一个名为 log4j.properties 的文件来管理日志设置。Spark开发者们已经在 Spark 中加入了一个日志设置文件的模版，叫作 log4j.properties.template。要让日志看起来不那么啰嗦，可以先把这...

Spark on Yarn 自定义日志打印及级别

T_Janey

09-16

3211

Spark on Yarn自定义日志输出及级别spark 自定义日志打印及级别日志打印定义 spark 自定义日志打印及级别在处理spark任务的时候，我们需要经常查看日志，那么日志的级别对我们来说就很重要。但有时候，我们还需要输出一些业务日志，那它就会被spark的大量日志给覆盖掉，但调日志级别，又会使查找问题变的比较困难，今天，我们来解决下这个问题。日志打印定义我们首先需要日志配置文件，并在任务提交的脚本中设置成我们自定义的日志文件。这里将分别对两种日志进行配置对比，分别是java自带日志和spa

spark6. 如何设置spark 日志

笔生花的博客

09-13

1830

本文只讲解再yarn 模式下的日志配置。

spark编程09——设置spark-submit提交程序时不在控制台打印日志信息+nohup 命令

SYITwin的博客

04-08

3950

在用spark-submit提交程序时，会打印很多类似图片所示的日志信息，它们会把想要的结果给淹没，所以要想法去除控制台的日志信息。解决办法：程序中设置日志级别，然后将运行结果保存在nohup.out文件中 //程序中导入 import org.apache.log4j.{Level, Logger} //下面两行代码放在main函数里 Logger.getLogger("org.apache.spark").setLevel(Level.WARN) Logger.getLogge..

Spark日志，及设置日志输出级别

爱是与世界平行

08-14

5181

import org.apache.log4j.{ Level, Logger } Logger.getLogger("org").setLevel(Level.WARN) Logger.getLogger("org.apache.spark").setLevel(Level.WARN) Logger.getLogger("org.eclipse.jetty.server").setLeve...

修改Spark的日志级别

谦卑t

01-08

1059

7、修改Spark的日志级别 7.1、永久修改从我们运行的 spark 程序运行的情况来看，可以看到大量的 INFO 级别的日志信息。淹没了我们需要运行输出结果。可以通过修改 Spark 配置文件来 Spark 日志级别。以下是详细步骤：第一步：先进入 conf 目录 [hadoop@hadoop05 conf]$ cd $SPARK_HOME/conf 第二步...

Spark 日志配置

半路出家，立地为猿

12-28

2508

在使用spark 环境开发时，有时为了方便，需要pyspark环境下执行一些代码，但默认的日志级别是INFO, 这样会输出超级多的日志，界面一几乎是一直在刷屏状态。可以调一下日志的输出级别。一、修改日志配置在$SPARK_HOME/conf 下找到 log4j.properties.template，复制一份到新文件log4j.properties 可直接修改文件名称为log4j.pr

Spark应用日志级别设置

weixin_30555753的博客

11-16

133

一. 日志效率原因开发时，控制台输出一大堆日志信息，严重影响查看日志效率。从控制台输出日志我们可以看出，应用程序是默认加载Spark-core包下面的log4j-defaults.properties日志文件。查看log4j-defaults.properties文件由上图可知，Spark-core包设置默认的日志级别为info，所以我们才看到一大堆日志信息。那...

spark-client模式下，设置spark的日志级别

搬砖の隔壁老王

06-06

2442

# Set everything to be logged to the console log4j.rootCategory=WARN,console log4j.appender.console=org.apache.log4j.ConsoleAppender log4j.appender.console.target=System.err log4j.appender.console.layout=org.apache.log4j.PatternLayout log4j.appender.consol

spark-sql 控制台修改日志级别

qingumeng4466的博客

01-22

5062

spark-sql 控制台修改日志级别这个我找了好久的解决方法修改文件 conf/log4j.properties # Set everything to be logged to the console log4j.rootCategory=WARN, console log4j.appender.console=org.apache.log4j.ConsoleAppender

Spark2.3.1在Idea控制台调整日志等级

weixin_34320724的博客

10-09

1109

Spark2.3.1在Idea控制台输出 Spark2.3.1在Idea 控制台输出时默认会打印INFO级别日志信息，在调试代码时会觉得日志太多，需要有方法调整输出的日志级别，只输出关注的日志即可调整控制台日志输出级别 import org.apache.log4j.{Level, Logger} # 所有org包名只输出ERROR...

idea 中运行spark 控制台日志信息太多，如何配置减少打印在日志台上

03-20

<think>好的，我现在要解决的问题是用户询问如何在IntelliJ IDEA中配置Spark以减少控制台日志输出。首先，我需要回忆一下Spark和日志相关的配置知识。记得Spark使用Log4j来管理日志，所以调整日志级别应该和Log4j的配置文件有关。接下来，我需要考虑在IntelliJ IDEA中运行Spark应用时，如何加载Log4j的配置文件。通常，用户可能需要在项目的资源目录下放置log4j.properties文件，这样Spark会自动读取这个配置。但有时候如果配置不正确，或者有其他依赖的库覆盖了日志设置，可能会导致日志级别没有生效。这时候可能需要检查配置文件的位置是否正确，比如是否放在src/main/resources目录下。另外，用户可能直接在代码中设置日志级别，例如通过sparkContext.setLogLevel("WARN")，这种方法是否有效呢？记得SparkContext确实提供了这个方法，但可能只控制Spark自身的日志，不影响其他库的日志输出。这时候可能需要结合配置文件一起调整。然后，用户提到的是在IntelliJ IDEA中配置，所以还需要考虑运行配置是否有参数需要添加。例如，是否需要在VM options里指定-Dlog4j.configuration=file:path/to/log4j.properties，这样明确指定配置文件的位置。还要注意，不同的Spark版本可能使用不同的Log4j版本，比如Spark 2.x使用Log4j 1.x，而Spark 3.x可能升级到Log4j 2.x，这时候配置文件的格式可能有所不同，需要用户根据版本调整配置内容。另外，用户可能希望减少的是控制台的日志输出，所以需要确保在log4j.properties中正确配置了控制台Appender的阈值，比如将log4j.appender.console.threshold设置为WARN或ERROR级别。最后，可能需要指导用户测试配置是否生效，例如运行应用后观察控制台输出是否减少，或者是否有错误提示，帮助用户排查问题，比如文件路径是否正确，配置语法是否正确等。</think>在IntelliJ IDEA中配置Spark控制台日志输出级别可通过以下四个步骤实现： ### 一、添加log4j.properties配置文件 1. 在项目`src/main/resources`目录下新建`log4j.properties`文件 2. 写入以下配置内容： ```properties # 设置根日志级别为WARN log4j.rootCategory=WARN, console # 控制台输出配置 log4j.appender.console=org.apache.log4j.ConsoleAppender log4j.appender.console.target=System.err log4j.appender.console.layout=org.apache.log4j.PatternLayout log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n # 单独设置Spark核心模块日志级别 log4j.logger.org.apache.spark=WARN log4j.logger.org.eclipse.jetty=WARN ``` 该配置将全局日志级别设为WARN，并单独指定Spark核心模块的日志级别[^3] ### 二、代码中动态设置日志级别 ```scala val conf = new SparkConf().setAppName("MyApp") val sc = new SparkContext(conf) sc.setLogLevel("WARN") // 设置SparkContext日志级别 ``` ### 三、IDEA运行配置调整 1. 打开Run/Debug Configurations 2. 在VM options中添加： ``` -Dlog4j.configuration=file:src/main/resources/log4j.properties ``` 确保路径与项目结构匹配[^4] ### 四、验证配置运行Spark作业后，控制台应仅显示WARN及以上级别的日志。可通过以下命令测试： ```scala sc.parallelize(1 to 10).foreach(println) // 正常操作应不产生INFO日志 ``` **注意事项**： 1. Spark 3.0+使用log4j2，需使用`log4j2.properties`配置文件 2. 集群部署时需确保所有节点都有相同配置文件 3. 可单独调整特定包日志级别，如： ```properties log4j.logger.org.apache.spark.sql.execution=ERROR ```

Spark设置日志打印级别

一、修改Spark-core包默认的日志级别

二、在Spark程序中设置日志打印级别：

三、 在maven项目中设置Spark程序的日志打印级别：

三、在maven项目中设置Spark程序的日志打印级别：