No LZO codec found, cannot run.解决方案参考。

最新推荐文章于 2023-10-22 22:41:30 发布

原创

最新推荐文章于 2023-10-22 22:41:30 发布 · 1.4k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#hive #hadoop #大数据 #spark

在使用Hive on Spark时遇到""No LZO codec found, cannot run.""错误。排查过程包括：检查hadoop-lzo.jar的兼容性，确认Hive与Spark版本匹配并重新编译，配置Hive和Spark的环境，重装CentOS上的lzo，最后发现是Spark未找到LZO解析器，将hadoop-lzo-0.4.20.jar上传到HDFS解决问题。" 109326024,1341894,Oracle数据库优化：34个提高SQL执行效率的技巧,"['数据库', 'SQL']

问题：使用hive on spark，创建lzo存储格式的表格，查询数据的时候，报错：No LZO codec found, cannot run。
解决和排错过程：

1.百度`No LZO codec found, cannot run`，搜索结果分为以下三种原因：

1). hadoop-lzo.jar包的兼容性问题
首先确定我的框架版本：
在这里插入图片描述
（1）.官方下载的lzo-master是一个maven项目，解压之后，修改pom文件中

<hadoop.current.version>2.6.0</hadoop.current.version> #这里修改成对应的hadoop版本号

（2）.官网下载的Hive3.1.2和Spark3.0.0默认是不兼容的。因为Hive3.1.2支持的Spark版本是2.4.5，所以需要我们重新编译Hive3.1.2版本。

编译步骤：官网下载Hive3.1.2源码，修改pom文件中引用的Spark版本为3.0.0，如果编译通过，直接打包获取jar包。如果报错，就根据提示，修改相关方法，直到不报错，打包获取jar包。
百度都有
我使用的这些编译好的包会在后面贴出来

我使用的是hadoop-lzo-0.4.20.jar。
2). $HADOOP_HOME/etc/hadoop/core-site.xml的配置问题。

$ vim $HADOOP_HOME/etc/hadoop/core-site
------------添加-----------
<proper

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

GOD-LEI

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hadoop使用lzo压缩文件笔记

wenyusuran的专栏

05-15

1691

LZO性能编译LZO 下载： http://www.oberhumer.com/opensource/lzo/download/ wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.06.tar.gz 安装： tar -zxf lzo-2.06.

presto本地开发，访问Hive报错：Unable to create input format org.apache.hadoop.mapred.TextInputFormat

lucyLee的博客

04-22

4474

1. 序言出于工作需要，使用mac + IntelliJ IDEA，搭建了一个可以访问Hive的本地开发环境执行查询时报错： Query 20220422_084012_00000_34axr failed: Unable to create input format org.apache.hadoop.mapred.TextInputFormat 查看日志，具体的报错信息如下： com.facebook.presto.spi.PrestoException: Unable to crea

参与评论您还未登录，请先登录后发表或查看评论

No LZO codec found, cannot run.

weixin_44765495的博客

07-05

1059

直接Hive启动执行select语句无异常，但使用JDBC方式连接Hiveserver2报如下错误 0: jdbc:hive2://hadoop102:10000> select * from ods_start_log limit 10; Error: java.io.IOException: java.io.IOException: No LZO codec found, cannot run. (state=,code=0 尝试方法：首先将hadoop-lzo-0.4.20.jar 放入Ha

hive解析lzo文件失败,No LZO codec found, cannot run

11-21

2094

Hive创建外部表，指向lzo格式文件时，无法解析出数据，报错如下： java.io.IOException: No LZO codec found, cannot run. hiveserver2日志报错如下： Diagnostic Messages for this Task:Error: java.io.IOException: java.lang.reflect.Invocatio...

Hive on Spark环境搭建（解决Hive3.1.2和Spark3.0.x版本冲突）

loftiest的博客

06-21

9581

使用Hive做元数据存储和HQL解析，Spark做实际计算。（Hive on Spark）Hive 使用3.1.2版本，Spark 使用3.0.3版本。由于Hive 3.1.2 和 Spark 3.0.3不兼容，需要修改Hive中关于Spark的源码和依赖引用。下载Hive 3.1.2源码，上传并解压 apache-hive-3.1.2-src.tar.gz下载Linux版IDEA，安装到带有桌面的Linux上。（使用root操作IDEA，bin/idea.sh打开idea）用idea打开apach

解决ModuleNotFoundError: No module named ‘codecs‘

牛肉胡辣汤

10-22

973

本篇文章介绍了该错误的背景和解决方法，包括升级Python版本、检查Python标准库、检查环境变量和Python安装路径，以及使用虚拟环境。根据具体的情况，可以选择适合的解决方法来修复此错误。通过创建一个独立的虚拟环境，并在其中安装所需的Python依赖包和模块，可以避免与系统环境冲突。模块是Python中用于字符编码和解码的模块，提供了对编码和解码的各种操作。在一些特殊的系统环境下，可能会存在环境变量或Python安装路径的问题导致无法正确导入。错误通常是由于Python标准库中的。

sparksql查询hive表报错：codec com.hadoop.compression.lzo.LzoCodec not found 问题探究

Interest1_wyt的博客

05-23

1567

Caused by: java.lang.ClassNotFoundException: Class com.hadoop.compression.lzo.LzoCodec 问题探究

【Hadoop/Hbase】centos上安装并设置Snappy/LZO压缩方式

zwan0518的专栏

07-30

8599

在hadoop和hbase文件传输可以在压缩之后在进行传输，这样就可以在传输的时候减少传输数据，增大I/O和带宽效率。在hadoop中主要提供了三种压缩方式Gzip、LZO、Snappy三种数据压缩。后面两种需要额外的配置和安装依赖。但是，在hadoop中默认都已经实现接口。

pyspark不支持lzo压缩

qq_43662627的博客

09-11

281

pyspark的需要hadoop的支持，具体原理也不是很懂，就是很离谱，由于我的pyspark是直接安转在conda的环境上的，昨晚想跑一个文件，抛出一个pyspark无法找到lzo压缩的异常，最后把lzo压缩删除，找到hadoop的core-site.xml把lzo配置注释掉重新启动集群，问题解决。解决不了问题，把提出问题的人解决掉，快乐就是这么简单。注释掉这些 <property> <name>io.compression.codecs</name&

windbg查看模块中的方法时报错no code found

ma_de_hao_mei_le的博客

08-05

766

如果需要debug，那么就需要使用windbg的启动调试功能，这个我还没研究，以后再更新。这时候直接使用ida去反编译该方法所在的模块文件，静态看就行了。可能的原因是这块内存被交换到硬盘里去了，尝试使用。另一种可能就跟你查看的这个方法本身有关系。命令将该地址所在内存页交换回来。......

基于CDH5集群配置snappy压缩

Ganymede的Hadoop世界

11-04

2733

基于CDH5集群配置snappy压缩

hive on spark报错:没有发现类

小北大数据

06-06

1318

Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create Spark client for Spark session 7abab179-b49d-4ed0-b45b-0ef1dfb3f52b)' FAILED: Execution Error, return code 30041 from org.apache.hadoop.hive.ql.

hive3.1.4源码编译兼容spark3.0.0 hive on spark hadoop3.x修改源码依赖步骤详细

weixin_52918377的博客

05-21

7770

hive编译自从CDH宣布收费之后，公司决定使用开源的组件，对现有的大数据集群进行替换。使用hive3.1.2和spark3.0.0配置hive on spark的时候，发现官方下载的hive3.1.2和spark3.0.0不兼容，hive3.1.2对应的版本是spark2.3.0，而spark3.0.0对应的hadoop版本是hadoop2.6或hadoop2.7。所以，如果想要使用高版本的hive和hadoop，我们要重新编译hive，兼容spark3.0.0。目前，有关hive3.1.2编译的

【原创】大叔经验分享（35）lzo格式支持

weixin_30244681的博客

02-26

244

建表语句 CREATE EXTERNAL TABLE `my_lzo_table`(`something` string)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS INPUTFORMAT 'com.hadoop.mapred.DeprecatedLzoTextInputFormat' OUTPUTFORMAT ...

Hive报错java.lang.NoClassDefFoundError: org/codehaus/jackson/JsonFactory

maozhuxigood

08-25

287

一问题 Hive报错java.lang.NoClassDefFoundError:org/codehaus/jackson/JsonFactory 二原因 Hadoop版本是0.20.2.$HADOOP_HOME/lib中不包含 jackson-core-asl-1.8.8.jar jackson-jaxrs-1.8.8.jar jackson-...

linux修改IP后重启起不来,Linux的ubuntu系统，我修改了ip，之后系统起不来了，求指导...

weixin_31165655的博客

05-08

1210

用sudovi/etc/network/interfaces这个命令修改的ip地址什么的输完这个命令后，还出现了一些东西，下面有一行提示什么什么按E键，什么什么按别的什么键的忘了按的哪个了，但是出来了修改ip的东西，我就修改了，之后保存并重启机器，机器就启动不了了，提示最后信息大致是这样的：fromutil-linux-ng2.17.2:network-interface(etho)...

大数据实战第十五课（下）-Spark-Core03

zhikanjiani的博客

08-19

416

Hadoop上启动spark on yarn：不做任何修改直接配置启动： spark-shell --master yarn 报错信息如下提示： Exception in thread "main" org.apache.spark.SparkException: When running with master 'yarn' either HADOOP_CONF_DIR or YARN_CON...

华硕主板10系列显卡 ubuntu 系统安装后无法正常进入解决方案

CaptainHailong的博客

03-27

6592

有一系列主板安装10系列显卡后，再安装ubuntu 系统时，会遇到snd_hda_intel 0000:00:1f.3: failed to add i915_bpocomponent master (-19)这样的问题，系统装完后便无法进入系统。解决方案如下：1.关机重启，当出现这个界面时，按e编辑开机指令的模式，找到 quite splash 并在后面加上对应的 nomodeset如下图注意，...

hadoop.compression.lzo.LzoCodec not found问题发现及解决

qq_47932841的博客

09-23

5600

问题描述： spark.SparkContext: Created broadcast 0 from textFile at WordCount.scala:37 Exception in thread "main" java.lang.RuntimeException: Error in configuring object ......... //往下N多行 Caused by: java.lang.ClassNotFoundException: Class com.hadoop.compression

java.lang.IllegalArgumentException: Compression codec com.hadoop.compression.lzo.LzoCodec not found.

06-09

具体的解决方法可以参考以下步骤： 1. 确认你的项目中是否已经添加了 LZO 压缩算法的依赖库，如果没有则需要添加。 2. 如果你的项目中已经添加了 LZO 压缩算法的依赖库，但是仍然出现这个异常，那么可能是因为依赖...

No LZO codec found, cannot run.解决方案参考。

1.百度No LZO codec found, cannot run，搜索结果分为以下三种原因：

1.百度`No LZO codec found, cannot run`，搜索结果分为以下三种原因：