6、hadoop上命令行查看lzo、gz、bz文件

最新推荐文章于 2024-06-05 14:41:12 发布

原创最新推荐文章于 2024-06-05 14:41:12 发布 · 3.1k 阅读

9 ·

CC 4.0 BY-SA版权

大数据专栏收录该内容

10 篇文章

订阅专栏

hadoop上命令行查看lzo、gz、bz文件

发表于 2019-03-25 | 分类于 hadoop | | 游览 806

hadoop上命令行查看lzo、gz、bz文件

HDFS上的文件可能是压缩的，所以用cat不能直接查看。hadoop上默认支持lzo、gz、bz2、snappy压缩格式。

我们用命令行查看HDFS上压缩文件，也是可以的。

lzo文件

查看 HDFS 上 lzo 文件的命令

hadoop fs -cat /Data/Logs/2018-08-22/2018-08-22_log.lzo | lzop -dc | head -1

或

hadoop fs -cat /Data/Logs/2018-08-22/2018-08-22_log.lzo | lzop -dc | head -1     lzop 会接受输入流然后解压输出流给head显示第一行

gzip 文件

查看 HDFS 上 gzip 文件的命令

hadoop fs -cat /shining/temp.txt.gz | gzip -d 

或

hadoop fs -cat /shining/temp.txt.gz | zcat

bz2 文件

查看 HDFS 上 bz2 文件的命令

1	hadoop fs -cat /temp/b.bz2 \| bzip2 -d

text 命令

Hadoop text 命令可以查看HDFS上的文本、压缩文件

hadoop fs -text /temp/b.bz2

hadoop fs -text /temp/test_hive.txt.gz

hadoop fs -text /temp/l.lzo

hadoop fs -text /tmp/out1/part-r-00000

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

java___boy

关注关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hadoop 命令查看文件前几行

杨鑫newlife的专栏

05-22

1万+

hdfs dfs -text /data/xxx2018050208-1525219204138-192.168.30.20-4-0.gz | head -5

lzo压缩格式文件查看

weixin_34343689的博客

11-17

604

使用lzop命令解压并查看：lzop -cd xxx.lzo |more 附压缩命令：lzop xxx.log （生成xxx.log.lzo）其它参数： # lzop -v test # 创建test.lzo压缩文件，输出详细信息，保留test文件不变 # lzop -Uv test # 创建test.lzo压缩文件，输出详细信息，删除test文件 # lzop -t t...

参与评论您还未登录，请先登录后发表或查看评论

查看HDFS中LZO压缩文件内容的脚本

践行者John的专栏

11-29

5103

最近常常需要查看LZO文件里面的内容，这些文件通常很大，放在hdfs上。我没有好的方法，我以前偶尔查看其中内容都是直接get到本地然后用lzop解压缩然后再more的。这样做当你偶尔使用的时候即使文件稍微大点，也许也是可以接受的。但现在我需要常常grep里面的内容，就不那么欢乐了。所以写了个shell脚本lzoc[ lzo cat]，用来专门查看ＨＤＦＳ里ＬＺＯ文件的内容，正常情况下它不输出任

hadoop, lzo文件怎么查看

Little SunShine

03-07

793

其中，filename.lzo是要解压缩的LZO文件名。解压缩后，可以使用常规的文本查看工具，如cat、less等来查看文件内容。LZO是一种压缩算法，Hadoop支持LZO格式的文件。如果要查看LZO格式的文件内容，需要先解压缩。该命令将会把LZO文件中的内容解压缩并以文本格式输出。

linux下查看lzo格式压缩文件的内容

weixin_52918377的博客

07-01

687

linux下查看lzo格式压缩文件的内容 1.安装lzop 使用yum安装命令：yum install lzop [root@cm bin]# yum install lzop Loaded plugins: fastestmirror, security Setting up Install Process Determining fastest mirrors epel/metalink

Hadoop FS Shell 操作命令

weiliang_Handan的博客

05-28

614

Hadoop FS Shell 操作命令catchgrpchmodchowncopyFromLocalcopyToLocalcpdudusgetgetmergelslsrmkdirmoveFromLocalmvputrmrmrsetrepstattailtesttexttouchz Hadoop FS Shell 常见命令使用格式： hadoop fs <arg> 所有的 FS shell 命令使用 URI 路径作为参数，URI格式是 scheme://authority/path。

hadoop之文件压缩格式对比分析以及配置实现

君永夜

04-16

1598

文章目录1.大数据常见的压缩格式2.压缩使用场景2.1如何判定是否使用压缩？2.2压缩在ETL作业生命周期在使用场景3.MR文件压缩配置实现3.1 确保hadoop支持压缩3.2修改hadoop配置文件4.hive文件压缩配置实现4.1 原测试数据大小4.2文件不压缩4.2文件采用bzip2压缩4.3文件采用压缩gzip压缩 1.大数据常见的压缩格式压缩分为有损和无损两大类，生产中的压缩技术一定...

05 Hadoop简单使用

最新发布

BIN_2011464841的博客

06-05

2498

主要讲到了hadoop2.x和hadoop3.x变化，HDFS常用命令，Java操作HDFS，MapReduce，压缩和yarn常用命令。

hive笔记（九）：压缩和存储-Hadoop压缩配置/map、reduce输出阶段压缩/文件存储格式/textfile、parquet、orc

qq_55906442的博客

09-12

707

Hadoop的编码/解码器压缩性能的比较注：Snappy的压缩速度和解压速度都非常快。开启map输出阶段压缩可以减job中map和Reduce task间数据传输量。当Hive将输出写入到表中时，输出内容可以进行压缩，属性hive.exec.compress.output控制着这个功能。用户保持默认设置中的默认值false，输出的就是非压缩的纯文本文件。用户可以通过在查询语句或执行脚本中设置这个值为true来开启输出结果压缩功能。

【Hadoop存储革命】：LZO压缩技术对比分析与选择指南

[【Hadoop存储革命】：LZO压缩技术对比分析与选择指南](https://d3i71xaburhd42.cloudfront.net/ad97538dca2cfa64c4aa7c87e861bf39ab6edbfc/4-Figure1-1.png) # 1. 数据存储的挑战与Hadoop生态数据存储领域正面临...

linux查看hadoop文件,查看Hadoop里的LZO文件的内容

weixin_39920415的博客

04-29

823

Hadoop常见操作命令行总结

weixin_42619750的博客

09-14

504

Hadoop常见操作命令行的总结，内容如下：查看hdfs文件系统的根目录上有哪些文件 cd /usr/hadoop/hadoop……. (进入安装目录) bin/hadoop fs -ls hdfs://h101:9000/ 在/usr下创建hadoop目录 bin/hadoop fs mkdir hdfs://h101:9000/usr/hadoop 将文件上传到集群 bin...

hadoop统计文件行数

iphone4grf的博客

06-08

7033

hadoop统计文件行数，特定字符串个数等。

hadoop上命令行查看lzo、gz、bz文件

m0_67391521的博客

04-18

2174

hadoop上命令行查看lzo、gz、bz文件 HDFS上的文件可能是压缩的，所以用cat不能直接查看。hadoop上默认支持lzo、gz、bz2、snappy压缩格式。我们用命令行查看HDFS上压缩文件，也是可以的。查看 HDFS 上 lzo 文件的命令博客已经迁移到github上，请访问：https://sukbeta.github.io/hadoop-lzo-gz-bz2 ...

浅谈Hadoop的压缩格式之LZO

边看边学

11-14

1485

大数据环境下，在HDFS文件系统中存储数据，对数据进行压缩是十分有必要的。压缩数据可以使集群能够存储更多数据，减少磁盘IO，加快任务处理速度。但是，在hadoop上使用压缩也有两个比较麻烦的地方：第一，有些压缩格式不能被分块，并行的处理，比如gzip。第二，另外的一些压缩格式虽然支持分块处理，但是解压缩...

hadoop文件系统查看gz压缩的文件内容

iiiitttttt的博客

05-02

2881

查看gz文件命令 hadoop fs -cat /xxxx/xxx.gz | gzip -d 或 hadoop fs -cat /xxxx/xxx.gz | zcat

查看hdfs上文件内容，统计数据量

zhengzaifeidelushang的博客

05-24

2652

查看hdfs上文件内容，统计数据量一、查看hdfs上文件内容二、统计数据量一、查看hdfs上文件内容 hadoop fs -cat /optics-prod/raw/kafka/order_middle_prod/order_cancel/1h/20220524/08/* | gunzip -c 二、统计数据量 hadoop fs -cat /optics-prod/raw/kafka/order_middle_prod/order_cancel/1h/20220524/08/* | gunzip -c

Hadoop3.1.3兼容版本lzo压缩库hadoop-lzo-0.4.20.jar介绍

lzop是一个用于LZO压缩的命令行工具，提供了压缩和解压文件的功能，使用起来非常方便，但它并不是一个运行在Hadoop生态系统内部的组件，而是运行在操作系统层面上的一个工具。在使用hadoop-lzo时，有一些重要的...