HDFS简单操作与sqoop建表操作

本文详细介绍了HDFS文件系统的基本操作,包括目录查看、文件读取及行数统计。同时,提供了使用Flume实时日志收集系统监控日志的方法,并展示了如何通过sqoop工具实现HDFS数据与PostgreSQL数据库之间的同步。此外,还涵盖了FTP基本操作及参数设置,为数据工程师提供全面的数据处理流程指导。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HDFS操作

目录

sudo -u hdfs hdfs dfs -ls -h /flume_xdr

条数

sudo -u hdfs hdfs dfs -cat /flume_xdr/* | wc -l

数据

hdfs dfs -cat /flume_5min/2018-10-30/15/5min_20181030_16.1540886400001.csv |head -n 100

 

flume接数

tail -F /etc/flume-ng/conf/nohup.out

yarn logs -applicationId application_1540954664082_0090

 

sqoop建表

sqoop list-databases --connect jdbc:postgresql://172.22.13.222:5432/ --username postgres

sqoop list-tables --connect jdbc:postgresql://172.22.13.222:5432/postgres --username postgres

sqoop export --connect "jdbc:postgresql://172.22.13.222:5432/postgres?useUnicode=true&characterEncoding=utf-8" --username postgres  \

--table xdr_table_102223 -m 3 --export-dir /data --update-mode allowinsert --input-fields-terminated-by ',' --input-null-string "\\\\N" --input-null-non-string "\\\\N" 

 

ftp操作

ftp localhost

输入账号密码

cd

ls

get

put

 

参考:

https://blog.youkuaiyun.com/sunshingheavy/article/details/53227581

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值