Python对Hadoop数据进行读写

首先需要借用第三方库pyhdfs

创建一个Hadoop连接对象

hdfs_client = pyhdfs.HdfsClient(hdfs_ip,hdfs_port,hdfs_user)。

hdfs_ip:ip地址;hdfs_port:端口;hdfs_user:用户名

还需要知道文件路径,比如:/hdoopTest/orderTest/xx.txt。

查看文件时使用的方法:

hdfs_client.listdir(‘/hdoopTest/orderTest’)

将文件拉到本地:

hdfs.client.copy_to_local('/hdoopTest/orderTest/xx.txt','/local_path/xx.txt')

将本地文件上传到Hadoop:

hdfs.client.copy_from_local('/local_path/2xx.txt','/hdoopTest/orderTest/xx.txt')

从Hadoop中读取数据

  1. with hdfs.client.open(file)as f:

  2. data_list = f.readlines( )

  3. for data in data_list:

  4. print(data.decode())

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值