1、环境安装:使用cmd安装hdfs环境,pip install hdfs
2、访问hdfs:
from hdfs.client import Client
HDFSHOST = "http://192.168.56.101:9870"
client = Client(HDFSHOST)
# 返回目录下的文件
#print(client.list('/wm/'))
# 创建目录
#client.makedirs('/tmp')
#print(client.list('/'))
# 删除hdfs文件
#print(client.delete('/wm/start-dfs.sh'))
#print(client.list('/wm'))
# 上传文件到hdfs(需要将集群所有节点配置到hosts
#client.upload('/tmp','D:\\2.txt',cleanup=True)
#print(client.list('/tmp'))
# 追加数据到hdfs文件,小于3副本需要修改配置文件
#client.write('/tmp/2.txt', 'sssddss', overwrite=False, append=True, encoding='utf-8')
# 覆盖数据写到hdfs文件
#client.write('/tmp/1.txt', 'fugai', overwrite=True, append=False, encoding='utf-8')
# 移动或者修改文件
#cli