Java编程在大数据应用中的实践与工具使用
1. Hadoop操作基础
在大数据处理中,Hadoop是一款强大的开源软件。以下是一些基础的Hadoop操作:
- 查看文件内容 :若不想打开 license-out.txt/part-r-00000 文件,可使用 $cat ~/license-out.txt/part-r-00000 命令显示其内容。
- 删除非空目录 :使用 $hdfs dfs -rm -r /license-out.txt 命令删除包含非空文件的目录。
- 通过浏览器查看Hadoop :可通过以下网址在浏览器中查看Hadoop及其应用集群:
- http://node1:50070
- http://node1:8088
2. 扩展Hadoop集群
要向Hadoop集群添加第二个节点 node2 ,可按以下步骤操作:
1. 获取另一个树莓派(理想情况下与 node1 相同)。
2. 使用Win32 Disk Imager克隆 node1 的树莓派SD卡到 node2 ,下载地址为: https://sourceforge.net/projects/win32diskimager/files/late
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



