启动hadoop

Hdfs上创建文件夹
创建的文件夹是datainput

上传文件至hdfs

启动Hive

创建原始文档表

导入文件内容到表docs并查看

用HQL进行词频统计,结果放在表word_count里

查看统计结果

本文介绍如何在Hadoop中创建目录并上传文件,接着通过Hive进行数据表搭建及数据导入,最后利用HQL完成词频统计任务。
启动hadoop

Hdfs上创建文件夹
创建的文件夹是datainput

上传文件至hdfs

启动Hive

创建原始文档表

导入文件内容到表docs并查看

用HQL进行词频统计,结果放在表word_count里

查看统计结果

转载于:https://www.cnblogs.com/hkvbm/p/9052890.html
3964
1315
542
931

被折叠的 条评论
为什么被折叠?