Hadoop 数据分析:Impala 与 Apache Hive 实战
在大数据分析领域,Hadoop 生态系统中的 Cloudera Impala 和 Apache Hive 是两个强大的工具。它们提供了 SQL 类型的语言,让用户可以方便地操作和分析存储在 Hadoop 中的数据。下面将详细介绍如何使用 Impala 和 Hive 进行数据库和表的创建、数据查询以及用户自定义函数(UDF)的创建。
1. Cloudera Impala SQL 操作
1.1 数据库创建
在 Impala 中,可以使用 CREATE DATABASE 命令创建数据库。例如,在 Hue 的 Impala 查询编辑器中输入以下命令创建 fuel 数据库:
CREATE DATABASE fuel ;
点击执行按钮后,在 Hue 的 Impala 用户界面的数据库下拉菜单中会出现新选项 fuel 。若要在 SQL 脚本中使用该数据库,可使用 USE 选项:
USE fuel ;
也可以在表名前指定数据库名,如:
SELECT * FROM fuel.customer ;
超级会员免费看
订阅专栏 解锁全文
1198

被折叠的 条评论
为什么被折叠?



